Mojibake
Artikel ini membutuhkan rujukan tambahan agar kualitasnya dapat dipastikan. (Juli 2012) |
Mojibake (文字化け ) adalah tampilan dari karakter komputer yang salah dan tidak dapat dibaca ketika perangkat lunak gagal menampilkan teks secara benar sesuai dengan pengkodean karakter untuk karakter tersebut.
Sebagai contoh, teks bahasa Jepang yang dimaksudkan penulisnya untuk dibaca sebagai 文字化け akan ditampilkan salah sebagai "æ–‡å—化ã‘" pada sistem operasi yang hanya disetel untuk menampilkan karakter dalam enkode Windows-1252 atau ISO-8859-1 (umumnya disebut Western).
Arti harfiah mojibake adalah karakter hantu,[1] berasal dari gabungan kata moji (文字 ) yang berarti karakter, ditambah bake (化け , hantu) bentuk nomina dari verba bakeru (化ける , berubah/mengubah bentuk ke dalam bentuk/penampilan lain).
Sewaktu mengembangkan Aldus PageMaker versi bahasa Jepang, pengembang perangkat lunak bernama Yoshiyuki Kubo menemui kesalahan dalam tampilan karakter yang dijelaskannya sebagai mojibake. Istilah tersebut kemudian melekat dan meluas, dimulai dari kalangan pengembang/pemakai Macintosh.[2]
Penyebab
Mojibake sering disebabkan ketika pengkodean karakter tidak dinyatakan dengan benar di dalam dokumen, atau ketika dokumen dipindahkan dari sistem yang dipasang dengan pengkodean karakter berbeda. Tampilan karakter yang salah terjadi ketika sistem aksara atau pengkodean karakter salah tag atau "asing" untuk sistem komputer pengguna. Bila komputer itu tidak memiliki perangkat lunak yang dibutuhkan untuk memproses karakter bahasa asing, maka komputer tersebut akan mencoba memprosesnya memakai pengkodean karakter yang telah terpasang. Akibatnya, tanda tanya, kotak, atau lambang-lambang aneh ditampilkan di layar. Masalah mojibake juga dapat terjadi pada pesan dalam satu bahasa, tetapi dikirim dengan pengkodean karakter berbeda dari pengkodean karakter komputer penerima. Masalah ini sering dijumpai di antara pengguna komputer berbahasa Jepang yang memiliki sejarah sistem operasi dalam beberapa pengkodean karakter.
Penjelajah web kemungkinan tidak dapat membedakan laman web yang di-enkode dengan EUC-JP dan laman web berikutnya yang di-enkode dengan Shift-JIS, kecuali bila skema pengkodean dinyatakan secara eksplisit dalam HTTP header yang dikirim bersama dokumen, atau dalam meta tag HTML yang dipakai untuk mensubstitusi HTTP header yang hilang bila peladen tidak dikonfigurasi untuk mengirimkan HTTP header yang layak. Metode heuristik dapat diterapkan untuk menerka set karakter, tetapi metode ini tidak selalu berhasil.
Contoh
Pengkodean berkas | Pengaturan di penjelajah web | Hasil |
---|---|---|
Contoh bahasa Arab: | ||
Tampilan di penjelajah web: | الإعلان العالمى لحقوق الإنسان | |
UTF-8 | ISO 8859-1 | الإعلان العالمى Ù„Øقوق الإنسان |
KOI8-R | О╩©ь╖ы└ь╔ь╧ы└ь╖ы├ ь╖ы└ь╧ь╖ы└ы┘ы┴ ы└ь╜ы┌ы┬ы┌ ь╖ы└ь╔ы├ьЁь╖ы├ | |
ISO 8859-5 | яЛПиЇй�иЅиЙй�иЇй� иЇй�иЙиЇй�й�й� й�ий�й�й� иЇй�иЅй�иГиЇй� | |
CP 866 | я╗┐╪з┘Д╪е╪╣┘Д╪з┘Ж ╪з┘Д╪╣╪з┘Д┘Е┘Й ┘Д╪н┘В┘И┘В ╪з┘Д╪е┘Ж╪│╪з┘Ж | |
ISO 8859-6 | ُ؛؟ظ�ع�ظ�ظ�ع�ظ�ع� ظ�ع�ظ�ظ�ع�ع�ع� ع�ظع�ع�ع� ظ�ع�ظ�ع�ظ�ظ�ع� | |
ISO 8859-2 | اŮ�ŘĽŘšŮ�اŮ� اŮ�ؚاŮ�Ů�Ů� Ů�ŘŮ�Ů�Ů� اŮ�ŘĽŮ�ساŮ� | |
Windows-1256 | Windows-1252 | ÇáÅÚáÇä ÇáÚÇáãì áÍÞæÞ ÇáÅäÓÇä |
Contoh bahasa Swedia: | Smörgås | |
---|---|---|
Pengkodean berkas | Pengaturan di penjelajah web | Hasil |
MS-DOS 437 | ISO 8859-1 | Sm”rg†s |
ISO 8859-1 | Mac Roman | SmˆrgÂs |
UTF-8 | ISO 8859-1 | Smörgås |
UTF-8 | Mac Roman | Smörgås |
Contoh bahasa Rusia: | Кракозябры | |
---|---|---|
Pengkodean berkas | Pengaturan di penjelajah web | Hasil |
MS-DOS 855 | ISO 8859-1 | Æá ÆÖóÞ¢áñ |
KOI8-R | ISO 8859-1 | ëÒÁËÏÚÑÂÒÙ |
UTF-8 | KOI8-R | п я─п╟п╨п╬п╥я▐п╠я─я▀ |
Referensi
- ^ Paul Hastings (2004-4-13). "ColdFusion: Article, Do You Want Coffee with That Mojibake? Character encodings and CFMX". ColdFusion Developer's Journal. Diakses tanggal 2012-07-15.
- ^ "漢字トーク V1.0( KanjiTalk 1.0 )". The Vintage Mac Museum. Diakses tanggal 2012-07-15. Berikut lampiran email mengenai masalah mojibake.