Mojibake

Revisi sejak 27 Juli 2021 01.22 oleh HsfBot (bicara | kontrib) (Bot: menambah {{Authority control}})

Mojibake (文字化け) adalah tampilan dari karakter komputer yang salah dan tidak dapat dibaca ketika perangkat lunak gagal menampilkan teks secara benar sesuai dengan pengkodean karakter untuk karakter tersebut.

Artikel mojibake di Wikipedia bahasa Jepang dalam enkode UTF-8 yang ditampilkan dengan sistem operasi ber-enkode Windows-1252.

Sebagai contoh, teks bahasa Jepang yang dimaksudkan penulisnya untuk dibaca sebagai 文字化け akan ditampilkan salah sebagai "æ–‡å—化け" pada sistem operasi yang hanya disetel untuk menampilkan karakter dalam enkode Windows-1252 atau ISO-8859-1 (umumnya disebut Western).

Arti harfiah mojibake adalah karakter hantu,[1] berasal dari gabungan kata moji (文字) yang berarti karakter, ditambah bake (化け, hantu) bentuk nomina dari verba bakeru (化ける, berubah/mengubah bentuk ke dalam bentuk/penampilan lain).

Sewaktu mengembangkan Aldus PageMaker versi bahasa Jepang, pengembang perangkat lunak bernama Yoshiyuki Kubo menemui kesalahan dalam tampilan karakter yang dijelaskannya sebagai mojibake. Istilah tersebut kemudian melekat dan meluas, dimulai dari kalangan pengembang/pemakai Macintosh.[2]

Penyebab

Mojibake sering disebabkan ketika pengkodean karakter tidak dinyatakan dengan benar di dalam dokumen, atau ketika dokumen dipindahkan dari sistem yang dipasang dengan pengkodean karakter berbeda. Tampilan karakter yang salah terjadi ketika sistem aksara atau pengkodean karakter salah tag atau "asing" untuk sistem komputer pengguna. Bila komputer itu tidak memiliki perangkat lunak yang dibutuhkan untuk memproses karakter bahasa asing, maka komputer tersebut akan mencoba memprosesnya memakai pengkodean karakter yang telah terpasang. Akibatnya, tanda tanya, kotak, atau lambang-lambang aneh ditampilkan di layar. Masalah mojibake juga dapat terjadi pada pesan dalam satu bahasa, tetapi dikirim dengan pengkodean karakter berbeda dari pengkodean karakter komputer penerima. Masalah ini sering dijumpai di antara pengguna komputer berbahasa Jepang yang memiliki sejarah sistem operasi dalam beberapa pengkodean karakter.

Penjelajah web kemungkinan tidak dapat membedakan laman web yang di-enkode dengan EUC-JP dan laman web berikutnya yang di-enkode dengan Shift-JIS, kecuali bila skema pengkodean dinyatakan secara eksplisit dalam HTTP header yang dikirim bersama dokumen, atau dalam meta tag HTML yang dipakai untuk mensubstitusi HTTP header yang hilang bila peladen tidak dikonfigurasi untuk mengirimkan HTTP header yang layak. Metode heuristik dapat diterapkan untuk menerka set karakter, tetapi metode ini tidak selalu berhasil.

Contoh

Pengkodean berkas Pengaturan di penjelajah web Hasil
Contoh bahasa Arab:  
Tampilan di penjelajah web: الإعلان العالمى لحقوق الإنسان
UTF-8 ISO 8859-1 الإعلان العالمى لحقوق الإنسان
KOI8-R О╩©ь╖ы└ь╔ь╧ы└ь╖ы├ ь╖ы└ь╧ь╖ы└ы┘ы┴ ы└ь╜ы┌ы┬ы┌ ь╖ы└ь╔ы├ьЁь╖ы├
ISO 8859-5 яЛПиЇй�иЅиЙй�иЇй� иЇй�иЙиЇй�й�й� й�и­й�й�й� иЇй�иЅй�иГиЇй�
CP 866 я╗┐╪з┘Д╪е╪╣┘Д╪з┘Ж ╪з┘Д╪╣╪з┘Д┘Е┘Й ┘Д╪н┘В┘И┘В ╪з┘Д╪е┘Ж╪│╪з┘Ж
ISO 8859-6 ُ؛؟ظ�ع�ظ�ظ�ع�ظ�ع� ظ�ع�ظ�ظ�ع�ع�ع� ع�ظ­ع�ع�ع� ظ�ع�ظ�ع�ظ�ظ�ع�
ISO 8859-2 ا�ؼؚ�ا� ا�ؚا��� �ح��� ا�ؼ�سا�
Windows-1256 Windows-1252 ÇáÅÚáÇä ÇáÚÇáãì áÍÞæÞ ÇáÅäÓÇä
Contoh bahasa Swedia: Smörgås
Pengkodean berkas Pengaturan di penjelajah web Hasil
MS-DOS 437 ISO 8859-1 Sm”rg†s
ISO 8859-1 Mac Roman SmˆrgÂs
UTF-8 ISO 8859-1 Smörgås
UTF-8 Mac Roman Smörgås
Contoh bahasa Rusia: Кракозябры
Pengkodean berkas Pengaturan di penjelajah web Hasil
MS-DOS 855 ISO 8859-1 Æá ÆÖóÞ¢áñ
KOI8-R ISO 8859-1 ëÒÁËÏÚÑÂÒÙ
UTF-8 KOI8-R п я─п╟п╨п╬п╥я▐п╠я─я▀

Referensi

  1. ^ Paul Hastings (2004-4-13). "ColdFusion: Article, Do You Want Coffee with That Mojibake? Character encodings and CFMX". ColdFusion Developer's Journal. Diarsipkan dari versi asli tanggal 2013-09-12. Diakses tanggal 2012-07-15. 
  2. ^ "漢字トーク V1.0( KanjiTalk 1.0 )". The Vintage Mac Museum. Diarsipkan dari versi asli tanggal 2006-02-24. Diakses tanggal 2012-07-15.  Berikut lampiran email mengenai masalah mojibake.

Pranala luar