Mojibake (文字化け) adalah tampilan dari karakter komputer yang salah dan tidak dapat dibaca ketika perangkat lunak gagal menampilkan teks secara benar sesuai dengan pengkodean karakter untuk karakter tersebut.

Artikel mojibake di Wikipedia bahasa Jepang dalam enkode UTF-8 yang ditampilkan dengan sistem operasi ber-enkode Windows-1252.

Sebagai contoh, teks bahasa Jepang yang dimaksudkan penulisnya untuk dibaca sebagai 文字化け akan ditampilkan salah sebagai "æ–‡å—化け" pada sistem operasi yang hanya disetel untuk menampilkan karakter dalam enkode Windows-1252 atau ISO-8859-1 (umumnya disebut Western).

Arti harfiah mojibake adalah karakter hantu,[1] berasal dari gabungan kata moji (文字) yang berarti karakter, ditambah bake (化け, hantu) bentuk nomina dari verba bakeru (化ける, berubah/mengubah bentuk ke dalam bentuk/penampilan lain).

Sewaktu mengembangkan Aldus PageMaker versi bahasa Jepang, pengembang perangkat lunak bernama Yoshiyuki Kubo menemui kesalahan dalam tampilan karakter yang dijelaskannya sebagai mojibake. Istilah tersebut kemudian melekat dan meluas, dimulai dari kalangan pengembang/pemakai Macintosh.[2]

Penyebab

Mojibake sering disebabkan ketika pengkodean karakter tidak dinyatakan dengan benar di dalam dokumen, atau ketika dokumen dipindahkan dari sistem yang dipasang dengan pengkodean karakter berbeda. Tampilan karakter yang salah terjadi ketika sistem aksara atau pengkodean karakter salah tag atau "asing" untuk sistem komputer pengguna. Bila komputer itu tidak memiliki perangkat lunak yang dibutuhkan untuk memproses karakter bahasa asing, maka komputer tersebut akan mencoba memprosesnya memakai pengkodean karakter yang telah terpasang. Akibatnya, tanda tanya, kotak, atau lambang-lambang aneh ditampilkan di layar. Masalah mojibake juga dapat terjadi pada pesan dalam satu bahasa, tetapi dikirim dengan pengkodean karakter berbeda dari pengkodean karakter komputer penerima. Masalah ini sering dijumpai di antara pengguna komputer berbahasa Jepang yang memiliki sejarah sistem operasi dalam beberapa pengkodean karakter.

Penjelajah web kemungkinan tidak dapat membedakan laman web yang di-enkode dengan EUC-JP dan laman web berikutnya yang di-enkode dengan Shift-JIS, kecuali bila skema pengkodean dinyatakan secara eksplisit dalam HTTP header yang dikirim bersama dokumen, atau dalam meta tag HTML yang dipakai untuk mensubstitusi HTTP header yang hilang bila peladen tidak dikonfigurasi untuk mengirimkan HTTP header yang layak. Metode heuristik dapat diterapkan untuk menerka set karakter, tetapi metode ini tidak selalu berhasil.

Contoh

Contoh Mojibake
Teks awal
Byte mentah pengkodean EUC-JP CA B8 BB FA B2 BD A4 B1
Byte hasil penerjemahan cara pengkodean Shift-JIS
Byte hasil penerjemahan cara pengkodean ISO-8859-1 Ê ¸ » ú ² ½ ¤ ±
Byte hasil penerjemahan cara pengkodean GBK

Referensi

  1. ^ Paul Hastings (2004-4-13). "ColdFusion: Article, Do You Want Coffee with That Mojibake? Character encodings and CFMX". ColdFusion Developer's Journal. Diarsipkan dari versi asli tanggal 2013-09-12. Diakses tanggal 2012-07-15. 
  2. ^ "漢字トーク V1.0( KanjiTalk 1.0 )". The Vintage Mac Museum. Diarsipkan dari versi asli tanggal 2006-02-24. Diakses tanggal 2012-07-15.  Berikut lampiran email mengenai masalah mojibake.

Pranala luar