Pengodean karakter atau penyandian huruf (bahasa Inggris: character encoding, character set) terdiri dari sandi atau kode yang memasangkan serangkaian aksara berurutan dari suatu kumpulan dengan sesuatu yang lain, seperti urutan bilangan asli (natural numbers), perlapanan (octet) atau denyut listrik, untuk mempermudah penyimpanan naskah pada komputer dan pengalirhantaran naskah melalui jaringan telekomunikasi. Misalnya sandi Morse, yang menyandikan huruf alfabet Latin ke dalam rangkaian tekanan panjang dan pendek dari kunci telegraf; serta ASCII, yang menyandikan huruf, bilangan, dan simbol-simbol lain, sebagai bilangan bulat dan versi perduaan (binary) 7-bita dari bilangan bulat tersebut; umumnya ditambahkan nol-bita untuk mempermudah penyimpanan dalam bita perlapanan.

Pada masa-masa awal komputer, pengenalan penyandiaksaraan seperti ASCII (1963) dan EBCDIC (1964) mengawali proses pembakuan. Keterbatasan kumpulan tersebut mulai tampak, dan beberapa metode seterjadinya (ad hoc) dikembangkan untuk memperluaskannya. Kebutuhan untuk mendukung berbagai macam tata tulisan, termasuk rumpun aksara CJK dari tulisan Asia Timur, membutuhkan dukungan untuk jauh lebih banyak aksara dan menuntut pendekatan yang tersusun rapi untuk penyandiaksaraan, dan bukan pendekatan seterjadinya seperti sebelumnya.

Acuan penyandiaksaraan

Unicode dan bakuan serupa lainnya, Universal Character Set (ISO/IEC 10646), bersama-sama merumuskan penyandiaksaraan seragam. Ada empat tingkat acuan penyandiaksaraan Unicode:[1]

  • Khasanah Aksara Mujarad (Abstract Character Repertoire)
  • Serangkaian Aksara Tersandikan (Coded Character Set)
  • Borang Penyandiaksaraan (Character Encoding Form)
  • Pola Rencana Penyandiaksaraan (Character Encoding Scheme)

Catatan kaki

  1. ^ "Unicode Technical Report #17: Unicode Character Encoding Model". 2008-11-11. Diakses tanggal 2012-10-28. 

Pranala luar