Soundex

algoritme fonetik penyandian susunan karakter berdasar bunyi
Revisi sejak 9 Juni 2020 08.28 oleh Guspan Tanadi (bicara | kontrib) (subbagian Algoritme)

Soundex atau Russell Soundex[1] ialah sistem penyandian berbasis fonetik,[2] diterapkan dalam pengambilan informasi terhadap kesalahan transkripsi secara ortografi, tetapi serupa secara fonetik.[3] Soundex diketahui sebagai algoritma fonetik yang paling dikenal luas, istilah yang acap dipakai sebagai sinonim atas "algoritma fonetik".[4]

Sebagian besar aplikasi yang menggunakan Soundex melibatkan akan pencarian nama seseorang terutama nama keluarga,[2] sebagai contoh pada pendataan sensus dan tugas tertentu yang terdapat kesalahan penulisan disebabkan kesamaan fonetik.[3] Pada banyak kasus, kala sistem pangkalan data memerlukan pencarian fonetik, Soundex masih sangat populer di antara berbagai vendor pangkalan data.[5] Soundex mencakup karakteristik standar pada basis data Oracle[6], MySQL[7], MariaDB[8], Microsoft SQL Server[9], IBM DB2, Teradata[10], SAP HANA[11], pula pada bahasa pemrograman PHP.[12]

Sejarah

Soundex awal dikembangkan tahun 1900-an oleh Robert C. Russell dan Margaret King Odell.[13] Russell memperoleh paten pertama di tahun 1918, sebelum komputer dikenal luas, kala itu Soundex menangani persoalan sensus Amerika Serikat yaitu menemukan individu bersumber nama mereka.[5]

Sistem Soundex berguna terutama bagi mereka yang mencari leluhur di Amerika. Di tahun 1930, Soundex digunakan oleh Arsip Nasional Amerika Serikat kepada menandai nama keluarga atas sensus tahun 1880, 1900 dan 1920. Pihak yang mencari leluhur dalam rekam sensus perlu mengetahui sistem penyandian Soundex.[14]

Dikembangkan berdasarkan pengucapan dalam bahasa Inggris, pada tahun 1997 Soundex pula diperluas mengikuti tata bahasa dalam bahasa Indonesia.[15]

Algoritme

Soundex bekerja dengan mengubah string ke dalam kode fonetik yang konsisten sebanyak empat karakter. Meskipun string berbeda, tetapi memiliki pengucapan serupa maka akan menjadi kode fonetik yang sama.[15] Sebagai contoh, kata dengan eja bervariasi yang merepresentasi nama seperti Sherman, Sharman, Sirman akan diubah menjadi kode S-655.[14]

Referensi

  1. ^ Dilts, David (30 Juli 2008). "Soundex Genealogy" (Wiki). FamilySearch. Diakses tanggal 7 Juni 2020. 
  2. ^ a b "Soundex" (Definisi). Lexico Oxford Dictionary. Diakses tanggal 3 Juni 2020. 
  3. ^ a b Sojka, Petr; Horak, Aleš; Kopecek, Ivan; Pala, Karel (September 2012). Text, Speech and Dialogue: 15th International Conference, TSD 2012, Brno, Republik Ceko. Springer. hlm. 48–49. ISBN 3-6423-2790-7. 
  4. ^ "What does soundex mean?". Definitions.net STANDS4 LLC. Diakses tanggal 3 Juni 2020. 
  5. ^ a b Latif, Al-Hakim (2006). Challenges of Managing Information Quality in Service Organizations. Idea Group Inc (IGI). hlm. 69. ISBN 1-5990-4422-6. 
  6. ^ "SOUNDEX" (Database SQL Reference). Oracle. Diakses tanggal 4 Juni 2020. 
  7. ^ "12.7 String Functions and Operators" (Documentation). Oracle Corporation. Diakses tanggal 4 Juni 2020. 
  8. ^ "SOUNDEX" (Knowledge Base). MariaDB. Diakses tanggal 4 Juni 2020. 
  9. ^ "SOUNDEX (Transact-SQL)" (Documentation). Microsoft. 14 Maret 2017. Diakses tanggal 4 Juni 2020. 
  10. ^ "Definition: Soundex" (Documentation). Teradata. Diakses tanggal 7 Juni 2020. 
  11. ^ "SOUNDEX Function (String)" (SAP HANA SQL and System Views Reference). SAP HANA Platform. Diakses tanggal 4 Juni 2020. 
  12. ^ "PHP: soundex" (Manual). The PHP Group. Diakses tanggal 4 Juni 2020. 
  13. ^ Janssen, Cory. "What is Soundex?" (Definisi). Techopedia. Diakses tanggal 7 Juni 2020. 
  14. ^ a b "What is Soundex and How Does Soundex Work?" (Artikel). GenealogyInTime. Diakses tanggal 8 Juni 2020. 
  15. ^ a b Ningrum, Ika Purwanti; Muh. Yamin; Samsul (Oktober 2016). Pengembangan Algoritma Soundex Pada Spell Checker Bahasa Indonesia (Seminar Nasional). APTIKOM. hlm. 854–860.