Soundex: Perbedaan antara revisi
Konten dihapus Konten ditambahkan
penyesuaian penjelasan |
penyesuaian istilah luas |
||
Baris 12:
}}
'''Soundex''' atau '''Russell Soundex'''<ref name="FamilySearch"/> ialah sistem penyandian berbasis [[fonetik|bunyi bahasa]],<ref name="Lexico"/> diterapkan dalam [[pemrosesan bahasa alami]] mencakup [[sistem temu balik informasi|pengambilan informasi]] terhadap kesalahan [[transkripsi (linguistik)|penulisan]] secara [[ortografi|ejaan]], tetapi serupa secara bunyi.<ref name="TSD2012"/> Menjadi [[algoritme]] pertama kepada memadankan [[string|susunan karakter]] berdasar bunyi.<ref name="DATA2016"/> Sebab itu, Soundex diketahui sebagai [[algoritme fonetik]] yang paling dikenal luas.<ref name="Definitions"/><ref name="AncestrySolutions"/>
Sebagian besar aplikasi yang menggunakan Soundex melibatkan akan pencarian [[nama]] [[pribadi|seseorang]] terutama [[marga|nama keluarga]],<ref name="Lexico"/> sebagai contoh pada pendataan [[sensus]] dan tugas tertentu yang terdapat [[kesalahan tipografi|kesalahan penulisan]] disebabkan kesamaan bunyi.<ref name="TSD2012"/>
Baris 28:
== Algoritme ==
Soundex bekerja dengan mengubah [[string|susunan karakter]] ke dalam kode bunyi atau fonetik yang konsisten sebanyak empat [[karakter (komputasi)|karakter]]. Meskipun
Pencantuman kode bunyi atas algoritme Soundex pada Bahasa Indonesia telah mengalami pengembangan yaitu dengan aturan:<ref name="SEMNAS"/>
Baris 65:
Salah satu penerapan algoritme Soundex dapat melalui proses yakni:<ref name="TSD2012/>
# Mengganti seluruh
# Menghapus [[kode repetitif]] yang bersebelahan
# Menghilangkan semua kode 0 yang bertujuan meniadakan huruf vokal
# Mengembalikan empat karakter pertama dari
Kala kode bunyi tidak mencapai empat karakter, maka kode yang lain ialah 0.<ref name="SEMNAS"/>
Baris 77:
Soundex dimulai atas rancangan pengucapan bahasa Inggris yang hanya mendukung 26 karakter huruf [[alfabet bahasa Indonesia|A ke Z]],{{r|GiTMagazinepg4}} akan tetapi dalam bahasa tertentu seperti pada bahasa Sindhi yang banyak melibatkan [[abjad Arab]] memerlukan pengembangan berlainan.{{r|Sindhi}}
Selain itu, string atau susunan karakter yang diperkirakan jauh dari kemiripan dapat menghasilkan kode Soundex yang sama, seperti 'Smith', 'Saint', 'Snead'.{{r|GiTMagazinepg4}}
Beberapa sistem penyandian, seperti algoritme [[Metaphone]] ialah pengembangan dari Soundex.{{r|AncestrySolutions}}
|