Soundex: Perbedaan antara revisi

Konten dihapus Konten ditambahkan
Guspan Tanadi (bicara | kontrib)
penyesuaian penjelasan
Guspan Tanadi (bicara | kontrib)
penyesuaian istilah luas
Baris 12:
}}
 
'''Soundex''' atau '''Russell Soundex'''<ref name="FamilySearch"/> ialah sistem penyandian berbasis [[fonetik|bunyi bahasa]],<ref name="Lexico"/> diterapkan dalam [[pemrosesan bahasa alami]] mencakup [[sistem temu balik informasi|pengambilan informasi]] terhadap kesalahan [[transkripsi (linguistik)|penulisan]] secara [[ortografi|ejaan]], tetapi serupa secara bunyi.<ref name="TSD2012"/> Menjadi [[algoritme]] pertama kepada memadankan [[string|susunan karakter]] berdasar bunyi.<ref name="DATA2016"/> Sebab itu, Soundex diketahui sebagai [[algoritme fonetik]] yang paling dikenal luas.<ref name="Definitions"/><ref name="AncestrySolutions"/>
 
Sebagian besar aplikasi yang menggunakan Soundex melibatkan akan pencarian [[nama]] [[pribadi|seseorang]] terutama [[marga|nama keluarga]],<ref name="Lexico"/> sebagai contoh pada pendataan [[sensus]] dan tugas tertentu yang terdapat [[kesalahan tipografi|kesalahan penulisan]] disebabkan kesamaan bunyi.<ref name="TSD2012"/>
Baris 28:
 
== Algoritme ==
Soundex bekerja dengan mengubah [[string|susunan karakter]] ke dalam kode bunyi atau fonetik yang konsisten sebanyak empat [[karakter (komputasi)|karakter]]. Meskipun stringsusunan karakter berbeda, tetapi terjadi [[homofon|pengucapan serupa]] maka akan menjadi kode bunyi yang sama.<ref name="SEMNAS"/> Sebagian besar sistem Soundex bergantung pada [[konsonan]], sementara tidak menyertakan [[vokal|huruf vokal]] pengecualian terletak di huruf pertama.<ref name="Definitions"/> Sebagai contoh, kata dengan [[ejaan]] bervariasi yang merepresentasi nama seperti Sherman, Sharman, Sirman akan diubah menjadi kode S-655.<ref name="GiTMagazine"/> StringSusunan karakter yang dapat diubah ke kode bunyi tidak wajib merepresentasi sebuah nama, contoh lain seperti kata 'laper' yang dapat diidentifikasi sebagai kata '[[kelaparan|lapar]]'.<ref name="SEMNAS"/>
 
Pencantuman kode bunyi atas algoritme Soundex pada Bahasa Indonesia telah mengalami pengembangan yaitu dengan aturan:<ref name="SEMNAS"/>
Baris 65:
 
Salah satu penerapan algoritme Soundex dapat melalui proses yakni:<ref name="TSD2012/>
# Mengganti seluruh stringsusunan karakter kecuali [[huruf]] pertama menjadike dalam kode bunyi
# Menghapus [[kode repetitif]] yang bersebelahan
# Menghilangkan semua kode 0 yang bertujuan meniadakan huruf vokal
# Mengembalikan empat karakter pertama dari stringsusunan karakter yang dihasilkan
 
Kala kode bunyi tidak mencapai empat karakter, maka kode yang lain ialah 0.<ref name="SEMNAS"/>
Baris 77:
Soundex dimulai atas rancangan pengucapan bahasa Inggris yang hanya mendukung 26 karakter huruf [[alfabet bahasa Indonesia|A ke Z]],{{r|GiTMagazinepg4}} akan tetapi dalam bahasa tertentu seperti pada bahasa Sindhi yang banyak melibatkan [[abjad Arab]] memerlukan pengembangan berlainan.{{r|Sindhi}}
 
Selain itu, string atau susunan karakter yang diperkirakan jauh dari kemiripan dapat menghasilkan kode Soundex yang sama, seperti 'Smith', 'Saint', 'Snead'.{{r|GiTMagazinepg4}}
 
Beberapa sistem penyandian, seperti algoritme [[Metaphone]] ialah pengembangan dari Soundex.{{r|AncestrySolutions}}