Soundex: Perbedaan antara revisi

Konten dihapus Konten ditambahkan
Guspan Tanadi (bicara | kontrib)
Referensi: nama pengarang lokasi
k Algoritme: clean up
 
(16 revisi perantara oleh 4 pengguna tidak ditampilkan)
Baris 12:
}}
 
'''Soundex''' atau '''Russell Soundex'''<ref name="FamilySearch"/> ialah sistem penyandian berbasis [[fonetik|bunyi bahasa]],<ref name="Lexico"/> diterapkan dalam [[pemrosesan bahasa alami]] mencakup [[sistem temu balik informasi|pengambilan informasi]] terhadap kesalahan [[transkripsi (linguistik)|transkripsipenulisan]] secara [[ortografi|ejaan]], tetapi serupa secara fonetikbunyi.<ref name="TSD2012"/> Menjadi [[algoritme]] pertama kepada memadankan [[string|susunan karakter]] berdasar fonetikbunyi.<ref name="DATA2016"/> Sebab itu, Soundex diketahui sebagai [[algoritme fonetik]] yang paling dikenal luas.<ref name="Definitions"/><ref name="AncestrySolutions"/>
 
SebagianSecara sebagian besar, aplikasiSoundex yangbanyak menggunakandihubungkan Soundexpada melibatkanhal akanyang berurusan dengan pencarian [[nama]] [[pribadi|seseorangindividu]] terutama [[marga|nama keluarga]],<ref name="Lexico"/> sebagai contoh pada pendataan [[sensus]] dan tugas tertentu yang terdapat [[kesalahan tipografi|kesalahan penulisan]] disebabkan kesamaan fonetikbunyi.<ref name="TSD2012"/>
 
Penggunaan Soundex hingga kini masih terdapat pada [[Arsip Nasional Amerika Serikat]] terhadap penyelidikan atas tujuan sensus.<ref name="GiTMagazine"/> Pula dilestarikan dalam catatan historis yang menunjukkan [[penelitian dan pengembangan]] algoritme modern.<ref name="Techopedia"/>
 
== Sejarah ==
Soundex awal dikembangkan tahun 1900-an oleh Robert C. Russell dan Margaret King Odell.<ref name="Techopedia"/> Russell memperoleh [[paten]] pertama dipada tahun 1918,<ref name="SAA"/>, sebelum [[komputer]] dikenal luas, kala itu Soundex menangani persoalan [[sensus Amerika Serikat]] yaitu menemukan individu bersumber nama mereka.<ref name="IGI"/>
 
Sistem Soundex berguna terutama bagi mereka yang mencari [[leluhur]] di Amerika.<ref name="GiTMagazine"/> Pada tahun 1930-an, berbagai variasi Russell Soundex yang dikenal Soundex "Amerika" telah digunakan kepada beberapa [[federal]] rekam sensus Amerika Serikat.<ref name="AncestrySolutions"/> Digunakan pada seluruh sensus antara tahun 1880, 1900 dan 1920, sementara pada tahun 1910 hanya digunakan di beberapa [[Negara (pemerintahan)|wilayah]].<ref name="AncestrySolutions"/><ref name="GiTMagazine"/> Mereka yang mencari leluhur dalam rekam sensus perlu familier dengan sistem penyandian Soundex.<ref name="GiTMagazine"/>
Baris 28:
 
== Algoritme ==
Soundex bekerja dengan mengubah [[string|susunan karakter]] ke dalam kode bunyi atau fonetik yang konsisten sebanyak empat [[karakter (komputasi)|karakter]]. Meskipun stringsusunan karakter berbeda, tetapi terjadi [[homofon]] atau |pengucapan serupa]] maka akan menjadi kode fonetikbunyi yang sama.<ref name="SEMNAS"/> Sebagian besar sistem Soundex bergantung pada [[konsonan]], sementara tidak menyertakan [[vokal|huruf vokal]] pengecualian terletak di huruf pertama.<ref name="Definitions"/> Sebagai contoh, kata dengan [[ejaan]] bervariasi yang merepresentasi nama seperti Sherman, Sharman, Sirman akan diubah menjadi kode S-655.<ref name="GiTMagazine"/> StringSusunan karakter yang dapat diubah ke kode fonetikbunyi tidak wajib merepresentasi sebuah nama, contoh lain seperti kata 'laper' yang dapat diidentifikasi sebagai kata '[[kelaparan|lapar]]'.<ref name="SEMNAS"/>
 
Pencantuman kode fonetisbunyi atas algoritme Soundex pada Bahasa Indonesia telah mengalami pengembangan yaitu dengan aturan:<ref name="SEMNAS"/>
{| class="wikitable"
|-
Baris 64:
|}
 
Salah satu penerapan algoritme Soundex dapat melalui proses yakni:<ref name="TSD2012"/>
# Mengganti seluruh stringsusunan karakter kecuali [[huruf]] pertama menjadike dalam kode fonetikbunyi
# Menghapus [[kode repetitif]] yang bersebelahan
# Menghilangkan semua kode 0 yang bertujuan meniadakan huruf vokal
# Mengembalikan empat karakter pertama dari stringsusunan karakter yang dihasilkan
 
Kala kode fonetisbunyi tidak mencapai empat karakter, maka kode yang lain ialah 0.<ref name="SEMNAS"/>
 
Adaptasi berbeda terhadap Soundex dapat diterapkan bergantung pada [[linguistik|studi bahasa]].<ref name="TSD2012"/> Bila pada bahasa tertentu belum terdapat struktur fonetiksecara bunyi bahasa pula dapat diusulkan kepada sistem.<ref name="DATA2016"/>
 
== Limitasi ==
Soundex dimulai atas rancangan pengucapan bahasa Inggris yang hanya mendukung 26 karakter huruf [[alfabet bahasa Indonesia|A ke Z]],<ref name="GiTMagazinepg4"/> akan tetapi dalam bahasa tertentu seperti pada bahasa Sindhi yang banyak melibatkan [[abjad Arab]] memerlukan pengembangan berlainan.<ref name="Sindhi"/>
 
Selain itu, string atau susunan karakter yang diperkirakan jauh dari kemiripan dapat menghasilkan kode Soundex yang sama, seperti 'Smith', 'Saint', 'Snead'.<ref name="GiTMagazinepg4"/>
 
Beberapa sistem penyandian, seperti algoritme [[Metaphone]] ialah pengembangan dari Soundex.<ref name="AncestrySolutions"/>
 
== Aplikasi ==
Penerapan yang sudah banyak dikenal atas Soundex ialah pada federal sensus Amerika Serikat.<ref name="FamilySearch"/> Lebih dari itu, penerapan paling umum terhadap sistem fonetik Soundex ialah pada aplikasi [[pemeriksa ejaan]] yang diterapkan pada bahasa Inggris dan sejumlah bahasa lain. Pada [[bahasa Sindhi]], diketahui satu faktor kesalahan ejaan paling banyak berlangsung pada kata dengan bunyi yang serupa.<ref name="Sindhi"/> Merupakan satu keuntungan dari penerapan Soundex.<ref name="GiTMagazine"/>
 
Awal kala [[telepon genggam|perangkat seluler]] mulai masif, diikuti pertumbuhan pemakaian layanan pesan [[layanan pesan singkat|SMS]] yang menimbulkan analisa terhadap pesan teks menjadi cukup penting. Soundex pula dimanfaatkandapat kepada representasi teks atas menemukan tingkat kemiripan [[bahasa alami]]meningkatkan dipencarian dalamantara teks SMS hubungan dengan [[kosakata]] standar pada bahasa Inggris jugamaupun [[bahasa Spanyol]].<ref name="TSD2012"/>
 
Salah satu aplikasi pemeriksa ejaan melibatkan akan pencarian nama dalam [[pangkalan data]] dengan jumlah besar, sebagai contoh, dalam hal [[perusahaan telepon|operator telekomunikasi]] yang mewakili [[operator telepon]] dalam mendapati [[nomor telepon]] [[pelanggan]] berdasarberdasarkan atas perkiraan ejaan nama pelanggan.<ref name="GiTMagazine"/> Menjadi lumrah saat Soundex masih sangat populer di antara berbagai vendor pangkalan data,<ref name="IGI"/> antara lain mencakup karakteristik standar pada [[basis data Oracle|Oracle]], [[MySQL]], dsb.<ref name="DATA2016"/>
 
KarakteristikImplementasi pencarian akan Soundex terdapat pada [[situs web]] [[Ancestry.com|Ancestry]] atas pangkalan data [[genealogi|silsilah keluarga]] milik mereka dan beberapa program konversi ke kode Soundex, sepertisatu padadi antara yaitu [http://www.creativyst.com/Doc/Articles/SoundEx1/SoundEx1.htm#SoundExConverter SoundEx Converter Form] {{Webarchive|url=https://web.archive.org/web/20200613072701/http://www.creativyst.com/Doc/Articles/SoundEx1/SoundEx1.htm#SoundExConverter |date=2020-06-13 }}.<ref name="FamilySearch"/>
 
== Referensi ==
Baris 97 ⟶ 104:
| publisher=FamilySearch}}
</ref>
<ref name="Lexico">{{cite web
{{cite web
| title=Soundex
| type=Definisi
| publisher=Lexico Oxford Dictionary
| url=http://www.lexico.com/definition/soundex
| access-date=3 Juni 2020}}
| archive-date=2020-06-03
</ref>
| archive-url=https://web.archive.org/web/20200603065726/https://www.lexico.com/definition/soundex
| dead-url=yes
}}</ref>
<ref name="DATA2016">
{{cite report
Baris 149 ⟶ 158:
| publisher=Springer-Verlag Berlin Heidelberg
| isbn=3-6423-2790-7
| pages=[https://archive.org/details/textspeechdialog00sojk_220/page/n56 48]-49}}
| pages=48-49}}
</ref>
<ref name="SAA">
Baris 184 ⟶ 193:
| type=Artikel
| url=http://www.genealogyintime.com/GenealogyResources/Articles/what_is_soundex_and_how_does_soundex_work_page1.html
| websitepublisher=GenealogyInTime Magazine
| access-date=8 Juni 2020}}
</ref>
<ref name="GiTMagazinepg4">
{{cite web
| title=Limitations to Soundex Coding
| type=Artikel
| url=http://www.genealogyintime.com/GenealogyResources/Articles/what_is_soundex_and_how_does_soundex_work_page4.html
| publisher=GenealogyInTime Magazine
| access-date=20 Juni 2020}}
</ref>
<ref name="SEMNAS">