Soundex: Perbedaan antara revisi

Konten dihapus Konten ditambahkan
Guspan Tanadi (bicara | kontrib)
subbagian Algoritme
Guspan Tanadi (bicara | kontrib)
menerangkan Algoritme
Baris 4:
 
== Sejarah ==
Soundex awal dikembangkan tahun 1900-an oleh Robert C. Russell dan Margaret King Odell.<ref name="Techopedia"/> Russell memperoleh [[paten]] pertama di tahun 1918, sebelum [[komputer]] dikenal luas, kala itu Soundex menangani persoalan sensus [[sensus Amerika Serikat]] yaitu menemukan individu bersumber nama mereka.<ref name="IGI"/>
 
Sistem Soundex berguna terutama bagi mereka yang mencari [[leluhur]] di Amerika. Di tahun 1930, Soundex digunakan oleh [[Arsip Nasional Amerika Serikat]] kepada menandai nama keluarga atas sensus tahun 1880, 1900 dan 1920. Pihak yang mencari leluhur dalam rekam sensus perlu mengetahui sistem penyandian Soundex.<ref name="GiTMagazine"/>
Baris 11:
 
== Algoritme ==
Soundex bekerja dengan mengubah [[string]] ke dalam kode fonetik yang konsisten sebanyak empat [[karakter (komputasi)|karakter]]. Meskipun string berbeda, tetapi memiliki pengucapan serupa maka akan menjadi kode fonetik yang sama.<ref name="SEMNAS"/> Sebagai contoh, kata dengan eja bervariasi yang merepresentasi nama seperti Sherman, Sharman, Sirman akan diubah menjadi kode S-655.<ref name="GiTMagazine"/> String yang dapat diubah ke kode fonetik tidak wajib merepresentasi sebuah nama, contoh lain seperti kata 'laper' yang dapat diidentifikasi sebagai kata '[[kelaparan|lapar]]'.<ref name="SEMNAS"/>
 
Pencantuman kode fonetis atas [[algoritme]] Soundex pada Bahasa Indonesia dengan aturan:<ref name="SEMNAS"/>
{| class="wikitable"
|-
! Huruf
! Kode
|-
| A, I ,U, E, O, H, W, Y
| 0
|-
| F, V
| 1
|-
| S, X, Z
| 2
|-
| L
| 3
|-
| R
| 4
|-
| M, N
| 5
|-
| B, C, D, G, J, K, P, Q, T
| 6
|}
 
Algoritme Soundex akan bekerja melalui proses yakni:<ref name="TSD2012/>
# Mengganti seluruh string kecuali [[huruf]] pertama menjadi kode fonetik
# Menghapus [[kode repetitif]] yang bersebelahan
# Menghilangkan semua kode 0 yang bertujuan membuang [[vokal|huruf vokal]]
# Mengembalikan empat karakter pertama dari string yang dihasilkan
 
Kala kode fonetis tidak mencapai empat karakter, maka kode yang lain ialah 0.<ref name="SEMNAS"/>
 
== Referensi ==