Model tas-kata-kata: Perbedaan antara revisi

Konten dihapus Konten ditambahkan
HsfBot (bicara | kontrib)
k v2.04b - Fixed using Wikipedia:ProyekWiki Cek Wikipedia (Tanda baca setelah kode "<nowiki></ref></nowiki>")
k →‎top: clean up
Baris 1:
{{DISPLAYTITLE:Model tas-kata-kata}}
'''Model tas-kata-kata''' ({{lang-en|Bag-of-words model}}) ialah sebuah gambaran sederhana digunakan dalam <nowiki/>[[Pemrosesan bahasa alami|pengolahan bahasa alami]] dan [[Sistem temu balik informasi|pencarian informasi]].<ref name="s1">Soumya George K, Shibily Joseph. ''Text Classification by Augmenting Bag of Words (BOW) Representation with Co-occurrence Feature''. IOSR Journal of Computer Engineering (IOSR-JCE) Volume 16, Issue 1, Ver. V (Jan. 2014), PP 34-38</ref> Dikenal sebagai model ruang vektor.<ref name="s2">McTear, Michael (''et al''.) (2016). ''The Conversational Interface - Talking to Smart Devices''. hlm. 166.</ref> Pada model ini, tiap kalimat dalam dokumen digambarkan sebagai ''[[Tokenisasi|token]]'', mengabaikan tata bahasa dan bahkan urutan kata namun menghitung frekuensi kejadian atau kemunculan kata dari dokumen.<ref name="s2"/><ref>Saxena, D., Saritha, S. K., & Prasad, V. (2017). ''Survey Paper on Feature Extraction Methods in Text Categorization''. International Journal of Computer Applications, 166(11).</ref><ref name="s2"/>
 
== Contoh Implementasi ==