Revisi per 17 Februari 2018 02.13 sunting Guspan Tanadi (bicara \| kontrib) 519 suntingan Tidak ada ringkasan suntingan ← Revisi sebelumnya		Revisi per 17 Februari 2018 04.31 sunting balikkan Guspan Tanadi (bicara \| kontrib) 519 suntingan Tidak ada ringkasan suntingan Revisi selanjutnya →
Baris 1: {{DISPLAYTITLE:Model bag of words}} Model bag-of-words ialah sebuah gambaran sederhana digunakan dalam <nowiki/>[[Pemrosesan bahasa alami\|pengolahan bahasa alami]] dan [[Sistem temu balik informasi\|pencarian informasi]]<ref name="s1">Soumya George K, Shibily Joseph. ''Text Classification by Augmenting Bag of Words (BOW) Representation with Co-occurrence Feature''. IOSR Journal of Computer Engineering (IOSR-JCE) Volume 16, Issue 1, Ver. V (Jan. 2014), PP 34-38</ref>. Dikenal sebagai model ruang vektor<ref>McTear, Michael (et al) (2016). The Conversational Interface - Talking to Smart Devices. p. 166.</ref>. Pada model ini, tiap kalimat dalam dokumen digambarkan sebagai ''[[Tokenisasi\|token]]'', mengabaikan tata bahasa dan bahkan urutan kata namun menghitung frekuensi kemunculan kata dari dokumen<ref>Saxena, D., Saritha, S. K., & Prasad, V. (2017). Survey Paper on Feature Extraction Methods in Text Categorization. International Journal of Computer Applications, 166(11).</ref>. == Contoh Implementasi == Terdapat dua dokumen teks sederhana D1 dan D2<ref name="s1"/>: Terdapat dua dokumen teks sederhana D1 dan D2<ref>Soumya George K, Shibily Joseph. ''Text Classification by Augmenting Bag of Words (BOW) Representation with Co-occurrence Feature''. IOSR Journal of Computer Engineering (IOSR-JCE) Volume 16, Issue 1, Ver. V (Jan. 2014), PP 34-38</ref>: D1: "''The Sun is a star. Sun is beautiful''."

Model tas-kata-kata: Perbedaan antara revisi