Penambangan teks: Perbedaan antara revisi
Konten dihapus Konten ditambahkan
Baris 1:
'''Penambangan teks''' ({{lang-en|text mining}}) adalah proses ekstraksi [[pola]] berupa [[informasi]] dan [[pengetahuan]] yang berguna dari sejumlah besar sumber [[data]] [[teks]], seperti dokumen [[Microsoft Word|Word]], [[PDF]], kutipan teks, dll. Jenis [[masukan]] untuk penambangan teks ini disebut data tak terstruktur dan merupakan pembeda utama dengan [[penambangan data]] yang menggunakan data terstruktur atau [[basis data]] sebagai masukan. Penambangan teks dapat dianggap sebagai proses dua tahap yang diawali dengan penerapan struktur terhadap sumber data teks dan dilanjutkan dengan [[ekstraksi informasi]] dan pengetahuan yang relevan dari data teks terstruktur ini dengan menggunakan teknik dan alat yang sama dengan penambangan data. Proses yang umum dilakukan oleh penambangan teks di antaranya adalah [[perangkuman otomatis]], [[kategorisasi dokumen]], [[penggugusan teks]], deteksi plagiarisme, dll. (Turban, et.al., 2011)
== Rujukan ==
|