Penambangan teks: Perbedaan antara revisi

Konten dihapus Konten ditambahkan
InternetArchiveBot (bicara | kontrib)
Add 1 book for Wikipedia:Pemastian (20220509)) #IABot (v2.0.8.7) (GreenC bot
Antonijek (bicara | kontrib)
Fitur saranan gambar: 1 gambar ditambahkan.
Baris 1:
[[Berkas:Tripletsnew2012.png|jmpl|Narrative Network of US Election 2012 - Nodes indicate noun phrases, links go from subject to object, color expresses relation of support or opposition. Appeared in: "Automated analysis of the US presidential elections using Big Data and network analysis; S Sudhahar, GA Veltri, N Cristianini; Big Data & Society 2 (1), 1-28, 2015"]]
'''Penambangan teks''' ({{lang-en|text mining}}) adalah proses ekstraksi [[pola]] berupa [[informasi]] dan [[pengetahuan]] yang berguna dari sejumlah besar sumber [[data]] [[teks]], seperti dokumen [[Microsoft Word|Word]], [[PDF]], kutipan teks, dll. Jenis [[masukan]] untuk penambangan teks ini disebut data tak terstruktur dan merupakan pembeda utama dengan [[penambangan data]] yang menggunakan data terstruktur atau [[basis data]] sebagai masukan. Penambangan teks dapat dianggap sebagai proses dua tahap yang diawali dengan penerapan struktur terhadap sumber data teks dan dilanjutkan dengan [[ekstraksi informasi]] dan pengetahuan yang relevan dari data teks terstruktur ini dengan menggunakan teknik dan alat yang sama dengan penambangan data. Proses yang umum dilakukan oleh penambangan teks di antaranya adalah [[perangkuman otomatis]], [[kategorisasi dokumen]], [[penggugusan teks]], deteksi plagiarisme, dll. (Turban, et.al., 2011)