Penambangan teks: Perbedaan antara revisi

Konten dihapus Konten ditambahkan
kTidak ada ringkasan suntingan
InternetArchiveBot (bicara | kontrib)
Add 1 book for Wikipedia:Pemastian (20231209)) #IABot (v2.0.9.5) (GreenC bot
 
(4 revisi perantara oleh 4 pengguna tidak ditampilkan)
Baris 1:
[[Berkas:Tripletsnew2012.png|jmpl|Narrative Network of US Election 2012 - Nodes indicate noun phrases, links go from subject to object, color expresses relation of support or opposition. Appeared in: "Automated analysis of the US presidential elections using Big Data and network analysis; S Sudhahar, GA Veltri, N Cristianini; Big Data & Society 2 (1), 1-28, 2015"]]
'''Penambangan teks''' ({{lang-en|text mining}}) adalah proses ekstraksi [[pola]] berupa [[informasi]] dan [[pengetahuan]] yang berguna dari sejumlah besar sumber [[data]] [[teks]], seperti dokumen [[Microsoft Word|Word]], [[PDF]], kutipan teks, dll. Jenis [[masukan]] untuk penambangan teks ini disebut data tak terstruktur dan merupakan pembeda utama dengan [[penambangan data]] yang menggunakan data terstruktur atau [[basis data]] sebagai masukan. Penambangan teks dapat dianggap sebagai proses dua tahap yang diawali dengan penerapan struktur terhadap sumber data teks dan dilanjutkan dengan [[ekstraksi informasi]] dan pengetahuan yang relevan dari data teks terstruktur ini dengan menggunakan teknik dan alat yang sama dengan penambangan data. Proses yang umum dilakukan oleh penambangan teks di antaranya adalah [[perangkuman otomatis]], [[kategorisasi dokumen]], [[penggugusan teks]], deteksi plagiarisme, dll. (Turban, et.al., 2011)
 
Baris 7 ⟶ 8:
* {{cite book|author1=Feldman, R.|author2=Sanger, J.|year=2007
|title=The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data
|url=https://archive.org/details/textmininghandbo0000feld|location=New York|publisher=Cambridge University Press}}
* {{cite book|author1=Turban, E.|author2=et.al.|year=2011
|title=Decision Support and Business Intelligence Systems|url=https://archive.org/details/decisionsupportb0000turb|edition=9
|location=New Jersey|publisher=Pearson Education, Inc}}
{{ti-stub}}
 
{{Natural language processing}}
[[Kategori:Penambangan data]]
 
 
{{ti-stub}}