Penambangan teks: Perbedaan antara revisi
Konten dihapus Konten ditambahkan
Add 1 book for Wikipedia:Pemastian (20231209)) #IABot (v2.0.9.5) (GreenC bot |
|||
(6 revisi perantara oleh 6 pengguna tidak ditampilkan) | |||
Baris 1:
[[Berkas:Tripletsnew2012.png|jmpl|Narrative Network of US Election 2012 - Nodes indicate noun phrases, links go from subject to object, color expresses relation of support or opposition. Appeared in: "Automated analysis of the US presidential elections using Big Data and network analysis; S Sudhahar, GA Veltri, N Cristianini; Big Data & Society 2 (1), 1-28, 2015"]]
'''Penambangan teks''' ({{lang-en|text mining}}) adalah proses ekstraksi [[pola]] berupa [[informasi]] dan [[pengetahuan]] yang berguna dari sejumlah besar sumber [[data]] [[teks]], seperti dokumen [[Microsoft Word|Word]], [[PDF]], kutipan teks, dll. Jenis [[masukan]] untuk penambangan teks ini disebut data tak terstruktur dan merupakan pembeda utama dengan [[penambangan data]] yang menggunakan data terstruktur atau [[basis data]] sebagai masukan. Penambangan teks dapat dianggap sebagai proses dua tahap yang diawali dengan penerapan struktur terhadap sumber data teks dan dilanjutkan dengan [[ekstraksi informasi]] dan pengetahuan yang relevan dari data teks terstruktur ini dengan menggunakan teknik dan alat yang sama dengan penambangan data. Proses yang umum dilakukan oleh penambangan teks di antaranya adalah [[perangkuman otomatis]], [[kategorisasi dokumen]], [[penggugusan teks]],
== Rujukan ==
* {{cite book|author1=Berry, M.W.|author2=Kogan, J.|year=2010
|title=Text Mining: Application and Theory
Baris 8:
* {{cite book|author1=Feldman, R.|author2=Sanger, J.|year=2007
|title=The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data
|url=https://archive.org/details/textmininghandbo0000feld|location=New York|publisher=Cambridge University Press}}
* {{cite book|author1=Turban, E.|author2=et.al.|year=2011
|title=Decision Support and Business Intelligence Systems|url=https://archive.org/details/decisionsupportb0000turb|edition=9
|location=New Jersey|publisher=Pearson Education, Inc}}
{{Natural language processing}}
[[Kategori:Penambangan data]]▼
{{ti-stub}}
▲[[Kategori:Penambangan data]]
|