Linguistik korpus: Perbedaan antara revisi
Konten dihapus Konten ditambahkan
Tag: kemungkinan spam pranala VisualEditor |
k suntingan pengantar Tag: Suntingan perangkat seluler Suntingan aplikasi seluler Suntingan aplikasi Android App section source |
||
(5 revisi perantara oleh 4 pengguna tidak ditampilkan) | |||
Baris 1:
'''Linguistik korpus''' ([[bahasa Inggris]]: ''corpus linguistics'') adalah sebuah bidang yang fokus pada prosedur atau metode untuk mempelajari atau meneliti bahasa.<ref name=":0">{{Cite book|last=McEnery|first=Tony|last2=Wilson|first2=Andrew|date=1996|url=https://books.google.co.id/books/about/Corpus_Linguistics.html?id=YvhoAAAAIAAJ&redir_esc=y|title=Corpus Linguistics|publisher=Edinburgh University Press|isbn=978-0-7486-0482-1|language=en}}</ref>
Definisi linguistik korpus yaitu bidang yang mempelajari bahasa melalui metode dan prosedur tertentu. Metode [[linguistik]] ini menggunakan data dari bahan-bahan [[bahasa]] yang terkumpul dalam suatu sumber yang disebut [[korpus]] ([[jamak]]: korpora) yang berasal dari penggunaan bahasa dalam berbagai [[genre sastra|genre]], [[ragam bahasa|ragam]], dan bahan [[bahasa lisan|lisan]] maupun [[Korpus teks|tertulis]] yang menjamin keragaman yang seluas-luasnya dan menghindari penggunaan bahasa yang sangat sempit seperti [[idiolek]]. Data-data tersebut disusun secara sistematis dan mudah diakses secara elektronis melalui [[komputer]]. Metode ini digunakan dalam [[linguistik deskriptif]] maupun [[linguistik terapan]], seperti penyusunan [[kamus]], untuk menjamin bahwa data yang digunakan benar-benar berasal dari penggunaan yang luas dan terhindar dari penggunaan subjektif. Selain itu, korpus dapat membantu menyediakan, mengumpulkan, dan mengatur data linguistik untuk tujuan penelitian dan akademis lainnya, termasuk pedagogi.<ref>{{Cite journal|last=Sari|first=Faizah|date=2013|title=Bagaimana Teknologi dapat Membantu Metodologi|url=http://linguistik-indonesia.org/images/files/Bagaimana%20Teknologi%20dapat%20Membantu%20Metodologi.pdf|journal=Masyarakat Linguistik Indonesia|volume=31|issue=1|pages=107-110}}</ref>
Baris 8 ⟶ 12:
Istilah korpus dalam linguistik korpus modern selalu dikaitkan dengan korpus berbasis komputer yang memberikan keleluasaan pada peneliti untuk mencari kata atau ekspresi kebahasaan tertentu, menyusun korpus berdasarkan urutan tertentu, menemukan kata dalam konteks tertentu, dan menghitung frekuensi kemunculan kata tertentu dalam korpus secara cepat, akurat, dan dalam skala besar. Oleh karena itu, korpus di era modern lebih ditekankan pada bentuknya yang elektronis dan unsur keterbacaannya pada mesin.<ref name=":1">{{Cite journal|last=Suhardijanto|first=Totok dan Arawinda Dinakaramani|date=2018|title=Korpus Beranotasi: ke Arah Pengembangan Korpus Bahasa-bahasa di Indonesia|url=http://118.98.228.113/kbi_back/file/dokumen_makalah/dokumen_makalah_1540364204.pdf|journal=Kongres Bahasa Indonesia}}</ref>
Selain itu, penggunaan komputer modern juga meningkatkan jumlah dan memperluas jangkauan korpus. Jika sebelumnya jumlah korpus terbatas oleh keterbatasan manusia dalam mengoleksi dan mengelola korpus, maka dengan adanya komputer memungkinkan korpus tersedia dalam jumlah yang sangat besar dan dapat diakses dengan mudah.<ref name=":1" />
Saat ini di Indonesia sudah muncul beberapa aplikasi yang dapat membantu analisis korpus, seperti [https://korpusindonesia.kemdikbud.go.id/index.php?r=site/home Korpus Indonesia] dan [https://korpusnusantara.fbs.unp.ac.id Korpus Nusantara] yang dikembangkan oleh Fakultas Bahasa dan Seni [[Universitas Negeri Padang]]. Korpus Indonesia (KOIN) adalah bagian dari program pengembangan korpus dari [[Badan Pengembangan dan Pembinaan Bahasa]], Kementerian Pendidikan, Kebudayaan, Riset, dan Teknologi. Sementara, Korpus Nusantara (Kortara) dikembangkan oleh [https://wikipedia.or.id/wiki/Ermanto_Tolantang Prof. Dr. Ermanto, S.Pd., M.Hum.], dkk.
== Metode ==
Baris 19 ⟶ 23:
* '''Metadata,''' yaitu memberi informasi tentang siapa yang memproduksi teks, kapan, dan penggunaan bahasa dalam teks.
* '''Penanda teks''' atau ''textual markup,'' meliputi tanda yang digunakan dalam penulisan teks, seperti tipologi (misalnya cetak miring).
* '''Anotasi''', yaitu memberi informasi mengenai fitur linguistik data bahasa tersebut, seperti penambahan [[kelas kata]]. Misalnya verba, nomina, adjektiva, atau adverbia.
Hal penting lain dalam linguistik korpus adalah tersedianya alat yang memungkinkan untuk mencari korpus dalam format baris secara vertikal atau biasa disebut [[konkordansi]]. Alat berupa [[Perangkat lunak|perangkat lunak komputer]] yang digunakan untuk melakukan korkodansi berkembang dari generasi ke generasi hingga generasi keempat yang kini berbasis web.
Perhitungan statistik yang dapat digunakan untuk mengolah data linguistik korpus meliputi statistik deskriptif dan tes signifikansi untuk menguji seberapa mungkin hasil tertentu merupakan sebuah kebetulan, misalnya dalam menghitung [[kata kunci]] dan [[kolokasi]].<ref>{{Cite journal|last=Waskita|first=Dana|date=2017|title=Resensi Corpus Linguistics: Method, Theory and Practice|url=https://media.neliti.com/media/publications/131445-corpus-linguistics-method-theory-and-pra-1414eb50.pdf|journal=Sosioteknologi|volume=16|issue=1|pages=145-147}}</ref>
Baris 40 ⟶ 44:
{{linguistik-stub}}
==Lihat pula==
*[[Korpus teks]]
|