Linguistik korpus: Perbedaan antara revisi
Konten dihapus Konten ditambahkan
Dianosaurus (bicara | kontrib) mengembangkan artikel dan menambahkan referensi |
Dianosaurus (bicara | kontrib) mengembangkan artikel dan menambahkan referensi |
||
Baris 1:
'''Linguistik korpus''' adalah
Metode ini digunakan dalam [[linguistik deskriptif]] maupun [[linguistik terapan]], seperti penyusunan [[kamus]], untuk menjamin bahwa data yang digunakan benar-benar berasal dari penggunaan yang luas dan terhindar dari penggunaan subjektif. Selain itu, korpus dapat membantu menyediakan, mengumpulkan, dan mengatur data linguistik untuk tujuan penelitian dan akademis lainnya, termasuk pedagogi.<ref>{{Cite journal|last=Sari|first=Faizah|date=2013|title=Bagaimana Teknologi dapat Membantu Metodologi|url=http://linguistik-indonesia.org/images/files/Bagaimana%20Teknologi%20dapat%20Membantu%20Metodologi.pdf|journal=Masyarakat Linguistik Indonesia|volume=31|issue=1|pages=107-110}}</ref>
Baris 10:
Selain itu, penggunaan komputer modern juga meningkatkan jumlah dan memperluas jangkauan korpus. Jika sebelumnya jumlah korpus terbatas oleh keterbatasan manusia dalam mengoleksi dan mengelola korpus, maka dengan adanya komputer memungkinkan korpus tersedia dalam jumlah yang sangat besar dan dapat diakses dengan mudah.<ref name=":1" />
== Metode ==
Tognini (2001) menyatakan dua pendekatan linguistik korpus, yaitu berbasis korpus (''corpus-based'') dan dikendalikan korpus (''corpus-driven''). Keduanya memiliki perbedaan dalam memandang korpus sebagai bukti yang dapat mendukung teori. Pendekatan yang berbasis korpus bersifat deduktif, sedangkan pendekatan yang dikendalikan korpus bersifat induktif, yakni menganggap korpus sebagai bukti yang harus menjadi acuan teori.
Cara menganalisis data korpus dapat dimulai dari metadata, penanda teks, dan anotasi.
* '''Metadata,''' yaitu memberi informasi tentang siapa yang memproduksi teks, kapan, dan penggunaan bahasa dalam teks.
* '''Penanda teks''' atau ''textual markup,'' meliputi tanda yang digunakan dalam penulisan teks, seperti tipologi (misalnya cetak miring).
* '''Anotasi''', yaitu memberi informasi mengenai fitur linguistik data bahasa tersebut, seperti penambahan kelas kata. Misalnya verba, nomina, adjektiva, atau adverbia.
Hal penting lain dalam linguistik korpus adalah tersedianya alat yang memungkinkan untuk mencari korpus dalam format baris secara vertikal atau biasa disebut korkodansi. Alat berupa perangkat lunak komputer yang digunakan untuk melakukan korkodansi berkembang dari generasi ke generasi hingga generasi keempat yang kini berbasis web.
Perhitungan statistik yang dapat digunakan untuk mengolah data linguistik korpus meliputi statistik deskriptif dan tes signifikansi untuk menguji seberapa mungkin hasil tertentu merupakan sebuah kebetulan, misalnya dalam menghitung kata kunci dan kolokasi.<ref>{{Cite journal|last=Waskita|first=Dana|date=2017|title=Resensi Corpus Linguistics: Method, Theory and Practice|url=https://media.neliti.com/media/publications/131445-corpus-linguistics-method-theory-and-pra-1414eb50.pdf|journal=Sosioteknologi|volume=16|issue=1|pages=145-147}}</ref>
== Referensi ==
|