Selangkah Memahami Korpus Linguistik(1): Apa itu korpus?
Ketika belum mulai menekuni kepustakaan tentang korpus linguistik, saya sama sekali buta tentang apa itu korpus. Apa bedanya dengan data? Lalu, apa bedanya pula dengan teks?
Kita segera tahu bahwa data itu adalah serangkaian entitas atau informasi yang kita gunakan sebagai alat bukti untuk mengungkapkan atau menjelaskan sebuah gejala yang menjadi subjek penelitian kita. Namun, agak sulit membedakan korpus dan teks karena selintas bagi orang yang awam tampak tidak ada bedanya. Ada penjelasan yang sederhana dan menarik dari Michael Stubbs (2003) bahwa "a text is any stretch of naturally occuring language in use, spoken or written, which has been produced, independently of the analyst, for some real communicative purpose. A corpus is a large collection of computer-readable texts, of different text-types, which represent spoken and/or written usage." Jadi, pada istilah korpus, kata kuncinya adalah "computer-readable" atau "machine-readable". McEnery (2001) mengatakan bahwa walaupun sebelumnya tidak ada asosiasi otomatis antara korpus dan machine-readability, namun dalam korpus linguistik modern, istilah corpus nyaris identik dengan machine-readable corpus.

0 Comments:
Post a Comment
<< Home