Pengesanan Ralat Nahu Esei Bahasa Inggeris Melalui Pemprosesan Bahasa Tabii

NUR ASMA MOHD RAZALI, NAZLIA OMAR & SAADIYAH DARUS

 

ABSTRAK

Pelajar yang memasuki pusat pengajian tinggi dijangkakan mempunyai kemahiran bahasa Inggeris yang baik untuk membolehkan mereka menyediakan tugasan kursus dan aktiviti akademik dalam bahasa Inggeris. Satu daripada tugasan ialah menulis esei. Analisis kesalahan tatabahasa ke atas empat ratus (400) esei pelajar ESL (English as a Second Language) di Universiti Kebangsaan Malaysia (UKM) dijalankan dan hasil analisis menunjukkan ralat nahu (tenses) adalah ralat yang paling kerap dilakukan. Sebuah alat pengesanan ralat nahu dalam penulisan pelajar ESL diperlukan memandangkan alat yang sedia ada tidak dibangunkan khusus untuk pelajar ESL di Malaysia. Kertas ini bertujuan memperkenalkan teknik berasaskan heuristik dan peraturan untuk mengesan ralat nahu. Berasaskan heuristik dan peraturan ini, ATDEiTTM dibangunkan. ATDEiTTM diuji menggunakan 50 set data ujian (esei bahasa Inggeris). Keputusan yang dijana oleh ATDEiTTM dibandingkan dengan keputusan pakar bahasa. ATDEiTTM memperoleh 95% dapatan semula dan 76.2% kejituan. Ini menunjukkan bahawa pendekatan berasaskan heuristik dan peraturan membantu dalam proses mengesan ralat nahu dalam esei pelajar ESL secara automatik.

Kata kunci: Pengesanan ralat, pemeriksaan esei berbantukan komputer, heuristik, peraturan, kesalahan tatabahasa, esei ESL.

ABSTRACT

Students entering tertiary level of education are expected to have the linguistic competence in English to be able to perform their academic activities. One of the tasks they need to perform is essay writing. Four hundred (400) essays of ESL (English as a Second Language) learners at Universiti Kebangsaan Malaysia (UKM) were analysed for grammatical errors and the most common error were tenses. An automated error detection tool is needed because currently available softwares are not developed for ESL learners in Malaysia. This paper aims to introduce a heuristics and rule based approach for detecting errors in tenses. To realize the utilities of these heuristics and rule, a tool called ATDEiTTM was implemented. ATDEiTTM was evaluated using 50 test data sets (English language essays). Results generated by ATDEiTTM were tested against human performance results. ATDEiTTM achieved 95% recall and 76.2% precision. The results revealed that heuristics and rule based approach can improve the process of detecting grammatical errors in tenses for automatic ESL writing.

Keywords: Error detection, computer-based essay marking system, heuristics, rule, grammatical errors, ESL essay.

References