SRL TOOL: Penentuan Peranan Semantik Berasaskan Heuristik Dalam Pemprosesan Bahasa Tabii

NAZLIA OMAR & SITI SALWA HASBULLAH

 

ABSTRAK

Penentuan peranan semantik adalah suatu proses untuk menentukan struktur argumen bagi predikat dalam suatu ayat atau teks dengan menggunakan kaedah penentuan semantik. Satu kaedah dalam penentuan peranan semantik ialah dengan menggunakan heuristik. Heuristik merupakan panduan untuk menyelesaikan masalah atau membuat keputusan dengan lebih cepat walaupun kadangkalanya, tidak secara optimum. Kebanyakan alatan atau aplikasi yang sedia ada untuk penentuan peranan semantik adalah terhad dan kurang mengaplikasikan kaedah penggunaan heuristik dalam penentuan tersebut. Kajian ini bertujuan untuk mendapatkan penentuan peranan semantik yang lebih tepat dengan menggunakan kaedah heuristik. Alatan untuk penentuan peranan semantik yang dinamakan SRL TOOL dibangunkan bertujuan untuk meningkatkan ketepatan penentuan peranan semantik menerusi penggunaan heuristik dan rujukan tanda sintaktik. Skop kajian tertumpu kepada penentuan sembilan peranan semantik yang dipilih iaitu Agent, Theme, Goal, Source, Instrument, Beneficiary, Location, Manner dan Time. Pendekatan kaedah penggunaan heuristik adalah untuk menentukan peranan semantik yang wujud dalam suatu ayat Bahasa Inggeris yang diuji. Pengujian dan penilaian telah dilakukan terhadap sembilan peranan semantik yang dikaji dengan menggunakan unit penilaian kejituan, dapatan semula dan F-Measure. Keputusan penilaian menunjukkan dapatan semula yang dicapai ialah 90.0% , kejituan 81.8% dan F-Measure 85.9% bagi pengujian ke atas set data ujian. SRL TOOL yang dibangunkan ini dapat membantu para penyelidik dalam bidang pemprosesan bahasa tabii. Selain itu juga, pembangunan perisian aplikasi ini turut berguna kepada pakar atau pelajar dalam bidang Linguistik.

Kata kunci: Penentuan peranan semantik, pemprosesan bahasa tabii, heuristik

 

 

ABSTRACT

Semantic role labeling is the process of annotating the predicate argument structure in text with semantic labels. One of the technique in semantic role labeling is through the use of heuristics. Heuristics usually serves as a guideline to provide good but not necessarily optimal solutions to difficult problems, easily and quickly. Recent software or tools that assign semantic roles based on heuristics are still minimal. Thus, the aim of this research is to improve the accuracy of semantic role labeling through the use of heuristics. In this research, the semantic role labeling process is performed based on syntactic clues and heuristics. The tool, SRL TOOL is developed using a set of heuristics with the goal to achieve better results in semantic role assigning. The scope of the research covers nine roles in semantic role labeling which include Agent, Theme, Goal, Source, Instrument, Beneficiary, Location, Manner and Time. To further support the contribution for each role, an evaluation of SRL TOOL was carried out. The evaluation measures used are recall, precision and F-Measure. With regard to these evaluations, SRL TOOL has an average of 90.0% recall, 81.8% precision and 85.9% F-Measure for the test dataset. This tool aims to 32 support the researchers in the Natural Language Processing field. This application tool is also useful for experts or students in Linguistics.

Keywords: Semantic role labeling, natural language processing, heuristic

References