Article Info

Syntatic-Prosody of Malay Speech Corpus

Sabrina Tiun, Rosni Abdullah, Tang Enya Kong, Siti Khaotijah Muhammad
dx.doi.org/10.17576/apjitm-2013-0201-01

Abstract

Kertas kerja ini memperihalkan tentang pembinaan korpus pertuturan Bahasa Melayu untuk digunakan dalam pembinaan sistem pertuturan Bahasa Melayu. Korpus pertuturan Bahasa Melayu ini diwakili dengan perwakilan struktur pokok sintaks-prosodi, yang diadaptasikan dari struktur perwakilan Structured-String Correspondence (SSTC). Untuk membina korpus pertuturan Bahasa Melayu dalam perwakilan sintaks-prosodi, ayat-ayat teks yang sudah sedia kala dalam perwakilan SSTC digunakan sebagai skrip rakaman. Melalui rakaman suara berdasarkan skrip tersebut, fitur prosodi diestrak keluar dan dianotasi pada struktur pokok SSTC, dan pada masa yang sama fail bunyi dipautkan dengan nod-nod struktur pohon SSTC. Pada akhir memprosesan rakaman dan anotasi, mini korpus pertuturan yang diwakili dengan perwakilan sintaksis-prosodi berjaya dihasilkan yang mana ianya mengandungi 422 ayat, 1720 frasa dan 6978 unit perkataan

keyword

Korpus pertuturan, Sistem pertuturan Bahasa Melayu, Sintaks-Prosodi, Struktur perwakilan sintaks-prosodi, sintaks, prosodi

Area

Data Mining and Optimization