Article Info
Syntatic-Prosody of Malay Speech Corpus
Sabrina Tiun, Rosni Abdullah, Tang Enya Kong, Siti Khaotijah Muhammad
dx.doi.org/10.17576/apjitm-2013-0201-01
Abstract
Kertas kerja ini memperihalkan tentang pembinaan korpus pertuturan Bahasa Melayu untuk digunakan dalam pembinaan sistem pertuturan Bahasa Melayu. Korpus pertuturan Bahasa Melayu ini diwakili dengan perwakilan struktur pokok sintaks-prosodi, yang diadaptasikan dari struktur perwakilan Structured-String Correspondence (SSTC). Untuk membina korpus pertuturan Bahasa Melayu dalam perwakilan sintaks-prosodi, ayat-ayat teks yang sudah sedia kala dalam perwakilan SSTC digunakan sebagai skrip rakaman. Melalui rakaman suara berdasarkan skrip tersebut, fitur prosodi diestrak keluar dan dianotasi pada struktur pokok SSTC, dan pada masa yang sama fail bunyi dipautkan dengan nod-nod struktur pohon SSTC. Pada akhir memprosesan rakaman dan anotasi, mini korpus pertuturan yang diwakili dengan perwakilan sintaksis-prosodi berjaya dihasilkan yang mana ianya mengandungi 422 ayat, 1720 frasa dan 6978 unit perkataan
keyword
Korpus pertuturan, Sistem pertuturan Bahasa Melayu, Sintaks-Prosodi, Struktur perwakilan sintaks-prosodi, sintaks, prosodi
Area
Data Mining and Optimization