Pengelasan Dokumen Web di Bursa Malaysia Menggunakan Pendekatan Support Vector Machine (SVM)

MOHD SHAHIZAN OTHMAN, LIZAWATI MI YUSUF,
JUHANA SALIM & ZARINA SHUKUR

 

ABSTRAK

Perkhidmatan Internet yang semakin mudah dicapai telah membawa kepada peningkatan bilangan laman web yang drastik. Fenomena ini telah menimbulkan masalah baru untuk enjin carian dan penstrukturan sumber maklumat web. Enjin carian semasa telah didapati menghasilkan terlalu banyak maklumat yang tidak relevan dan pautan yang hilang. Direktori Internet dan carian topik yang khusus pula, mampu menghasilkan keputusan yang lebih berkualiti berbanding enjin carian. Walau bagaimanapun, proses pembinaan dan penyelenggaraannya melibatkan kos yang tinggi kerana melibatkan penggunaan tenaga pakar untuk mengelaskan sumber maklumat. Jadi, kaedah pengelasan data yang tepat dan berkesan amat diperlukan untuk membolehkan maklumat yang berkualiti dapat dicapai. Kertas kerja ini membincangkan tentang kajian terhadap pengelasan laman web syarikat di Papan Utama dan Kedua, Bursa Malaysia menggunakan pendekatan Support Vector Machine (SVM). Hasil kajian menunjukkan pengelasan dokumen web menggunakan kernel linear mencatatkan peratusan ketepatan pengelasan yang terbaik.

Katakunci: Pengelasan, Support Vector Machine, Organisasi Maklumat

 

ABSTRACT

Internet services which has been more easily accesible has drastically brought an increased amount of web sites. The phenomena relating to the large increase in the size of web sites creates new problems for search engines and the stucturing of web information resources. Present search engines are found to be providing too many lost links and information that are not relevant. In contrast to search engines, Internet directories and specific topic search produce better search results. However, the process of development and maintenance of directories involve high cost as it requires the use of experts to classify web sources. Retrieval of quality information requires methods that could classify sources precisely and effectively. This article discusses research relating to the classification of companies’ web site in the Main board and Second board, Bursa Malaysia using Support Vector Machine (SVM) method. The result reveals that web classification using linear kernel gives the best percentage of accuracy.

Keywords: Classification, Support Vector Machine, Information Organization

References