Implementasi Teknik Supervised Machine Learning Tradisional Untuk Klasifikasi Teks User Feedback Dalam Bahasa Indonesia

Natural language processing (NLP) merupakan cabang dari artificial intelligence yang sedang populer belakangan ini. Walaupun beberapa penelitian state of the art masih kebanyakan berfokus pada bahasa yang dominan di dunia ini seperti Bahasa Inggris, penelitian NLP untuk Bahasa Indonesia juga berkembang dengan cukup pesat. Salah satu cabang dari penelitian terkait NLP adalah automatic text classification. Terdapat berbagai metode dan teknik yang digunakan untuk membuat suatu aplikasi/program untuk automatic text classification, salah satu kategori yang populer adalah traditional supervised machine learning (non-deep learning). Penelitian ini berfokus untuk mengimplementasikan metode-metode supervised machine learning seperti Linear Regression, Decision Tree, Multinomial Naïve Bayes, K-Nearest Neighbors, LinearSVC, dan Random Forest serta lalu mengevaluasi hasil performa metode-metode tersebut. Dataset yang digunakan pada aplikasi ini merupakan dataset user feedback yang nyata didapatkan dari sebuah piranti lunak yang akan diklasifikasikan secara otomatis untuk membantu para software engineer yang terlibat. Proses ini cukup krusial dalam pengolahan data feedback untuk mendukung proses analisis kebutuhan yang cukup memakan waktu bila harus dilakukan secara manual satu persatu. Hasil akhir dari penelitian ini diharapkan dapat berguna untuk komunitas NLP dan Software Engineering, terutama yang bekerja dengan bahasa Indonesia, dengan memberikan insight-insight terkait performa metode-metode yang ada sekarang ini.