Model Pengenalan Emosi Berbasis Suara Menggunakan Convolution Neural Network dan Gabor-Neural Network

Bidang penelitian di bidang pengenalan emosi secara otomatis merupakan salah satu bidang penelitian yang aktif di bidang affective computing. Beberapa penelitian telah berhasil membangun model komputasi yang dapat mengklasifikasi emosi menggunakan media suara. Walaupun demikian, penelitian-penelitian tersebut masih belum dapat mengklasifikasi semua emosi dasar manusia (marah, takut, sedih, senang, jijik, dan kaget). Model komputasi tersebut juga dibangun menggunakan data suara bahasa asing (bukan bahasa Indonesia), sehingga model tersebut belum tentu dapat langsung diterapkan di Indonesia karena adanya perbedaan bahasa (contoh: lafal, intonasi) dan budaya. Oleh karena itu masih dibutuhkan penelitian di bidang pengenalan emosi secara otomatis yang dapat mengklasifikasi emosi dasar berbasis bahasa Indonesia. 
Penelitian serupa telah berhasil membangun model Support Vector Machine (SVM), Neural Networkdan k-means clusteringyang mampu melakukan kiasifikasi ada / tidaknya emosi senang, sedih, dan marandengan menggunakan fitur durasi ucapan (hibah internal Universitas Multimedia Nusantara nomor 078/LPPM-UMN/lll/2016 dan 265/LPPM/UMN/III/2017). Model tersebut telah diuji coba dan berhasil mendapatkan akurasi antara 50% - 76.8%. Walaupun demikian, penelitian tersebut hanya mencakup tiga dari enam emosi dasar sehingga masih dibutuhkan penelitian lanjutan untuk emosi lainnya. 
Penelitian inimerupakan pengembangan dari penelitian tersebut dengan mencakup ke-enam emosi dasar.lntensitas emosi akan ditingkatkan diarahkan panduan visual ekspresi wajah melalui mimicry ucapan kata non-netral (menggunakan kata-kata yang cenderung mengarah ke emosi senang-sedih). Klasifikasi akan menggunakan convolution neural network dan neural networkdari spektogram dan ekstraksi filter Gabor.