Pendahuluan:
Perkembangan aplikasi yang sangat pesat dalam beberapa tahun terakhir telah menjadikan aplikasi mobile sebagai bagian yang tidak terpisahkan dari kehidupan masyarakat modern saat ini. Aplikasi mobile menawarkan beragam solusi praktis untuk berbagai permasalahan dan kebutuhan masyarakat, mulai dari onlineshop, transportasi, hiburan, hingga kesehatan.
Khusus untuk aplikasi layanan kesehatan, popularitasnya kian meningkat signifikan belakangan ini. Hal ini dikarenakan aplikasi jenis ini memberikan kemudahan akses bagi masyarakat untuk mendapatkan informasi terkait penyakit, obat-obatan, pola hidup sehat, dan sebagainya. Sayangnya, banyak aplikasi kesehatan yang ada masih mengecewakan pengguna karena fitur yang terbatas, respon yang lambat, sulit digunakan, dan berbagai permasalahan lainnya.
Oleh sebab itu, penelitian ini bertujuan untuk mengembangkan sistem analisis sentimen yang dapat digunakan untuk mengevaluasi tingkat kepuasan pengguna terhadap aplikasi layanan kesehatan di Indonesia. Dengan adanya sistem analisis sentimen ini, pengguna dapat memilih aplikasi kesehatan mana yang paling recommended berdasarkan sentimen positif mayoritas pengguna lainnya.
Dalam penelitian ini, data ulasan pengguna diambil dari tiga aplikasi populer di Google Play Store, yaitu Halodoc, Alodokter, dan Klikdokter. Data di-scrape pada September 2022 dan berhasil dikumpulkan sebanyak 9.310 data ulasan. Data tersebut kemudian dilabeli secara manual menjadi 4.950 ulasan positif dan 4.360 ulasan negatif.
Beberapa tahap pra-pemrosesan dilakukan terhadap data ulasan, meliputi case folding, cleaning, stopword removal, tokenisasi, dan normalisasi. Tujuannya adalah membersihkan data agar sesuai sebagai masukan untuk proses klasifikasi sentimen. Setelah itu, data dibagi menjadi tiga bagian, yaitu data latih 70%, data validasi 10%, dan data uji 20%.
Metode:
Metode yang digunakan dalam penelitian ini adalah IndoBERT, yaitu model pra-pelatihan (pre-trained model) khusus untuk pemrosesan bahasa Indonesia berbasis arsitektur transformer. IndoBERT telah dilatih dengan dataset teks dalam Bahasa Indonesia sebesar 220 juta kata. Dengan demikian, IndoBERT memiliki representasi konteks semantik yang sangat baik untuk bahasa Indonesia.
Model IndoBERT kemudian dilatih ulang (fine tuning) menggunakan data ulasan aplikasi kesehatan agar dapat mengklasifikasikan sentimen positif dan negatif dengan akurat. Proses fine tuning dilakukan selama 10 epoch dengan menggunakan optimizer Adam dan learning rate 1e-6. Model yang sudah dilatih kemudian diuji performanya menggunakan data uji.
Hasil:
Hasil pengujian menunjukkan akurasi klasifikasi sentimen sebesar 96%, presisi 95%, recall 96%, dan F1-score 95%. Ini merupakan pencapaian yang sangat baik dan unggul dibandingkan penelitian sebelumnya yang juga melakukan analisis sentimen pada ulasan aplikasi kesehatan Indonesia dengan metode lain, seperti Fast Large-Margin (92.33% akurasi) dan Bidirectional LSTM (80.88% akurasi). Dengan memanfaatkan metode pelatihan awal IndoBERT, penelitian ini memberikan wawasan berharga tentang kelebihan dan kekurangan aplikasi layanan kesehatan di Google Play Store.
Kesimpulan:
Dengan demikian, penelitian ini berhasil membuktikan bahwa penerapan IndoBERT sebagai model transfer learning sangat efektif untuk analisis sentimen teks berbahasa Indonesia, khususnya pada kasus ulasan aplikasi layanan kesehatan. Kontribusi utama dari penelitian ini adalah mengembangkan sistem yang dapat membantu pengguna memilih aplikasi kesehatan terbaik berdasarkan sentimen mayoritas pengguna lainnya.
Ke depannya, penelitian ini dapat ditingkatkan dengan memperbesar variasi dan jumlah data latih agar performa model semakin meningkat. Selain itu, eksplorasi hyperparameter dan arsitektur model yang lebih optimal dapat dilakukan. Dengan demikian, sistem analisis sentimen ini dapat terus dikembangkan untuk mendukung masyarakat Indonesia dalam mengakses layanan kesehatan digital terbaik melalui aplikasi mobile.
Link Paper:
https://thesai.org/Publications/ViewPaper?Volume=14&Issue=8&Code=IJACSA&SerialNo=13