MODEL KLASIFIKASI TWEET TERKAIT ISU #INDONESIAGELAP MENGGUNAKAN SUPPORT VECTOR MACHINE BERBASIS DISTRIBUSI TOPIK LDA
DOI:
https://doi.org/10.23960/jitet.v14i1.8878Abstract Views: 49 File Views: 45
Keywords:
Sentiment Analysis, Support Vector Machine, Otomated Labeling, Topic Modeling, Latent Dirichlet Allocation, #IndonesiaGelapAbstract
Abstrak. Tagar #IndonesiaGelap di platform X mencerminkan keresahan masyarakat terhadap dinamika sosial-politik Indonesia. Tingginya volume data tweet terkait tagar ini menghadirkan tantangan praktis dalam pengembangan model klasifikasi teks. Kendala utama terletak pada proses pelabelan data untuk supervised learning, di mana pelabelan manual pada dataset berskala besar menjadi tidak efisien dan memakan waktu lama. Penelitian ini bertujuan untuk mengembangkan model klasifikasi teks sekaligus menyelesaikan permasalahan efisiensi pelabelan tersebut melalui pendekatan otomatis. Metode yang diusulkan mengintegrasikan Latent Dirichlet Allocation (LDA) sebagai generator label otomatis (automated labeling) dan Support Vector Machine (SVM) sebagai pengklasifikasi. LDA digunakan untuk mengekstraksi struktur topik tersembunyi yang kemudian dikonversi menjadi label kategori untuk data latih. Hasil eksperimen menunjukkan bahwa LDA berhasil membentuk 6 label topik yang koheren. Model SVM yang dilatih menggunakan data berlabel otomatis ini, melalui optimasi hyperparameter Kernel RBF, mampu mencapai akurasi sebesar 88,05%. Penelitian ini membuktikan bahwa integrasi LDA dan SVM merupakan solusi strategis untuk mengatasi hambatan pelabelan data, memungkinkan pembangunan model klasifikasi yang akurat pada data media sosial berskala besar tanpa memerlukan intervensi manual.
Abstract. The #IndonesiaGelap hashtag on the X platform reflects public unrest regarding Indonesia's socio-political dynamics. The high volume of tweets regarding this hastag presents practical challenges in developing text classification models. The primary obstacle lies in the data labeling process for supervised learning, where manual labeling on large-scale datasets is inefficient and time-consuming. This study aims to develop a text classification model while solving the labeling efficiency problem through an automated approach. The proposed method integrates Latent Dirichlet Allocation (LDA) as an automated label generator and Support Vector Machine (SVM) as a classifier. LDA is utilized to extract hidden topic structures, which are then converted into category labels for training data. Experimental results show that LDA successfully formed 6 coherent topic labels. The SVM model trained using this automatically labeled data, through RBF Kernel hyperparameter optimization, achieved an accuracy of 88.05%. This study demonstrates that the integration of LDA and SVM is a strategic solution to overcome data labeling bottlenecks, enabling the construction of accurate classification models on massive social media data without the need for manual intervention.
Downloads
References
A. Clairine, E. I. D. Lestari, E. N. Wiyono, and M. W. R, “Ekspresi Keresahan Pemuda melalui Media Sosial: Studi Kritik terhadap Narasi Indonesia Gelap,” Moderasi: Jurnal Studi Ilmu Pengetahuan Sosial, vol. 6, no. 1, pp. 36–51, Jun. 2025, doi: 10.24239/MODERASI.VOL6.ISS1.491.
A. M. Nur, E. Kurniawan, and R. Supriadi, “Unveiling Public Sentiment and Ideation Patterns in the #IndonesiaGelap Discourse through Appraisal Theory: A Corpus-Based Analysis,” IJLECR (International Journal of Language Education and Cultural Review), vol. 11, no. 1, pp. 48–58, Jun. 2025, doi: 10.21009/IJLECR.V11I1.55014.
F. Abdusyukur, “Penerapan Algoritma Support Vector Machine (Svm) Untuk Klasifikasi Pencemaran Nama Baik Di Media Sosial Twitter,” Komputa : Jurnal Ilmiah Komputer dan Informatika, vol. 12, no. 1, pp. 73–82, May 2023, doi: 10.34010/KOMPUTA.V12I1.9418.
P. Studi Informatika, F. Matematika dan Ilmu Pengetahuan Alam, J. Raya Kampus Udayana, B. Jimbaran, and K. Selatan, “Analisis Klasifikasi Tweet Berdasarkan Topik Sosial Menggunakan SVM,” Jurnal Nasional Teknologi Informasi dan Aplikasinya , vol. 3, no. 4, pp. 855–864, Aug. 2025, doi: 10.24843/JNATIA.2025.V03.I04.P15.
A. K. Dewi, N. F. Rahmadani, R. Syahputri, L. R. Nasution, and M. Furqon, “Deteksi Berita Hoax Pada Platform X Menggunakan Pendekatan Text Mining dan Algoritma Machine Learning,” Data Sciences Indonesia (DSI), vol. 5, no. 1, pp. 33–46, Jul. 2025, doi: 10.47709/DSI.V5I1.6011.
G. Aditra Pradnyana, I. Gede, and M. Darmawiguna, “Web-Based System for Bali Tourism Sentiment Analysis during The Covid-19 Pandemic using Django Web Framework and Naive Bayes Method,” Proceedings of the 4th International Conference on Innovative Research Across Disciplines (ICIRAD 2021), vol. 613, pp. 316–320, Dec. 2021, doi: 10.2991/ASSEHR.K.211222.050.
R. Rakhmat Sani, Y. Ayu Pratiwi, S. Winarno, E. Devi Udayanti, and dan Farrikh Al Zami, “Analisis Perbandingan Algoritma Naive Bayes Classifier dan Support Vector Machine untuk Klasifikasi Berita Hoax pada Berita Online Indonesia,” Jurnal Masyarakat Informatika, vol. 13, no. 2, pp. 85–98, Nov. 2022, doi: 10.14710/JMASIF.13.2.47983.
I. N. S. W. Wijaya, K. A. Seputra, and N. P. N. P. Dewi, “Fine Tunning Model Indobert Untuk Analisis Sentimen Berita Pariwisata Indonesia,” Jurnal Pendidikan Teknologi dan Kejuruan, vol. 22, no. 2, pp. 195–204, Jul. 2025, doi: 10.23887/JPTK-UNDIKSHA.V22I2.104056.
B. Yin and C. H. Yuan, “Detecting latent topics and trends in blended learning using LDA topic modeling,” Educ Inf Technol (Dordr), vol. 27, no. 9, pp. 12689–12712, Nov. 2022, doi: 10.1007/S10639-022-11118-0/FIGURES/1.
O. Ozyurt, H. Özköse, and A. Ayaz, “Evaluating the latest trends of Industry 4.0 based on LDA topic model,” Journal of Supercomputing, vol. 80, no. 13, pp. 19003–19030, Sep. 2024, doi: 10.1007/S11227-024-06247-X/METRICS.
G. A. Pradnyana, I. G. M. Darmawiguna, D. K. S. Suditresna Jaya, and A. Sasmita, “Performance analysis of support vector machines with polynomial kernel for sentiment polarity identification: A case study in lecturer’s performance questionnaire,” J Phys Conf Ser, vol. 1810, no. 1, p. 012033, Mar. 2021, doi: 10.1088/1742-6596/1810/1/012033.
N. L. P. R. Dewi, I. N. S. W. Wijaya, I. K. Purnamawan, and N. W. Marti, “Model Classifer Judul Berita Pariwisata Indonesia Berdasarkan Sentimen,” Jurnal Teknologi Informasi dan Ilmu Komputer, vol. 11, no. 1, pp. 117–124, Feb. 2024, doi: 10.25126/JTIIK.20241117617.
S. Berliani and S. Lestari, “Analisis Sentimen Masyarakat Terhadap Isu Pecat Sri Mulyani Pada Twitter Menggunakan Metode Naive Bayes Dan Support Vector Machine,” Jurnal Sains dan Teknologi, vol. 5, no. 3, pp. 951–960, Apr. 2024, doi: 10.55338/SAINTEK.V5I3.2746.
S. Nauli, S. S. Berutu, H. Budiati, and F. Maedjaja, “Klasifikasi Kalimat Perundungan Pada Twitter Menggunakan Algoritma Support Vector Machine,” JIPI (Jurnal Ilmiah Penelitian dan Pembelajaran Informatika), vol. 10, no. 1, pp. 107–122, Jan. 2025, doi: 10.29100/JIPI.V10I1.5749.
A. Fatmawati, U. Latifah, A. S. B. Suryadi, and T. K. Zuhriya, “Klasifikasi Emosi Teks Pengguna Twitter Menggunakan Metode SVM,” in Prosiding SEMNAS INOTEK (Seminar Nasional Inovasi Teknologi), 2025, pp. 1999–2007.
M. Ihsan, M. Ihsan, and D. Desmulyati, “Klasifikasi Tweet Influencer NU Dengan GNPF-Ulama Menggunakan Naive Bayes Dan Support Vector Machine,” Jurnal Nasional Komputasi dan Teknologi Informasi (JNKTI), vol. 5, no. 3, pp. 358–363, Jun. 2022, doi: 10.32672/jnkti.v5i3.4276.
imelda amuis and M. Affandes, “Penerapan Metode Support Vector Machine (Svm) Menggunakan Kernel Radial Basis Faunction (Rbf) Pada Klasifikasi Tweet,” SITEKIN: Jurnal Sains, Teknologi dan Industri, vol. 12, no. 2, pp. 189–197, Jun. 2015, doi: 10.24014/SITEKIN.V12I2.1010.
Y. Matira, Junaidi, and I. Setiawan, “Pemodelan Topik pada Judul Berita Online Detikcom Menggunakan Latent Dirichlet Allocation,” ESTIMASI: Journal of Statistics and Its Application, pp. 53–63, Feb. 2023, doi: 10.20956/EJSA.VI.24843.
U. M. Sholihah, Y. Findawati, and U. Indahyanti, “Topic Modeling In Covid-19 Vaccination Refusal Cases Using Latent Dirichlet Allocation And Latent Semantic Analysis,” Jurnal Teknik Informatika (Jutif), vol. 4, no. 5, pp. 1063–1074, Oct. 2023, doi: 10.52436/1.JUTIF.2023.4.5.951.
D. M. Blei, A. Y. Ng, and M. I. Jordan, “Latent Dirichlet Allocation,” Journal of Machine Learning Research, vol. 3, 2003.
T. Irawan, L. Mutawalli, S. Fadli, and W. Bagye, “Topic Modelling Pola Komunikasi Pilpres 2024 Focus Web Scraping Dan Latent Dirichlet Allocation,” Jurnal Manajemen Informatika dan Sistem Informasi, vol. 7, no. 2, pp. 186–194, Jul. 2024, doi: 10.36595/MISI.V7I2.1183.
E. Puspita, F. Shiddieq, and F. F. Roji, “Pemodelan Topik pada Media Berita Online Menggunakan Latent Dirichlet Allocation (Studi Kasus Merek Somethinc),” MALCOM: Indonesian Journal of Machine Learning and Computer Science, vol. 4, no. 2, pp. 481–489, Feb. 2024, doi: 10.57152/MALCOM.V4I2.1204.
U. N. Khadijah and N. Cahyono, “Analisis Topic Modelling Pariwisata Yogyakarta Menggunakan Latent Dirichlet Allocation (LDA),” The Indonesian Journal of Computer Science, vol. 13, no. 4, Jul. 2024, doi: 10.33022/IJCS.V13I4.3816.
K. Pramayasa, I. Md, D. Maysanjaya, G. Ayu, and A. Diatri Indradewi, “Analisis Sentimen Program Mbkm Pada Media Sosial Twitter Menggunakan KNN Dan SMOTE,” SINTECH (Science and Information Technology) Journal, vol. 6, no. 2, pp. 89–98, Aug. 2023, doi: 10.31598/SINTECHJOURNAL.V6I2.1372.
D. Puspitasari and T. Sutabri, “Analisis Sentimen Berdasarkan pada Twitter (X) terhadap Layanan Indihome Menggunakan Algoritma Support Vector Machine (SVM),” JUMINTAL: Jurnal Manajemen Informatika dan Bisnis Digital, vol. 3, no. 2, pp. 58–71, Nov. 2024, doi: 10.55123/JUMINTAL.V3I2.4449.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2026 Jurnal Informatika dan Teknik Elektro Terapan

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.



