IMPLEMENTASI ETL DAN TOPIC MODELING MENGGUNAKAN ALGORITMA LATENT DIRICHLET ALLOCATION UNTUK IDENTIFIKASI TOPIK KRIMINAL PADA BERITA ONLINE
DOI:
https://doi.org/10.23960/jitet.v13i3S1.8041Abstract Views: 58
Keywords:
Extract, Tranform, Load (ETL), Latent Dirichlet Allocation (LDA), Berita Kriminal, Web Scraping.Abstract
Peningkatan angka kriminalitas di Indonesia berdampak pada semakin masifnya pemberitaan kejahatan di media daring. Data berita yang tidak terstruktur memerlukan pendekatan sistematis agar dapat dianalisis secara efektif. Penelitian ini bertujuan untuk mengimplementasikan proses Extract, Transform, Load (ETL) dan metode topic modeling menggunakan algoritma Latent Dirichlet Allocation (LDA) untuk mengidentifikasi topik kriminal pada artikel berita online, khususnya dari portal Detik.com. Data dikumpulkan melalui teknik web scraping, kemudian diproses melalui tahapan transformasi untuk pembersihan dan standarisasi, serta dimuat ke dalam basis data agar lebih terorganisasi. Selanjutnya, dilakukan text preprocessing dan representasi teks menggunakan Bag of Words sebelum dimodelkan dengan LDA. Hasil penelitian menunjukkan bahwa dari 4.105 artikel kriminal, diperoleh 7 topik utama, yaitu pencurian dan kekerasan fisik, kejahatan seksual dan kekerasan anak, kejahatan politik dan pelanggaran HAM, kekerasan bersenjata dan separatisme, kejahatan finansial dan narkotika, pembunuhan dan penganiayaan, serta pelanggaran hukum dan penyalahgunaan wewenang. Analisis tren menunjukkan dua topik dominan sepanjang periode penelitian, yakni pencurian serta kejahatan seksual. Temuan ini menegaskan pentingnya integrasi ETL dan LDA untuk memahami pola kriminalitas secara sistematis, serta dapat menjadi dasar pengambilan kebijakan berbasis data.
Downloads
References
Memengaruhi Jumlah Kriminalitas di Indonesia Dengan Regresi Data Panel Pada Tahun 2016-2020,” Indones. Counc. Prem. Stat. Sci., vol. 3, no. 2, p. 37, 2024, doi: 10.24014/icopss.v3i2.32237.
I. G. B. Premana Putra, M. Sudarma, and I. B. G. Manuaba, “Penerapan Metode Extreme Programming pada Rancang Bangun Sistem Analisis Sentimen Portal Berita,” J. Teknol. Inf. dan Ilmu Komput., vol. 10, no. 6, pp. 1369–1378, 2023, doi: 10.25126/jtiik.2023106904.
G. N. Zamroji, R. A. Syahputra, S. Z. Rohman, Y. P. Astuti, and I. F. Kurniawan, “Pipeline ETL Terdistribusi untuk Klasifikasi Berita Clickbait dan Topik Berita,” vol. 2025, no. Senada, pp. 165–174, 2025.
Fatmasari, Y. N. Kunang, and S. D. Purnamasari, “Web Scraping Techniques to Collect Weather Data in South Sumatera,” Proc. 2018 Int. Conf. Electr. Eng. Comput. Sci. ICECOS 2018, no. December, pp. 385–390, 2019, doi: 10.1109/ICECOS.2018.8605202.
M. J. Medea, V. P. Rantung, and O. Kembuan, “Metode Latent Dirichlet Allocation dalam Pemodelan Topik Headline Berita Online tentang Hukum dan Kriminal,” JOINTER J. Informatics Eng., vol. 5, no. 02, pp. 1–7, 2024, doi: 10.53682/jointer.v5i02.63.
E. L. Cohen, “Online Journalism as,” vol. 1, 2014.
F. Muiz, “98-Article Text-338-1-10-20220605,” vol. 3, no. 3, pp. 56–58, 2021.
T. S. T. SOWMYYA, “Crime: A Conceptual Understanding,” Indian J. Appl. Res., vol. 4, no. 3, pp. 196–198, 2011, doi: 10.15373/2249555x/mar2014/58.
A. A. Munajat and H. Yusuf, “Dinamika Kriminalitas Urban:Studi Tentang Faktor-Faktor Yang Mempengaruhi Tingkat Kejahatan Di Kota Besar Dynamics of Urban Criminality: a Study of the Factors Affecting Crime Rates in Large Cities,” JICN J. Intelek dan Cendikiawan Nusant., vol. 1, no. 2, pp. 1330–1339, 2024, [Online]. Available: https://jicnusantara.com/index.php/jicn
N. Mali, “A Survey of ETL Tools,” Int. J. Comput. Tech. -–, vol. 2, no. 5, pp. 20–27, 2015, [Online]. Available: http://www.ijctjournal.org
R. Mitchell, Ryan Mitchell Web Scraping with Python. 2018. [Online]. Available: www.allitebooks.com
A. Dwiyoga Widiantoro Mustafid Ridwan Sanjaya, Pengantar Nlp Dan Topik Model Lda Sampul Dalam. 2024.
S. Eisenstein, “Introduction,” Give Us Bread but Give Us Roses, pp. 9–17, 2020, doi: 10.4324/9780203103517-5.
D. M. Blei and A. Y. Ng, “Latent Dirichlet Allocation,” no. January 2001, 2014.
D. L. C. Pardede and M. A. I. Waskita, “Analisis Pemodelan Topik Untuk Ulasan Tentang Peduli Lindungi,” J. Ilm. Inform. Komput., vol. 28, no. 1, pp. 17–26, 2023, doi: 10.35760/ik.2023.v28i1.7925.
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Jurnal Informatika dan Teknik Elektro Terapan

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.



