PENILAIAN KUALITAS UDARA DAN ANALISIS POLUSI BERBASIS ALGORITMA NAIVE BAYES DAN KLUSTRERISASI DATA DENGAN K-MEANS

Authors

  • Baik Budi Universitas Andalas

DOI:

https://doi.org/10.23960/jitet.v13i3S1.7630

Abstract Views: 54 File Views: 52

Keywords:

machine learning, naive bayes, k means

Abstract

Penelitian ini bertujuan untuk mengevaluasi kualitas udara serta tingkat polusi menggunakan algoritma Gaussian Naive Bayes sebagai metode klasifikasi. Algoritma ini didasarkan pada Teorema Bayes dengan asumsi bahwa setiap variabel fitur saling independen. Data yang digunakan berupa dataset kualitas udara yang telah di kelompokkan ke dalam beberapa kategori. Evaluasi model dilakukan menggunakan metrik akurasi, precision, recall, f1-score, dan confusion matrix. Hasil pengujian memperlihatkan bahwa model mampu memperoleh akurasi 93% pada data uji. Kategori “Good” menunjukkan performa terbaik dengan nilai precision, recall, dan f1-score mendekati 1.00. Kategori “Moderate” juga menampilkan hasil konsisten dengan precision dan recall sekitar 0.94. Sementara itu, kategori “Hazardous” memiliki precision 0.88, sedangkan kategori “Poor” memperoleh precision terendah, yaitu 0.79, karena sering tertukar dengan kelas lain. Meski begitu, recall dan f1-score kategori “Poor” tetap berada pada tingkat yang cukup baik. Confusion matrix menunjukkan bahwa sebagian besar prediksi berada pada klasifikasi yang tepat. Selain itu, hasil klasterisasi menggunakan K-Means mengindikasikan bahwa nilai k optimal adalah 4 sesuai dengan titik elbow, yang konsisten dengan jumlah kategori kualitas udara dalam penelitian ini.

Downloads

Download data is not yet available.

References

World Health Organization. 2018. “Ambient Air Pollution: Health Impacts.” World Health Organization. https://www.who.int/airpollution

Resti, Yulia, dkk. 2024. “Ensemble of Naive Bayes, Decision Tree, and Random Forest to Predict Air Quality.” 2024 International Conference on Computer Engineering and Informatics (ICCEI): 1–6. https://ieeexplore.ieee.org/document/10451499

Sodiq, Muhammad, dan M. Ja’far. 2020. “Perbandingan Naive Bayes dan K-NN dalam Klasifikasi Kualitas Udara.” Jurnal Teknik Informatika 15(2):75–82. http://journal.unair.ac.id/article_2020NB-KNN

Annas, Ahmad, dkk. 2022. “Using K-Means and SOM in Clustering Air Pollution in Makassar.” Procedia Computer Science 197: 179–186. https://www.sciencedirect.com/science/article/pii/S18 77050922001801

Ramli, Noor Ainy, dan Mohd Maizan Wahid. 2019. “Clustering of Air Pollution Data Using K-Means: A Case Study in Malaysia.” Climate 7(5): 67. https://www.mdpi.com/2225-1154/7/5/67

Matin, M. (2023). Air Quality and Pollution Assessment Dataset. Kaggle. Retrieved from: https://www.kaggle.com/datasets/mujtabamatin/air- quality-and-pollution-assessment/data

Aggarwal, C. C. (2015). Data Mining: The Textbook. Springer.

Witten, I. H., Frank, E., Hall, M. A., & Pal, C. J. (2016). Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann.

Y. Chen dan X. Li, "A Comparative Study of Naive Bayes Variants for Environmental Data Classification," J. Environ. Inform., vol. 36, no. 2, pp. 112-125, 2020.

L. Vargas et al., "Customer Segmentation in Finance," J. Financ. Serv. Mark, 2021.

L. Wang et al., "Optimizing K-Means Clustering for Urban Air Pollution Analysis," IEEE Trans. Geosci. Remote Sens., vol. 60, pp. 1-12, 2022.

AutoElbow: An Automatic Elbow Detection Method for Estimating the Number of Clusters in a Dataset. Applied Sciences, 12(15), 7515. https://www.mdpi.com/2076-3417/12/15/7515

Tan, P., et al. (2021). "Cluster Validation Metrics: A Comparative Analysis." Pattern Recognition Letters, 145, 1-8.

Gupta, S., & Kumar, P. (2021). "Handling Class Imbalance in Machine Learning: A Case Study on Air Quality Data." Machine Learning Applications, 8(3), 45-59.

H. Lee and S. Park, "Ensemble Methods for Air Quality Prediction: A Survey," Atmospheric Environment, vol. 289, p. 119301, 2022.

T. K. Al Lutfani, R. Astuti, W. Prihartono, and R. Hamonangan, “Penerapan Naive Bayes untuk Analisis Sentimen pada Ulasan Pelanggan di Lazada: Studi Kasus Toko Mawar Collection,” Jurnal Informatika dan Teknik Elektro Terapan (JITET), vol. 13, no. 2, pp. 189–196, 2025. [Online]. Available:

https://journal.eng.unila.ac.id/index.php/jitet/article/view/6391

Downloads

Published

2025-10-19

How to Cite

Budi, B. . (2025). PENILAIAN KUALITAS UDARA DAN ANALISIS POLUSI BERBASIS ALGORITMA NAIVE BAYES DAN KLUSTRERISASI DATA DENGAN K-MEANS. Jurnal Informatika Dan Teknik Elektro Terapan, 13(3S1). https://doi.org/10.23960/jitet.v13i3S1.7630

Issue

Section

Articles