EXTREME GRADIENT BOOSTING SEBAGAI MODEL PENGELOMPOKAN PENCEMARAN UDARA DI DKI JAKARTA

Tua, Sitanggang Immanuel Urat Mangido and Kusuma, Dine Tiara and Arvio, Yozika (2025) EXTREME GRADIENT BOOSTING SEBAGAI MODEL PENGELOMPOKAN PENCEMARAN UDARA DI DKI JAKARTA. Diploma thesis, ITPLN.

[thumbnail of 202131172_Sitanggang Immanuel_Revisi_Skripsi_SITANGGANG IMMANUEL.pdf] Text
202131172_Sitanggang Immanuel_Revisi_Skripsi_SITANGGANG IMMANUEL.pdf
Restricted to Registered users only

Download (4MB)

Abstract

Pencemaran udara di DKI Jakarta merupakan masalah serius yang memerlukan sistem klasifikasi mutu udara yang akurat untuk memantau kondisi lingkungan secara efektif. Permasalahan utama meliputi ketidakseimbangan data (78.5% kategori Sedang, 12.4% Baik, dan 9.04% Tidak Sehat) serta kompleksitas parameter polutan (PM10, PM2.5, SO2, CO, O3, NO2). Untuk mengatasi hal ini, penelitian ini menawarkan solusi pengelompokan kualitas udara di DKI Jakarta ke dalam tiga kategori, yaitu Baik, Sedang, dan Tidak Sehat, menggunakan model Extreme Gradient Boosting (XGBoost) yang dioptimasi dengan Grid Search dan SMOTE untuk menangani ketidakseimbangan data. Hasil penelitian menunjukkan bahwa model berhasil mengklasifikasikan kualitas udara dengan akurasi 98,07%, di mana PM2.5 menjadi parameter paling berpengaruh (kontribusi 80,59%). Evaluasi menggunakan confusion matrix menunjukkan performa yang sangat baik dengan recall 100% untuk kategori Tidak Sehat, menjadikan model ini sangat efektif dalam mendeteksi kondisi udara berbahaya. Tingkat akurasi yang tinggi (98,79% ± 1,45% dalam cross-validation) membuktikan stabilitas model, melebihi kebutuhan minimum akurasi 85%. Penelitian ini memberikan kerangka kerja yang kuat untuk sistem pemantauan kualitas udara real-time serta rekomendasi perbaikan data bagi instansi terkait.

Air pollution in DKI Jakarta is a critical issue that requires an accurate air quality classification system for effective environmental monitoring. The main challenges include data imbalance (78.5% Moderate, 12.4% Good, and 9.04% Unhealthy) and the complexity of pollutant parameters (PM10, PM2.5, SO2, CO, O3, NO2). To address this, this study proposes a solution for classifying air quality in DKI Jakarta into three categories: Good, Moderate, and Unhealthy, using an Extreme Gradient Boosting (XGBoost) model optimized with Grid Search and SMOTE to handle class imbalance. The results show that the model successfully classifies air quality with an accuracy of 98.07%, where PM2.5 is the most influential parameter (80.59% contribution). Evaluation using a confusion matrix demonstrates excellent performance, with 100% recall for the Unhealthy category, making the model highly effective in detecting hazardous air conditions. The high accuracy (98.79% ± 1.45% in cross-validation) confirms the model’s stability, exceeding the minimum requirement of 85% accuracy. This study provides a robust framework for real-time air quality monitoring systems and offers data improvement recommendations for government environmental agencies.

Item Type: Thesis (Diploma)
Uncontrolled Keywords: XGBoost, Klasifikasi Kualitas Udara, ISPU, Prediksi Polusi, DKI Jakarta XGBoost, Air Quality Classification, Air Pollution Standard Index (ISPU), Pollution Prediction, DKI Jakarta
Subjects: Skripsi
Bidang Keilmuan > Teknik Informatika
Divisions: Fakultas Telematika Energi > S1 Teknik Informatika
Depositing User: Sudarman
Date Deposited: 15 Oct 2025 03:14
Last Modified: 15 Oct 2025 03:14
URI: https://repository.itpln.ac.id/id/eprint/2324

Actions (login required)

View Item
View Item