Skripsi/Tugas Akhir
Penerapan Data Mining untuk Prediksi Penyakit Demam Berdarah Dengue Menggunakan Algoritma Decision Tree C4.5 di Puskesmas Tamalanrea
ABSTRAK
Tujuan dari penelitian ini adalah untuk menggunakan metode regresi linier untuk memprediksi jumlah kasus demam berdarah dengue (DBD) yang mungkin terjadi di wilayah kerja Puskesmas Tamalanrea pada tahun 2024. Data kasus DBD tahunan dari tahun 2018 hingga 2023 telah dikumpulkan dan dianalisis menggunakan platform Google Colab dengan bahasa pemrograman Python. Hasil prediksi menunjukkan tren penurunan jumlah kasus DBD pada tahun 2024, dengan estimasi maksimum 20,50 kasus dan minimum 18,95 kasus. Model regresi linier yang dikembangkan menunjukkan kinerja yang memuaskan dalam menjelaskan variabilitas data, dengan nilai R-squared sebesar 0,523 dan nilai adjusted R-squared sebesar 0,486. Hal ini menunjukkan bahwa model tersebut mampu menjelaskan lebih dari setengah variasi yang diamati pada data kasus DBD. Selain itu, nilai mean absolute error (MAE) sebesar 4,22 dan nilai mean absolute percentage error (MAPE) sebesar 22,90% menunjukkan bahwa model menunjukkan akurasi prediksi yang memadai. Sebagai perbandingan, eksplorasi awal dilakukan dengan menggunakan algoritma Decision Tree C4.5. Namun, fokus utama dari penelitian ini adalah pada pengembangan dan evaluasi model regresi linier, mengingat kesederhanaan interpretasi dan kemampuannya untuk memberikan pemahaman yang lebih baik mengenai hubungan antara variabel prediktor dan jumlah kasus DBD.
Kata Kunci— Demam Berdarah Dengue, Regresi Linear, Google Colab
ABSTRACT
The objective of this study is to utilise the linear regression method in order to predict the number of cases of dengue fever (DHF) that are likely to occur at the Tamalanrea Health Centre working area in 2024. The annual dengue case data from 2018 to 2023 has been collated and analysed using the Google Colab platform with the Python programming language. The results of the prediction indicate a downward trend in the number of DHF cases in 2024, with an estimated maximum of 20.50 cases and a minimum of 18.95 cases. The developed linear regression model demonstrated satisfactory performance in explaining the variability of the data, with an R-squared value of 0.523 and an adjusted R-squared value of 0.486. This suggests that the model is capable of explaining more than half of the observed variation in the dengue case data. Furthermore, the mean absolute error (MAE) value of 4.22 and the mean absolute percentage error (MAPE) value of 22.90% indicate that the model demonstrates adequate prediction accuracy. For comparison, an initial exploration was conducted using the C4.5 Decision Tree algorithm. However, the primary focus of this research is on the development and evaluation of linear regression models, given their simplicity of interpretation and ability to provide a more comprehensive understanding of the relationship between predictor variables and the number of DHF cases.
Keywords— Dengue Hemorrhagic Fever, Linear Reggresion, Google Colab
Tidak ada salinan data
Universitas DIPA Makassar
NPP 7371142D1000002
Jln. Perintis Kemerdekaan KM.9
Telp. (0411)587194
Hotline: +6281228221994
WhatsApp Admin: +6281342092072
e-Mail: [email protected]
© 2025 — Perpustakaan UNDIPA Makassar - SLiMS