Prediksi Kemungkinan Diabetes pada Tahap Awal Menggunakan Algoritma Klasifikasi Random Forest

Abstrak Diabetes adalah salah satu penyakit kronis yang mengancam jiwa dengan pertumbuhan tercepat yang telah mempengaruhi 422 juta orang di seluruh dunia menurut laporan Organisasi Kesehatan Dunia (WHO), pada tahun 2018. Diabetes dianggap sebagai salah satu penyakit paling mematikan dan kronis yang...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Sistemasi : jurnal sistem informasi (Online) 2021-01, Vol.10 (1), p.163-171
Hauptverfasser: Apriliah, Widya, Kurniawan, Ilham, Baydhowi, Muhamad, Haryati, Tri
Format: Artikel
Sprache:eng ; ind
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Abstrak Diabetes adalah salah satu penyakit kronis yang mengancam jiwa dengan pertumbuhan tercepat yang telah mempengaruhi 422 juta orang di seluruh dunia menurut laporan Organisasi Kesehatan Dunia (WHO), pada tahun 2018. Diabetes dianggap sebagai salah satu penyakit paling mematikan dan kronis yang menyebabkan peningkatan gula darah. Banyak komplikasi terjadi jika diabetes tetap tidak diobati dan tidak teridentifikasi. Namun, peningkatan pendekatan machine learning memecahkan masalah kritis ini. Tujuan dari penelitian ini adalah merancang model yang dapat memprakirakan kemungkinan terjadinya diabetes pada pasien dengan ketelitian yang maksimal. Klasifikasi adalah teknik data mining yang menetapkan kategori pada kumpulan data untuk membantu dalam memprediksi dan analisis yang lebih akurat. Oleh karena itu tiga algoritma klasifikasi machine learning yaitu Suport Vector Machine, Naive Bayes dan Random Forest digunakan dalam percobaan ini untuk mendeteksi diabetes secara dini. Eksperimen dilakukan menggunakan dataset Diabetes Hospital in Sylhet, Bangladesh yang bersumber dari UCI repository. Performa ketiga algoritma dievaluasi pada berbagai ukuran seperti Precision, Accuracy, F-Measure, dan Recall. Akurasi diukur melalui instance yang diklasifikasikan dengan benar dan salah. Hasil yang diperoleh menunjukkan Random Forest mengungguli dengan nilai akurasi tertinggi 97,88% dibandingkan algoritma lain. Hasil ini diverifikasi menggunakan kurva Receiver Operating Characteristic (ROC) secara tepat dan sistematis. Kata Kunci: diabetes, naive bayes, random forest, akurasi, support vector machine, machine learning   Abstract Diabetes is one of the fastest growing, life-threatening chronic diseases affecting 422 million people worldwide, according to a report by the World Health Organization (WHO) in 2018. Diabetes is considered to be one of the most deadly and chronic diseases that cause elevated blood sugar. Many complications occur if diabetes remains untreated and unidentified. However, an improved machine learning approach solves this critical problem. The aim of this study is to design a model that can predict the likelihood of diabetes occurr in patients with maximum accuracy. Therefore, three machine learning classification algorithms, namely Support Vector Machine, Naive Bayes and Random Forest, were used in this experiment to detect diabetes early. Experiments were conducted using the Diabetes Hospital in Sylhet, Bangladesh dataset sourced from the UCI reposi
ISSN:2302-8149
2540-9719
DOI:10.32520/stmsi.v10i1.1129