{"title":"使用随机森林算法和C4.5对学生学术成就的预测","authors":"Safitri Linawati, Siti Nurdiani, Kartika Handayani, Latifah Latifah","doi":"10.31294/JKI.V8I1.7827","DOIUrl":null,"url":null,"abstract":"Pada tahun akademik pertama rata-rata hasil belajar mahasiswa menimbulkan berbagai masalah yang akan berdampak pada semester selanjutnya. Evaluasi keberhasilan penyelenggaraan program studi pada suatu perguruan tinggi dilihat dari hasil belajar mahasiswa. Metode data mining mungkin bisa mengidentifikasi model yang tepat untuk memperbaiki setiap permasalahan yang timbul agar dapat ditangani oleh dosen yang bersangkutan. Tujuan penelitian ini untuk menerapkan metode data mining untuk prediksi prestasi akademik mahasiswa dengan mengeksplorasi berbagai parameter. Kami mengusulkan teknik data mining yang efisien untuk memprediksi prestasi akademik mahasiswa. Dengan teknik klasifikasi dari data mining yaitu Decision Tree C4.5 dan Random Forest. Tahap penelitian yang dilakukan adalah melakukan pre-processing pada dataset yaitu melakukan pengkodean pada nilai atribut yang non-numerik, kemudian dilakukan pengujian cross-validation. Dan untuk membangun model prediksi prestasi akademik mahasiswa, kami melakukan proses klasifikasi menggunakan metode Decision Tree C4.5 dan Random Forest. Metode yang digunakan dalam pengujian penelitian ini yaiut Confusion Matrix yaitu suatu metode yang biasanya digunakan dalam melakukan perhitungan akurasi pada suatu data mining. Perhitungan yang dihasilkan terdiri recall, acuraccy dan precision. Hasil dari pengujian dengan model klasifikasi Decision Tree C4.5 dan Random Forest pada penelitian ini menunjukkan bahwa model klasifikasi Random Forest memiliki nilai accuracy sebesar 92.4%, precision sebesar 91.4% dan recall sebesar 92,4% lebih tinggi dibandingkan Decision Tree C4.5.","PeriodicalId":384112,"journal":{"name":"Jurnal Khatulistiwa Informatika","volume":"23 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2020-06-25","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"4","resultStr":"{\"title\":\"PREDIKSI PRESTASI AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA RANDOM FOREST DAN C4.5\",\"authors\":\"Safitri Linawati, Siti Nurdiani, Kartika Handayani, Latifah Latifah\",\"doi\":\"10.31294/JKI.V8I1.7827\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Pada tahun akademik pertama rata-rata hasil belajar mahasiswa menimbulkan berbagai masalah yang akan berdampak pada semester selanjutnya. Evaluasi keberhasilan penyelenggaraan program studi pada suatu perguruan tinggi dilihat dari hasil belajar mahasiswa. Metode data mining mungkin bisa mengidentifikasi model yang tepat untuk memperbaiki setiap permasalahan yang timbul agar dapat ditangani oleh dosen yang bersangkutan. Tujuan penelitian ini untuk menerapkan metode data mining untuk prediksi prestasi akademik mahasiswa dengan mengeksplorasi berbagai parameter. Kami mengusulkan teknik data mining yang efisien untuk memprediksi prestasi akademik mahasiswa. Dengan teknik klasifikasi dari data mining yaitu Decision Tree C4.5 dan Random Forest. Tahap penelitian yang dilakukan adalah melakukan pre-processing pada dataset yaitu melakukan pengkodean pada nilai atribut yang non-numerik, kemudian dilakukan pengujian cross-validation. Dan untuk membangun model prediksi prestasi akademik mahasiswa, kami melakukan proses klasifikasi menggunakan metode Decision Tree C4.5 dan Random Forest. Metode yang digunakan dalam pengujian penelitian ini yaiut Confusion Matrix yaitu suatu metode yang biasanya digunakan dalam melakukan perhitungan akurasi pada suatu data mining. Perhitungan yang dihasilkan terdiri recall, acuraccy dan precision. Hasil dari pengujian dengan model klasifikasi Decision Tree C4.5 dan Random Forest pada penelitian ini menunjukkan bahwa model klasifikasi Random Forest memiliki nilai accuracy sebesar 92.4%, precision sebesar 91.4% dan recall sebesar 92,4% lebih tinggi dibandingkan Decision Tree C4.5.\",\"PeriodicalId\":384112,\"journal\":{\"name\":\"Jurnal Khatulistiwa Informatika\",\"volume\":\"23 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2020-06-25\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"4\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Jurnal Khatulistiwa Informatika\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.31294/JKI.V8I1.7827\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Khatulistiwa Informatika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.31294/JKI.V8I1.7827","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
PREDIKSI PRESTASI AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA RANDOM FOREST DAN C4.5
Pada tahun akademik pertama rata-rata hasil belajar mahasiswa menimbulkan berbagai masalah yang akan berdampak pada semester selanjutnya. Evaluasi keberhasilan penyelenggaraan program studi pada suatu perguruan tinggi dilihat dari hasil belajar mahasiswa. Metode data mining mungkin bisa mengidentifikasi model yang tepat untuk memperbaiki setiap permasalahan yang timbul agar dapat ditangani oleh dosen yang bersangkutan. Tujuan penelitian ini untuk menerapkan metode data mining untuk prediksi prestasi akademik mahasiswa dengan mengeksplorasi berbagai parameter. Kami mengusulkan teknik data mining yang efisien untuk memprediksi prestasi akademik mahasiswa. Dengan teknik klasifikasi dari data mining yaitu Decision Tree C4.5 dan Random Forest. Tahap penelitian yang dilakukan adalah melakukan pre-processing pada dataset yaitu melakukan pengkodean pada nilai atribut yang non-numerik, kemudian dilakukan pengujian cross-validation. Dan untuk membangun model prediksi prestasi akademik mahasiswa, kami melakukan proses klasifikasi menggunakan metode Decision Tree C4.5 dan Random Forest. Metode yang digunakan dalam pengujian penelitian ini yaiut Confusion Matrix yaitu suatu metode yang biasanya digunakan dalam melakukan perhitungan akurasi pada suatu data mining. Perhitungan yang dihasilkan terdiri recall, acuraccy dan precision. Hasil dari pengujian dengan model klasifikasi Decision Tree C4.5 dan Random Forest pada penelitian ini menunjukkan bahwa model klasifikasi Random Forest memiliki nilai accuracy sebesar 92.4%, precision sebesar 91.4% dan recall sebesar 92,4% lebih tinggi dibandingkan Decision Tree C4.5.