Analisis Pola Kecelakaan Lalu Lintas Menggunakan Algoritma Decision Tree Berdasarkan Ekstraksi Informasi dari Berita Online Menggunakan Named Entity Recognition (NER)
{"title":"Analisis Pola Kecelakaan Lalu Lintas Menggunakan Algoritma Decision Tree Berdasarkan Ekstraksi Informasi dari Berita Online Menggunakan Named Entity Recognition (NER)","authors":"Hardi Susanto, Budi Yuniarto","doi":"10.34123/semnasoffstat.v2023i1.1751","DOIUrl":null,"url":null,"abstract":"Jalan tol sebagai jalan bebas hambatan tidak membuat jalan tol terbebas dari kecelakaan lalu lintas. Di Provinsi Jawa Barat, terdapat total 20 ruas tol dengan panjang ruas tol mencapai 521,15 km pada 2020. Tol Cipali adalah salah satu ruas dengan fatalitas tertinggi di dunia. Penanggulangan kecelakaan lalu lintas penting dilakukan sebagai upaya untuk mengurangi kejadian kecelakaan lalu lintas. Namun, data official mengenai kecelakaan lalu lintas di jalan tol oleh lembaga resmi tidak tersedia secara rinci, sehingga digunakan sumber data alternatif seperti berita online. NER dengan Bi-LSTM-CNN dimanfaatkan untuk melakukan ekstraksi data kecelakaan. Hasil dari ekstraksi berita dianalisis dengan membuat aturan keputusan untuk mengetahui pola kecelakaan yang terjadi. Aturan keputusan ini berupa decision tree dengan dataset yang menggunakan data tiga tol dengan fatalitas tertinggi dengan fitur imputasi mode by concept sebagai metode penanganan missing value dan jalan tol sebagai atribut, menghasilkan nilai f1-score sebesar 67,76% dan nilai akurasi sebesar 75,49%.","PeriodicalId":213816,"journal":{"name":"Seminar Nasional Official Statistics","volume":"33 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Seminar Nasional Official Statistics","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.34123/semnasoffstat.v2023i1.1751","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
Jalan tol sebagai jalan bebas hambatan tidak membuat jalan tol terbebas dari kecelakaan lalu lintas. Di Provinsi Jawa Barat, terdapat total 20 ruas tol dengan panjang ruas tol mencapai 521,15 km pada 2020. Tol Cipali adalah salah satu ruas dengan fatalitas tertinggi di dunia. Penanggulangan kecelakaan lalu lintas penting dilakukan sebagai upaya untuk mengurangi kejadian kecelakaan lalu lintas. Namun, data official mengenai kecelakaan lalu lintas di jalan tol oleh lembaga resmi tidak tersedia secara rinci, sehingga digunakan sumber data alternatif seperti berita online. NER dengan Bi-LSTM-CNN dimanfaatkan untuk melakukan ekstraksi data kecelakaan. Hasil dari ekstraksi berita dianalisis dengan membuat aturan keputusan untuk mengetahui pola kecelakaan yang terjadi. Aturan keputusan ini berupa decision tree dengan dataset yang menggunakan data tiga tol dengan fatalitas tertinggi dengan fitur imputasi mode by concept sebagai metode penanganan missing value dan jalan tol sebagai atribut, menghasilkan nilai f1-score sebesar 67,76% dan nilai akurasi sebesar 75,49%.