{"title":"基于使用命名实体识别(NER)从在线新闻中提取信息的决策树算法交通事故模式分析","authors":"Hardi Susanto, Budi Yuniarto","doi":"10.34123/semnasoffstat.v2023i1.1751","DOIUrl":null,"url":null,"abstract":"Jalan tol sebagai jalan bebas hambatan tidak membuat jalan tol terbebas dari kecelakaan lalu lintas. Di Provinsi Jawa Barat, terdapat total 20 ruas tol dengan panjang ruas tol mencapai 521,15 km pada 2020. Tol Cipali adalah salah satu ruas dengan fatalitas tertinggi di dunia. Penanggulangan kecelakaan lalu lintas penting dilakukan sebagai upaya untuk mengurangi kejadian kecelakaan lalu lintas. Namun, data official mengenai kecelakaan lalu lintas di jalan tol oleh lembaga resmi tidak tersedia secara rinci, sehingga digunakan sumber data alternatif seperti berita online. NER dengan Bi-LSTM-CNN dimanfaatkan untuk melakukan ekstraksi data kecelakaan. Hasil dari ekstraksi berita dianalisis dengan membuat aturan keputusan untuk mengetahui pola kecelakaan yang terjadi. Aturan keputusan ini berupa decision tree dengan dataset yang menggunakan data tiga tol dengan fatalitas tertinggi dengan fitur imputasi mode by concept sebagai metode penanganan missing value dan jalan tol sebagai atribut, menghasilkan nilai f1-score sebesar 67,76% dan nilai akurasi sebesar 75,49%.","PeriodicalId":213816,"journal":{"name":"Seminar Nasional Official Statistics","volume":"33 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Analisis Pola Kecelakaan Lalu Lintas Menggunakan Algoritma Decision Tree Berdasarkan Ekstraksi Informasi dari Berita Online Menggunakan Named Entity Recognition (NER)\",\"authors\":\"Hardi Susanto, Budi Yuniarto\",\"doi\":\"10.34123/semnasoffstat.v2023i1.1751\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Jalan tol sebagai jalan bebas hambatan tidak membuat jalan tol terbebas dari kecelakaan lalu lintas. Di Provinsi Jawa Barat, terdapat total 20 ruas tol dengan panjang ruas tol mencapai 521,15 km pada 2020. Tol Cipali adalah salah satu ruas dengan fatalitas tertinggi di dunia. Penanggulangan kecelakaan lalu lintas penting dilakukan sebagai upaya untuk mengurangi kejadian kecelakaan lalu lintas. Namun, data official mengenai kecelakaan lalu lintas di jalan tol oleh lembaga resmi tidak tersedia secara rinci, sehingga digunakan sumber data alternatif seperti berita online. NER dengan Bi-LSTM-CNN dimanfaatkan untuk melakukan ekstraksi data kecelakaan. Hasil dari ekstraksi berita dianalisis dengan membuat aturan keputusan untuk mengetahui pola kecelakaan yang terjadi. Aturan keputusan ini berupa decision tree dengan dataset yang menggunakan data tiga tol dengan fatalitas tertinggi dengan fitur imputasi mode by concept sebagai metode penanganan missing value dan jalan tol sebagai atribut, menghasilkan nilai f1-score sebesar 67,76% dan nilai akurasi sebesar 75,49%.\",\"PeriodicalId\":213816,\"journal\":{\"name\":\"Seminar Nasional Official Statistics\",\"volume\":\"33 1\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-10-04\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Seminar Nasional Official Statistics\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.34123/semnasoffstat.v2023i1.1751\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Seminar Nasional Official Statistics","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.34123/semnasoffstat.v2023i1.1751","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
摘要
作为高速公路的收费公路并不能避免交通事故。2020 年,西爪哇省共有 20 条收费公路,总长度为 521.15 公里。Cipali 收费公路是世界上死亡率最高的收费公路之一。交通事故管理对于降低交通事故发生率非常重要。然而,官方机构关于收费公路交通事故的官方数据并不详细,因此我们使用了其他数据来源,如网络新闻。利用 Bi-LSTM-CNN 的 NER 进行事故数据提取。通过创建决策规则来分析新闻提取的结果,从而确定事故发生的模式。该决策规则采用决策树的形式,数据集使用了死亡人数最高的三条收费公路的数据,以概念估算特征模式作为处理缺失值的方法,并将收费公路作为属性,结果得出的 f1 分数值为 67.76%,准确率为 75.49%。
Analisis Pola Kecelakaan Lalu Lintas Menggunakan Algoritma Decision Tree Berdasarkan Ekstraksi Informasi dari Berita Online Menggunakan Named Entity Recognition (NER)
Jalan tol sebagai jalan bebas hambatan tidak membuat jalan tol terbebas dari kecelakaan lalu lintas. Di Provinsi Jawa Barat, terdapat total 20 ruas tol dengan panjang ruas tol mencapai 521,15 km pada 2020. Tol Cipali adalah salah satu ruas dengan fatalitas tertinggi di dunia. Penanggulangan kecelakaan lalu lintas penting dilakukan sebagai upaya untuk mengurangi kejadian kecelakaan lalu lintas. Namun, data official mengenai kecelakaan lalu lintas di jalan tol oleh lembaga resmi tidak tersedia secara rinci, sehingga digunakan sumber data alternatif seperti berita online. NER dengan Bi-LSTM-CNN dimanfaatkan untuk melakukan ekstraksi data kecelakaan. Hasil dari ekstraksi berita dianalisis dengan membuat aturan keputusan untuk mengetahui pola kecelakaan yang terjadi. Aturan keputusan ini berupa decision tree dengan dataset yang menggunakan data tiga tol dengan fatalitas tertinggi dengan fitur imputasi mode by concept sebagai metode penanganan missing value dan jalan tol sebagai atribut, menghasilkan nilai f1-score sebesar 67,76% dan nilai akurasi sebesar 75,49%.