Analisis Pola Kecelakaan Lalu Lintas Menggunakan Algoritma Decision Tree Berdasarkan Ekstraksi Informasi dari Berita Online Menggunakan Named Entity Recognition (NER)

Hardi Susanto, Budi Yuniarto
{"title":"Analisis Pola Kecelakaan Lalu Lintas Menggunakan Algoritma Decision Tree Berdasarkan Ekstraksi Informasi dari Berita Online Menggunakan Named Entity Recognition (NER)","authors":"Hardi Susanto, Budi Yuniarto","doi":"10.34123/semnasoffstat.v2023i1.1751","DOIUrl":null,"url":null,"abstract":"Jalan tol sebagai jalan bebas hambatan tidak membuat jalan tol terbebas dari kecelakaan lalu lintas. Di Provinsi Jawa Barat, terdapat total 20 ruas tol dengan panjang ruas tol mencapai 521,15 km pada 2020. Tol Cipali adalah salah satu ruas dengan fatalitas tertinggi di dunia. Penanggulangan kecelakaan lalu lintas penting dilakukan sebagai upaya untuk mengurangi kejadian kecelakaan lalu lintas. Namun, data official mengenai kecelakaan lalu lintas di jalan tol oleh lembaga resmi tidak tersedia secara rinci, sehingga digunakan sumber data alternatif seperti berita online. NER dengan Bi-LSTM-CNN dimanfaatkan untuk melakukan ekstraksi data kecelakaan. Hasil dari ekstraksi berita dianalisis dengan membuat aturan keputusan untuk mengetahui pola kecelakaan yang terjadi. Aturan keputusan ini berupa decision tree dengan dataset yang menggunakan data tiga tol dengan fatalitas tertinggi dengan fitur imputasi mode by concept sebagai metode penanganan missing value dan jalan tol sebagai atribut, menghasilkan nilai f1-score sebesar 67,76% dan nilai akurasi sebesar 75,49%.","PeriodicalId":213816,"journal":{"name":"Seminar Nasional Official Statistics","volume":"33 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Seminar Nasional Official Statistics","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.34123/semnasoffstat.v2023i1.1751","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Jalan tol sebagai jalan bebas hambatan tidak membuat jalan tol terbebas dari kecelakaan lalu lintas. Di Provinsi Jawa Barat, terdapat total 20 ruas tol dengan panjang ruas tol mencapai 521,15 km pada 2020. Tol Cipali adalah salah satu ruas dengan fatalitas tertinggi di dunia. Penanggulangan kecelakaan lalu lintas penting dilakukan sebagai upaya untuk mengurangi kejadian kecelakaan lalu lintas. Namun, data official mengenai kecelakaan lalu lintas di jalan tol oleh lembaga resmi tidak tersedia secara rinci, sehingga digunakan sumber data alternatif seperti berita online. NER dengan Bi-LSTM-CNN dimanfaatkan untuk melakukan ekstraksi data kecelakaan. Hasil dari ekstraksi berita dianalisis dengan membuat aturan keputusan untuk mengetahui pola kecelakaan yang terjadi. Aturan keputusan ini berupa decision tree dengan dataset yang menggunakan data tiga tol dengan fatalitas tertinggi dengan fitur imputasi mode by concept sebagai metode penanganan missing value dan jalan tol sebagai atribut, menghasilkan nilai f1-score sebesar 67,76% dan nilai akurasi sebesar 75,49%.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
基于使用命名实体识别(NER)从在线新闻中提取信息的决策树算法交通事故模式分析
作为高速公路的收费公路并不能避免交通事故。2020 年,西爪哇省共有 20 条收费公路,总长度为 521.15 公里。Cipali 收费公路是世界上死亡率最高的收费公路之一。交通事故管理对于降低交通事故发生率非常重要。然而,官方机构关于收费公路交通事故的官方数据并不详细,因此我们使用了其他数据来源,如网络新闻。利用 Bi-LSTM-CNN 的 NER 进行事故数据提取。通过创建决策规则来分析新闻提取的结果,从而确定事故发生的模式。该决策规则采用决策树的形式,数据集使用了死亡人数最高的三条收费公路的数据,以概念估算特征模式作为处理缺失值的方法,并将收费公路作为属性,结果得出的 f1 分数值为 67.76%,准确率为 75.49%。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
0
期刊最新文献
Pemodelan Geographically Weighted Regression (GWR) dalam Prevalensi Obesitas Dewasa Kabupaten/Kota di Indonesia Tahun 2018 Estimasi Tingkat Kemiskinan Anak Level Kabupaten/Kota di Provinsi Banten Tahun 2018-2021 dengan Small Area Estimation (SAE) Rao-Yu Pendekatan Hierarchical Bayes Analisis Spasial Pengaruh Infrastruktur Sosial Dan Infrastruktur Ekonomi Terhadap Kemiskinan Pulau Jawa 2021 Penyusunan Indeks Kerentanan Sosial Ekonomi Pekerja Perempuan terhadap Pandemi Covid-19 di Indonesia Mampukah Proses Produksi Perusahaan Besar Industri Besi dan Baja Dasar di Indonesia Mencapai Tingkat Efisiensi Maksimal?
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1