{"title":"Addressing Class Imbalance in Multiple Causal Relations and Keyword Network for Maritime Safety Management","authors":"Ki-Yeong Moon, Sang-Duck Lee","doi":"10.5391/jkiis.2023.33.5.454","DOIUrl":null,"url":null,"abstract":"최근 자연어처리 기술을 활용하여 해양사고의 인과 키워드를 추출하고 분석하는 연구가 많이 수행되고 있으나, 복합적 요인에 의해서 발생하는 해양사고는 복수의 인과관계 포함하므로, 클래스 불균형 문제가 발생할 수 있다. 본연구에서는 클래스 불균형 문제를 극복함으로써, 해양사고 사례 내 복수의 인과관계를 효과적으로 추출할 수 있는 방법을 제안한다. 복수인과관계의 등장으로 인한 클래스 불균형 문제를 극복하기 위하여 개체명 인식과 관계 추출을 분리하고 단계적으로 수행한다. 이를 위해 해양사고 판결문 1,365건을 수집하여 학습 데이터셋을 구축하였으며, 사전학습 언어 모델인 RoBERTa를 파인튜닝(fine-tuning) 하였다. 실험을 통해 복수의 인과관계를 포함하는 해양 사고의 인과 키워드 추출이 가능함을 확인하였다. 또한, 추출한 인과 키워드를 기반으로 키워드 네트워크를 구축하였고, 사고의 원인과 결과를 직관적으로 파악할 수 있음을 확인하였다.","PeriodicalId":17349,"journal":{"name":"Journal of The Korean Institute of Intelligent Systems","volume":"88 4","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-10-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Journal of The Korean Institute of Intelligent Systems","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5391/jkiis.2023.33.5.454","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
최근 자연어처리 기술을 활용하여 해양사고의 인과 키워드를 추출하고 분석하는 연구가 많이 수행되고 있으나, 복합적 요인에 의해서 발생하는 해양사고는 복수의 인과관계 포함하므로, 클래스 불균형 문제가 발생할 수 있다. 본연구에서는 클래스 불균형 문제를 극복함으로써, 해양사고 사례 내 복수의 인과관계를 효과적으로 추출할 수 있는 방법을 제안한다. 복수인과관계의 등장으로 인한 클래스 불균형 문제를 극복하기 위하여 개체명 인식과 관계 추출을 분리하고 단계적으로 수행한다. 이를 위해 해양사고 판결문 1,365건을 수집하여 학습 데이터셋을 구축하였으며, 사전학습 언어 모델인 RoBERTa를 파인튜닝(fine-tuning) 하였다. 실험을 통해 복수의 인과관계를 포함하는 해양 사고의 인과 키워드 추출이 가능함을 확인하였다. 또한, 추출한 인과 키워드를 기반으로 키워드 네트워크를 구축하였고, 사고의 원인과 결과를 직관적으로 파악할 수 있음을 확인하였다.