- Book学术

Uporabna informatika Pub Date : 2022-06-21 DOI:10.31449/upinf.vol30.num2.156

Miha Jesenko, Miro Lozej, Karmen Kern Pipan, Primož Godec, Vesna Tanko, Lan Žagar, Ajda Pretnar Žagar, Nikola Đukić, Blaž Zupan

{"title":"Semantični analizator – razvoj programskega okolja za algoritmično obdelavo slovenskih besedil","authors":"Miha Jesenko, Miro Lozej, Karmen Kern Pipan, Primož Godec, Vesna Tanko, Lan Žagar, Ajda Pretnar Žagar, Nikola Đukić, Blaž Zupan","doi":"10.31449/upinf.vol30.num2.156","DOIUrl":null,"url":null,"abstract":"Uslužbenci in funkcionarji v javni upravi se dnevno srečujejo s številnimi obsežnimi dokumenti, ki jih je treba pregledati in uporabiti glede na informacijske zahteve konkretne naloge. To velja pri pripravi odločitev, pripravi zakonodaje in politik, pregledovanju zakonodaje in politik, ocenjevanju učinkov zakonodaje in politik, pri raznih analizah, pri opisovanju podatkovnih virov in storitev ter pri številnih drugih nalogah. Ker pregledovanje množice dokumentov in izbor uporabnih dokumentov glede na naše potrebe pomeni velik časovni vložek, smo oblikovali pristop na podlagi umetne inteligence za vsebinsko pregledovanje velikih zbirk besedil. Pristop s semantično analizo besedil ter primerjavo vsebinske sorodnosti med posameznimi besedili v zbirki omogoča časovni prihranek in celovito analizo zbirk. V prispevku predstavimo prve rezultate projekta, v katerem razvijamo splošno uporabno orodje za analizo množice besedilnih dokumentov. Cilj projekta je izbor in implementacija gradnikov semantične analize, s kombinacijo katerih lahko izvajamo poljubne tipe analiz dokumentov in gradimo analitične delotoke, ki bi bili lahko uporabni pri tipičnih nalogah, opravilih in storitvah javne uprave. Implementacija vključuje gradnike za dostopanje do podatkovnih prostorov, vložitve dokumentov v vektorske prostore, iskanje podobnih dokumentov, vizualizacijo podatkovnih kart, iskanje karakterističnih pojmov, rangiranje dokumentov glede na semantično podobnost z izbranimi pojmi in urejanje pojmov v ontologije. V članku predstavimo primer uporabe semantičnega povezovanja predlogov vladi z zbirko zakonskih besedil.","PeriodicalId":393713,"journal":{"name":"Uporabna informatika","volume":"200 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-06-21","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Uporabna informatika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.31449/upinf.vol30.num2.156","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

摘要

公务员和官员每天都要面对大量的文件，需要对这些文件进行审查，并将其应用到特定任务的信息要求中。在决策、起草法律和政策、审查法律和政策、评估法律和政策的影响、进行各种分析、说明数据来源和服务以及其他许多任务中都会遇到这种情况。由于审查大量文件并根据需要选择最相关的文件是一项耗时的任务，因此我们开发了一种基于人工智能的方法，用于对大量文本进行基于内容的审查。这种方法通过对文本进行语义分析，并比较文本集中各个文本之间的上下文相似性，可以节省时间并对文本集进行全面分析。在本文中，我们介绍了一个项目的初步成果，在该项目中，我们正在开发一种用于分析大型文本文档集的通用工具。该项目的目的是选择和实施语义分析构件，这些构件组合起来可用于执行任意类型的文档分析，并建立可用于公共行政的典型任务、工作和服务的分析工作流程。其实现包括用于访问数据空间、将文档嵌入矢量空间、搜索类似文档、可视化数据地图、搜索特征概念、根据文档与所选概念的语义相似性进行排序以及将概念组织到本体中的构建模块。在本文中，我们将举例说明如何利用法律文本集对政府提案进行语义链接。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

查看原文

微信好友朋友圈 QQ好友复制链接

本刊更多论文

Semantični analizator – razvoj programskega okolja za algoritmično obdelavo slovenskih besedil

Uslužbenci in funkcionarji v javni upravi se dnevno srečujejo s številnimi obsežnimi dokumenti, ki jih je treba pregledati in uporabiti glede na informacijske zahteve konkretne naloge. To velja pri pripravi odločitev, pripravi zakonodaje in politik, pregledovanju zakonodaje in politik, ocenjevanju učinkov zakonodaje in politik, pri raznih analizah, pri opisovanju podatkovnih virov in storitev ter pri številnih drugih nalogah. Ker pregledovanje množice dokumentov in izbor uporabnih dokumentov glede na naše potrebe pomeni velik časovni vložek, smo oblikovali pristop na podlagi umetne inteligence za vsebinsko pregledovanje velikih zbirk besedil. Pristop s semantično analizo besedil ter primerjavo vsebinske sorodnosti med posameznimi besedili v zbirki omogoča časovni prihranek in celovito analizo zbirk. V prispevku predstavimo prve rezultate projekta, v katerem razvijamo splošno uporabno orodje za analizo množice besedilnih dokumentov. Cilj projekta je izbor in implementacija gradnikov semantične analize, s kombinacijo katerih lahko izvajamo poljubne tipe analiz dokumentov in gradimo analitične delotoke, ki bi bili lahko uporabni pri tipičnih nalogah, opravilih in storitvah javne uprave. Implementacija vključuje gradnike za dostopanje do podatkovnih prostorov, vložitve dokumentov v vektorske prostore, iskanje podobnih dokumentov, vizualizacijo podatkovnih kart, iskanje karakterističnih pojmov, rangiranje dokumentov glede na semantično podobnost z izbranimi pojmi in urejanje pojmov v ontologije. V članku predstavimo primer uporabe semantičnega povezovanja predlogov vladi z zbirko zakonskih besedil.

求助全文

通过发布文献求助，成功后即可免费获取论文全文。去求助

来源期刊

Uporabna informatika

自引率

0.00%

发文量

期刊最新文献

Analiza uporabe aplikacije za sledenje stikov med mladimi: študija primera Nemčije ONLINE NOTES: sistem za razpoznavo govora in strojno prevajanje v realnem času na ravni univerzitetnih predavanj Metodologije za kvalitativno vrednotenje kakovosti odprtih podatkov Iz Islovarja Digitalne kompetence slovenskih študentov