Mladen Borovič, Sandi Majninger, Jani Dugonik, Marko Ferme, Milan Ojsteršek
{"title":"Hibridni pristop za priporočanje vrstilcev univerzalne decimalne klasifikacije","authors":"Mladen Borovič, Sandi Majninger, Jani Dugonik, Marko Ferme, Milan Ojsteršek","doi":"10.31449/upinf.vol28.num1.81","DOIUrl":null,"url":null,"abstract":"V prispevku predstavljamo hibridni pristop za priporočanje vrstilcev univerzalne decimalne klasifikacije. S pomočjo takšnega pristopa lahko knjižničarjem omogočimo polavtomatsko določanje vrstilcev univerzalne decimalne klasifikacije iz vsebine že obstoječih uvrščenih gradiv. Hibridni pristop deluje na podlagi združevanja rezultata metode BM25 in naivnega Bayesovega klasifikatorja, kjer oba pristopa vrneta seznam priporočenih vrstilcev. Oba seznama združimo v končni seznam priporočil z združevalno funkcijo. V prispevku podrobneje opišemo korpus, obliko podatkov, obliko vrstilcev univerzalne decimalne klasifikacije in delovanje posamezne metode znotraj hibridnega pristopa. Podamo tudi rezultate metrik natančnosti, priklica in Fβ za sezname priporočil na korpusu besedil iz nacionalne infrastrukture odprtega dostopa.","PeriodicalId":393713,"journal":{"name":"Uporabna informatika","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2020-04-10","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Uporabna informatika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.31449/upinf.vol28.num1.81","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
摘要
在本文中,我们提出了一种推荐《通用十进分类法》序号的混合方法。这种方法可用于让图书馆员从现有分类资料的内容中半自动地确定通用十进分类法的等级。混合方法的工作原理是将 BM25 和天真贝叶斯分类器的输出相结合,两种方法都会返回一个推荐等级列表。使用合并函数将两个列表合并为最终的推荐列表。在本文中,我们将更详细地介绍语料库、数据格式、通用十进制分类器同行的格式以及混合方法中每种方法的性能。我们还提供了在国家开放存取基础设施(National Open Access Infrastructure)文本语料库中的推荐列表的精确度、检索率和 Fβ 指标的结果。
Hibridni pristop za priporočanje vrstilcev univerzalne decimalne klasifikacije
V prispevku predstavljamo hibridni pristop za priporočanje vrstilcev univerzalne decimalne klasifikacije. S pomočjo takšnega pristopa lahko knjižničarjem omogočimo polavtomatsko določanje vrstilcev univerzalne decimalne klasifikacije iz vsebine že obstoječih uvrščenih gradiv. Hibridni pristop deluje na podlagi združevanja rezultata metode BM25 in naivnega Bayesovega klasifikatorja, kjer oba pristopa vrneta seznam priporočenih vrstilcev. Oba seznama združimo v končni seznam priporočil z združevalno funkcijo. V prispevku podrobneje opišemo korpus, obliko podatkov, obliko vrstilcev univerzalne decimalne klasifikacije in delovanje posamezne metode znotraj hibridnega pristopa. Podamo tudi rezultate metrik natančnosti, priklica in Fβ za sezname priporočil na korpusu besedil iz nacionalne infrastrukture odprtega dostopa.