{"title":"Распределённые представления редких слов русского языка, учитывающие векторы однокоренных слов","authors":"А. Ю. Малафеев, А.Yu. Malafeev, Л.П. Мальтина, L.P. Maltina","doi":"10.36535/0548-0027-2021-02-2","DOIUrl":null,"url":null,"abstract":"Рассматриваются алгоритмы, выполняющие автоматический морфемный анализ слов, и методы распределённых представлений слов, которые используют информацию о морфемном составе, но не напрямую, а через усреднение векторов однокоренных слов. Оценивается качество моделей морфемного анализа для русского языка, в том числе и на выборке из редких слов. Предлагается несколько способов получения распределённых представлений редких слов на основе word2vec-представлений однокоренных слов. Проведённые эксперименты показали, что на задаче определения семантической близости пары слов предлагаемые методики дают результаты, сопоставимые с результатами модели fastText или превосходят их.","PeriodicalId":24076,"journal":{"name":"Научно-техническая информация. Серия 2: Информационные процессы и системы","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2021-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Научно-техническая информация. Серия 2: Информационные процессы и системы","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.36535/0548-0027-2021-02-2","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

考虑的是执行自动形态分析单词的算法和分布式表示方法,使用的是单个单词向量的平均值,而不是直接的。俄罗斯语言形态分析模型的质量正在评估中,包括稀有单词的样本。有几种方法可以通过word2vec表示单个单词来分组表示稀有单词。实验表明,在确定成对词的语义亲密的任务中,拟议的方法产生的结果与fastText模型相似或优于。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
Распределённые представления редких слов русского языка, учитывающие векторы однокоренных слов
Рассматриваются алгоритмы, выполняющие автоматический морфемный анализ слов, и методы распределённых представлений слов, которые используют информацию о морфемном составе, но не напрямую, а через усреднение векторов однокоренных слов. Оценивается качество моделей морфемного анализа для русского языка, в том числе и на выборке из редких слов. Предлагается несколько способов получения распределённых представлений редких слов на основе word2vec-представлений однокоренных слов. Проведённые эксперименты показали, что на задаче определения семантической близости пары слов предлагаемые методики дают результаты, сопоставимые с результатами модели fastText или превосходят их.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
期刊最新文献
THE INNER VOICE ASPECT OF EXORCISM PRACTICES ANALYSIS OF THE DEVELOPMENT OF SCIENTIFIC RESEARCH OF THE ARCTIC USING BIBLIOGRAPHIC AND GRANT DATABASES Designing an information system for metallographic quality control of metals A NETWORK DICTIONARY OF MEDIA TERMS. TOWARD A STATEMENT OF THE QUESTION DOMAIN DELINEATION OF AN EMERGING FIELD OF INTERDISCIPLINARY RESEARCH BY SCIENTOMETRICS. THE EXAMPLE OF EXPOSOMICS
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1