多语言自动语言生成中多阶段原型术语的表示:从语料库到单词嵌入再到自动词典

IF 0.9 2区 文学 0 LANGUAGE & LINGUISTICS Lexikos Pub Date : 2021-05-03 DOI:10.5788/31-1-1623
M. Vázquez
{"title":"多语言自动语言生成中多阶段原型术语的表示:从语料库到单词嵌入再到自动词典","authors":"M. Vázquez","doi":"10.5788/31-1-1623","DOIUrl":null,"url":null,"abstract":"Das multilinguale Worterbuch zur Substantivvalenz Portlex gilt als Ausgangpunkt fur die Entstehung der automatischen Sprachgeneratoren Xera und Combinatoria, deren Entwicklung und Handhabung hier prasentiert wird. Beide Prototypen dienen zur automatischen Generierung von Nominalphrasen mit ihren mono- und biargumentalen Valenzstellen, die u.a. als Worterbuchbeispiele oder als integrierte Bestandteile kunftiger autonomer E-Learning-Tools eine Anwendung finden konnten. Als Modelle fur neuartige automatische Valenzworterbucher mit Benutzerinteraktion fassen wir die Sprachgeneratoren in ihrem heutigen Zustand auf. Bei dem spezifischen methodologischen Verfahren zur Entwicklung der Sprachgeneratoren stellt sich die syntaktisch-semantische Beschreibung der vom Valenztrager eroffneten Leerstellen aus syntagmatischer und paradigmatischer Sicht als Schwerpunkt heraus. Zusammen mit Faktoren wie der Reprasentativitat, der grammatischen Korrektheit, der semantischen Koharenz, der Frequenz und der Vielfaltigkeit der lexikalischen Kandidaten sowie der semantischen Klassen und der Argumentstrukturen, die feste Bestandteile beider Ressourcen sind, sticht ein mehrschichtiger Prototypsbegriff hervor. Die kombinierte Anwendung dieses Prototypbegriffs sowie von word embeddings zeigt zusammen mit Techniken aus dem Gebiet der maschinellen Verarbeitung und Generation naturlicher Sprache (NLP und NLG) einen neuen Weg zur kunftigen Entwicklung von automatisch generierten plurilingualen Valenzworterbuchern. Insgesamt stellt der Beitrag die Sprachgeneratoren sowohl aus der Perspektive ihrer Entwicklung als auch aus Nutzersicht dar. Der Fokuss wird auf die Rolle des Prototypbegriffs bei der Entwicklung der Ressourcen gelegt.","PeriodicalId":43907,"journal":{"name":"Lexikos","volume":" ","pages":""},"PeriodicalIF":0.9000,"publicationDate":"2021-05-03","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":"{\"title\":\"Zur Darstellung eines mehrstufigen Prototypbegriffs in der multilingualen automatischen Sprachgenerierung: vom Korpus über word embeddings bis hin zum automatischen Wörterbuch\",\"authors\":\"M. Vázquez\",\"doi\":\"10.5788/31-1-1623\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Das multilinguale Worterbuch zur Substantivvalenz Portlex gilt als Ausgangpunkt fur die Entstehung der automatischen Sprachgeneratoren Xera und Combinatoria, deren Entwicklung und Handhabung hier prasentiert wird. Beide Prototypen dienen zur automatischen Generierung von Nominalphrasen mit ihren mono- und biargumentalen Valenzstellen, die u.a. als Worterbuchbeispiele oder als integrierte Bestandteile kunftiger autonomer E-Learning-Tools eine Anwendung finden konnten. Als Modelle fur neuartige automatische Valenzworterbucher mit Benutzerinteraktion fassen wir die Sprachgeneratoren in ihrem heutigen Zustand auf. Bei dem spezifischen methodologischen Verfahren zur Entwicklung der Sprachgeneratoren stellt sich die syntaktisch-semantische Beschreibung der vom Valenztrager eroffneten Leerstellen aus syntagmatischer und paradigmatischer Sicht als Schwerpunkt heraus. Zusammen mit Faktoren wie der Reprasentativitat, der grammatischen Korrektheit, der semantischen Koharenz, der Frequenz und der Vielfaltigkeit der lexikalischen Kandidaten sowie der semantischen Klassen und der Argumentstrukturen, die feste Bestandteile beider Ressourcen sind, sticht ein mehrschichtiger Prototypsbegriff hervor. Die kombinierte Anwendung dieses Prototypbegriffs sowie von word embeddings zeigt zusammen mit Techniken aus dem Gebiet der maschinellen Verarbeitung und Generation naturlicher Sprache (NLP und NLG) einen neuen Weg zur kunftigen Entwicklung von automatisch generierten plurilingualen Valenzworterbuchern. Insgesamt stellt der Beitrag die Sprachgeneratoren sowohl aus der Perspektive ihrer Entwicklung als auch aus Nutzersicht dar. Der Fokuss wird auf die Rolle des Prototypbegriffs bei der Entwicklung der Ressourcen gelegt.\",\"PeriodicalId\":43907,\"journal\":{\"name\":\"Lexikos\",\"volume\":\" \",\"pages\":\"\"},\"PeriodicalIF\":0.9000,\"publicationDate\":\"2021-05-03\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"1\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Lexikos\",\"FirstCategoryId\":\"98\",\"ListUrlMain\":\"https://doi.org/10.5788/31-1-1623\",\"RegionNum\":2,\"RegionCategory\":\"文学\",\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"0\",\"JCRName\":\"LANGUAGE & LINGUISTICS\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Lexikos","FirstCategoryId":"98","ListUrlMain":"https://doi.org/10.5788/31-1-1623","RegionNum":2,"RegionCategory":"文学","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"0","JCRName":"LANGUAGE & LINGUISTICS","Score":null,"Total":0}
引用次数: 1

摘要

关于名词配价Portlex的多语言词典是开发自动语言生成器Xera和Combinatoria的起点,这里介绍了它们的开发和处理。这两个原型都用于自动生成具有单参数和双参数化合点的名词短语,除其他外,这些短语可以用作单词书示例或作为未来自主电子学习工具的集成组件。作为具有用户交互的新型自动配价字书的模型,我们考虑了当前状态下的语音生成器。在语言生成者发展的具体方法论过程中,从句法和范式的角度对价载体打开的空位进行句法语义描述是主要关注点。再加上代表性、语法正确性、语义连贯性、候选词的频率和多样性等因素,以及作为两种资源固定组成部分的语义类别和论点结构,一个多层次的原型概念脱颖而出。该原型术语和单词嵌入与机器处理和自然语言生成(NLP和NLG)领域的技术相结合的应用,为未来自动生成多语言配价单词书的发展开辟了一条新的道路。总之,本文从语言生成器的开发角度和用户的角度介绍了它们。重点是原型概念在资源开发中的作用。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
Zur Darstellung eines mehrstufigen Prototypbegriffs in der multilingualen automatischen Sprachgenerierung: vom Korpus über word embeddings bis hin zum automatischen Wörterbuch
Das multilinguale Worterbuch zur Substantivvalenz Portlex gilt als Ausgangpunkt fur die Entstehung der automatischen Sprachgeneratoren Xera und Combinatoria, deren Entwicklung und Handhabung hier prasentiert wird. Beide Prototypen dienen zur automatischen Generierung von Nominalphrasen mit ihren mono- und biargumentalen Valenzstellen, die u.a. als Worterbuchbeispiele oder als integrierte Bestandteile kunftiger autonomer E-Learning-Tools eine Anwendung finden konnten. Als Modelle fur neuartige automatische Valenzworterbucher mit Benutzerinteraktion fassen wir die Sprachgeneratoren in ihrem heutigen Zustand auf. Bei dem spezifischen methodologischen Verfahren zur Entwicklung der Sprachgeneratoren stellt sich die syntaktisch-semantische Beschreibung der vom Valenztrager eroffneten Leerstellen aus syntagmatischer und paradigmatischer Sicht als Schwerpunkt heraus. Zusammen mit Faktoren wie der Reprasentativitat, der grammatischen Korrektheit, der semantischen Koharenz, der Frequenz und der Vielfaltigkeit der lexikalischen Kandidaten sowie der semantischen Klassen und der Argumentstrukturen, die feste Bestandteile beider Ressourcen sind, sticht ein mehrschichtiger Prototypsbegriff hervor. Die kombinierte Anwendung dieses Prototypbegriffs sowie von word embeddings zeigt zusammen mit Techniken aus dem Gebiet der maschinellen Verarbeitung und Generation naturlicher Sprache (NLP und NLG) einen neuen Weg zur kunftigen Entwicklung von automatisch generierten plurilingualen Valenzworterbuchern. Insgesamt stellt der Beitrag die Sprachgeneratoren sowohl aus der Perspektive ihrer Entwicklung als auch aus Nutzersicht dar. Der Fokuss wird auf die Rolle des Prototypbegriffs bei der Entwicklung der Ressourcen gelegt.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
Lexikos
Lexikos Multiple-
CiteScore
1.00
自引率
25.00%
发文量
15
审稿时长
7 weeks
期刊介绍: Lexikos (Greek for "of or for words") is a journal for the lexicographical specialist. It is the only journal in Africa which is exclusively devoted to lexicography. Articles dealing with all aspects of lexicography and terminology or the implications that research in related disciplines such as linguistics, computer and information science, etc. has for lexicography will be considered for publication. Articles may be written in Afrikaans, English, Dutch, German and French.
期刊最新文献
The Operative Function in Spanish Lexicography Exemplified through Sport Dictionaries and Other Reference Works Synonymy from a Prototype Theory Perspective and its Symbiosis with Polysemy: Towards a New Dictionary of Synonyms African Englishes in the Oxford English Dictionary Heming Yong and Jing Peng. A Sociolinguistic History of British English Lexicography. A New English–Serbian Dictionary of Sports Terms in the Light of Contemporary Challenges
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1