支持匈牙利语的数字化可持续发展

Q4 Arts and Humanities Magyar Nyelv Pub Date : 2023-12-20 DOI:10.18349/magyarnyelv.2023.4.482
G. Prószéky, Tamás Váradi
{"title":"支持匈牙利语的数字化可持续发展","authors":"G. Prószéky, Tamás Váradi","doi":"10.18349/magyarnyelv.2023.4.482","DOIUrl":null,"url":null,"abstract":"A Nyelvtudományi Kutatóközpont projektje az MTA alapító küldetését követi, hogy anyanyelvünk a digitális térben is méltó szerepet kapjon. A nemzetközi kutatások leginkább az angolra összpontosítanak, kisebb figyelmet szentelve a magyarhoz hasonló kisebb nyelveknek. A jelen munkálatok a magyar nyelv digitális támogatására fókuszálnak, különös tekintettel a normatív magyarra és a rokon nyelvekre. (1) A Magyar Nemzeti Szövegtár a nyelvi kutatásokban kiemelkedően használt, több mint egymilliárd szavas korpusz, melyet hat stílusréteg és öt regionális nyelvváltozat alkot. A korpuszt elsősorban a magyar nyelvre vonatkozó korpuszalapú és korpuszvezérelt nyelvészeti kutatások támogatására használják, nemcsak a nyelvészeti kutatásokban, hanem a bölcsészet- és társadalomtudományok számos területén. Az új lehetőségek, mint például az újabb, jobb minőségű nyelvi elemzők, vagy a nyelvi modellek előállításához szükséges nagyméretű adatbázisok azonban szükségessé tették a korpusz bővítését és fejlesztését. (2) A helyesírás szabályozása a nyelvi norma kulcsfontosságú eleme, és a digitális térben egyre fontosabbá válik. Az MTA által támogatott Helyesírási tanácsadó portál ezt a szükségletet korszerű technológiával elégíti ki, azonban felújításra szorul a szoftverplatform, a módszertan és az ügyfélközpontúság terén. terén. (3) A magyar nyelv nagyszótárához tartozó több mint négymillió cédulából álló gyűjtemény az 19. század végén keletkezett. A cédulák rendezése és digitalizálása folyamatban van, és bár közel húsz éve megkezdődött a legépelése, teljeskörű digitális használatához még további fejlesztések szükségesek. (4) A magyar nyelv rokon nyelvei, a hanti és manysi digitális jelenlétének támogatása érdekében szükség van egy elemzett digitális korpusz létrehozására, melynek alapját írott, modern szövegek képezik. Ezek lehetőséget adnak az obi-ugor nyelvek jelenlegi állapotának dokumentálására és megőrzésére. Összegezve: ezek a kutatások hozzájárulnak a magyar nyelv digitális térben való fejlődéséhez, valamint a nyelvi kutatások széles skáláját fedik le a normatív nyelvtől a helyesírásig és a rokon nyelvekig.","PeriodicalId":52530,"journal":{"name":"Magyar Nyelv","volume":"65 19","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-12-20","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"magyar nyelv digitális fenntarthatóságának támogatása\",\"authors\":\"G. Prószéky, Tamás Váradi\",\"doi\":\"10.18349/magyarnyelv.2023.4.482\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"A Nyelvtudományi Kutatóközpont projektje az MTA alapító küldetését követi, hogy anyanyelvünk a digitális térben is méltó szerepet kapjon. A nemzetközi kutatások leginkább az angolra összpontosítanak, kisebb figyelmet szentelve a magyarhoz hasonló kisebb nyelveknek. A jelen munkálatok a magyar nyelv digitális támogatására fókuszálnak, különös tekintettel a normatív magyarra és a rokon nyelvekre. (1) A Magyar Nemzeti Szövegtár a nyelvi kutatásokban kiemelkedően használt, több mint egymilliárd szavas korpusz, melyet hat stílusréteg és öt regionális nyelvváltozat alkot. A korpuszt elsősorban a magyar nyelvre vonatkozó korpuszalapú és korpuszvezérelt nyelvészeti kutatások támogatására használják, nemcsak a nyelvészeti kutatásokban, hanem a bölcsészet- és társadalomtudományok számos területén. Az új lehetőségek, mint például az újabb, jobb minőségű nyelvi elemzők, vagy a nyelvi modellek előállításához szükséges nagyméretű adatbázisok azonban szükségessé tették a korpusz bővítését és fejlesztését. (2) A helyesírás szabályozása a nyelvi norma kulcsfontosságú eleme, és a digitális térben egyre fontosabbá válik. Az MTA által támogatott Helyesírási tanácsadó portál ezt a szükségletet korszerű technológiával elégíti ki, azonban felújításra szorul a szoftverplatform, a módszertan és az ügyfélközpontúság terén. terén. (3) A magyar nyelv nagyszótárához tartozó több mint négymillió cédulából álló gyűjtemény az 19. század végén keletkezett. A cédulák rendezése és digitalizálása folyamatban van, és bár közel húsz éve megkezdődött a legépelése, teljeskörű digitális használatához még további fejlesztések szükségesek. (4) A magyar nyelv rokon nyelvei, a hanti és manysi digitális jelenlétének támogatása érdekében szükség van egy elemzett digitális korpusz létrehozására, melynek alapját írott, modern szövegek képezik. Ezek lehetőséget adnak az obi-ugor nyelvek jelenlegi állapotának dokumentálására és megőrzésére. Összegezve: ezek a kutatások hozzájárulnak a magyar nyelv digitális térben való fejlődéséhez, valamint a nyelvi kutatások széles skáláját fedik le a normatív nyelvtől a helyesírásig és a rokon nyelvekig.\",\"PeriodicalId\":52530,\"journal\":{\"name\":\"Magyar Nyelv\",\"volume\":\"65 19\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-12-20\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Magyar Nyelv\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.18349/magyarnyelv.2023.4.482\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"Q4\",\"JCRName\":\"Arts and Humanities\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Magyar Nyelv","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.18349/magyarnyelv.2023.4.482","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"Arts and Humanities","Score":null,"Total":0}
引用次数: 0

摘要

语言学研究中心的项目遵循匈牙利科学院的创始使命,即确保我们的母语在数字空间中获得应有的地位。国际研究主要集中在英语方面,对匈牙利语这样的小语种关注较少。(1) 匈牙利国家文本库是一个拥有 10 亿多词的语料库,在语言学研究中使用率很高,由 6 个文体层和 5 个地区语种组成。该语料库主要用于支持以语料库为基础和以语料库为驱动的匈牙利语语言学研究,不仅用于语言学研究,还用于人文和社会科学的许多领域。然而,新的可能性,如更新、更高质量的语言解析器或用于制作语言模型的大型数据库,使得有必要扩大和改进该语料库。 (2) 拼写控制是语言规范的一个关键要素,在数字空间中正变得越来越重要。由匈牙利科学院支持的拼写咨询门户网站以最先进的技术满足了这一需求,但在软件平 台、方法和以客户为中心方面需要升级。 (3) 收集的四百多万张《匈牙利语言词典》卡片可追溯到 19 世纪末。尽管词典的编纂工作始于近 20 年前,但要使其完全数字化,还需要进一 步开发。 (4) 为了支持匈牙利语的相关语言(即汉斯语和 Manysi 语)的数字化,有必要建立一 个以现代书面文本为基础的经过分析的数字语料库。这将为记录和保存 Oggy 语言的现状提供机会。总之,这些研究将有助于匈牙利语在数字空间的发展,并涵盖从规范语言到正字法和 相关语言的广泛语言学研究。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
magyar nyelv digitális fenntarthatóságának támogatása
A Nyelvtudományi Kutatóközpont projektje az MTA alapító küldetését követi, hogy anyanyelvünk a digitális térben is méltó szerepet kapjon. A nemzetközi kutatások leginkább az angolra összpontosítanak, kisebb figyelmet szentelve a magyarhoz hasonló kisebb nyelveknek. A jelen munkálatok a magyar nyelv digitális támogatására fókuszálnak, különös tekintettel a normatív magyarra és a rokon nyelvekre. (1) A Magyar Nemzeti Szövegtár a nyelvi kutatásokban kiemelkedően használt, több mint egymilliárd szavas korpusz, melyet hat stílusréteg és öt regionális nyelvváltozat alkot. A korpuszt elsősorban a magyar nyelvre vonatkozó korpuszalapú és korpuszvezérelt nyelvészeti kutatások támogatására használják, nemcsak a nyelvészeti kutatásokban, hanem a bölcsészet- és társadalomtudományok számos területén. Az új lehetőségek, mint például az újabb, jobb minőségű nyelvi elemzők, vagy a nyelvi modellek előállításához szükséges nagyméretű adatbázisok azonban szükségessé tették a korpusz bővítését és fejlesztését. (2) A helyesírás szabályozása a nyelvi norma kulcsfontosságú eleme, és a digitális térben egyre fontosabbá válik. Az MTA által támogatott Helyesírási tanácsadó portál ezt a szükségletet korszerű technológiával elégíti ki, azonban felújításra szorul a szoftverplatform, a módszertan és az ügyfélközpontúság terén. terén. (3) A magyar nyelv nagyszótárához tartozó több mint négymillió cédulából álló gyűjtemény az 19. század végén keletkezett. A cédulák rendezése és digitalizálása folyamatban van, és bár közel húsz éve megkezdődött a legépelése, teljeskörű digitális használatához még további fejlesztések szükségesek. (4) A magyar nyelv rokon nyelvei, a hanti és manysi digitális jelenlétének támogatása érdekében szükség van egy elemzett digitális korpusz létrehozására, melynek alapját írott, modern szövegek képezik. Ezek lehetőséget adnak az obi-ugor nyelvek jelenlegi állapotának dokumentálására és megőrzésére. Összegezve: ezek a kutatások hozzájárulnak a magyar nyelv digitális térben való fejlődéséhez, valamint a nyelvi kutatások széles skáláját fedik le a normatív nyelvtől a helyesírásig és a rokon nyelvekig.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
Magyar Nyelv
Magyar Nyelv Arts and Humanities-Language and Linguistics
CiteScore
0.10
自引率
0.00%
发文量
16
期刊最新文献
T. Somogyi Magda 70 éves Érvelés a Széchenyi–Kossuth-vita első szakaszában A faux pas (társalgási baklövés) jelenség pragmatikai értelmezési és felismerési lehetőségei az explicit nyelvi megformálás függvényében A tanulói beszéd fatikus funkciójú nyelvi elemei az osztálytermi diskurzusban Gombolyag mint drachma
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1