MOKOMASIS LIETUVIŲ KALBOS TEKSTYNAS: NAUJAS IŠTEKLIUS BESIMOKANTIESIEMS LIETUVIŲ KALBOS

Q3 Arts and Humanities Sustainable Multilingualism Pub Date : 2020-11-10 DOI:10.7220/288
Jolanta Kovalevskaitė, Erika Rimkutė
{"title":"MOKOMASIS LIETUVIŲ KALBOS TEKSTYNAS: NAUJAS IŠTEKLIUS BESIMOKANTIESIEMS LIETUVIŲ KALBOS","authors":"Jolanta Kovalevskaitė, Erika Rimkutė","doi":"10.7220/288","DOIUrl":null,"url":null,"abstract":"Straipsnyje pristatomas pirmasis mokomasis lietuvių kalbos tekstynas, t. y. vienakalbis specialusis tekstynas, skirtas mokyti(s) lietuvių kalbos kaip svetimosios. Tekstynas kuriamas vykdant projektą „Užsienio baltistikos centrų ir Lietuvos mokslo ir studijų institucijų bendradarbiavimo skatinimas“. Tokio istekliaus atsiradimą paskatino tai, kad bendrojo pobūdžio tekstynuose, pvz., Dabartinės lietuvių kalbos tekstyne, pateikiami duomenys ir jų dydis besimokantiesiems lietuvių kalbos kaip užsienio kalbos yra per sudėtinga mokymosi medžiaga. Mokomajame tekstyne yra autentiskos lietuvių kalbos vartosenos tekstų, kurie atrinkti pagal tokius kriterijus, kad būtų suprantami ir aktualūs skirtingų lygių besimokantiesiems. Visi tekstai pagal Bendruosius Europos kalbų mokymosi, mokymo ir vertinimo metmenis suklasifikuoti į A1, A2, B1 ir B2 lygius. Tekstyną sudaro skirtingų kalbos atmainų (rasytiniai ir transkribuoti sakytiniai) tekstai. Is viso mokomąjį lietuvių kalbos tekstyną sudaro 669 000 žodžių: 111 000 žodžių A1–A2 lygio rasytinės ir natūraliosios spontaninės kalbos tekstų, 558 000 žodžių B1–B2 lygio rasytinės ir spontaninės sakytinės kalbos tekstų. Siame straipsnyje issamiai aprasomas rasytinės kalbos patekstynis, kurį sudaro vadovėliniai ir nevadovėliniai tekstai, sio patekstynio dydis – apie 620 000 žodžių. Vadovėlinių tekstų kalbos lygis dažniausiai būdavo aiskus, o nevadovėliniai tekstai buvo automatiskai suklasifikuoti atliekant straipsnyje aprasytą tyrimą. Vadovėliniai ir nevadovėliniai tekstai suklasifikuoti į 29 žanrus (dialogus, pasakojimus, informacinius tekstus ir kt.) ir keturias grupes pagal komunikacinius tikslus (informacinius, pažintinius, apeliacinius ir meninius). Rasytinės kalbos patekstynyje daugiausiai yra informacinių tekstų; skiriasi dažniausi vadovėlinių ir nevadovėlinių tekstų žanrai: trys dažniausi vadovėlinių tekstų žanrai yra pažintiniai tekstai, pasakojimai ir dialogai (kartu sių trijų žanrų tekstai sudaro apie 78 proc. visų vadovėlinių tekstų). Nevadovėlinių tekstų patekstynio žanrų įvairovė didesnė: didžiąją dalį (apie 73 proc.) sudaro penkių žanrų tekstai: subtitrai, informaciniai tekstai, pažintiniai tekstai, proza, patarimai. Straipsnio apibendrinamosiose pastabose paminėta, kokie laukia tolesni darbai, susije su mokomuoju tekstynu, kaip jis gali būti panaudotas. DOI: https://doi.org/10.2478/sm-2020-0019","PeriodicalId":52368,"journal":{"name":"Sustainable Multilingualism","volume":"1 1","pages":"197-230"},"PeriodicalIF":0.0000,"publicationDate":"2020-11-10","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Sustainable Multilingualism","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.7220/288","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q3","JCRName":"Arts and Humanities","Score":null,"Total":0}
引用次数: 0

Abstract

Straipsnyje pristatomas pirmasis mokomasis lietuvių kalbos tekstynas, t. y. vienakalbis specialusis tekstynas, skirtas mokyti(s) lietuvių kalbos kaip svetimosios. Tekstynas kuriamas vykdant projektą „Užsienio baltistikos centrų ir Lietuvos mokslo ir studijų institucijų bendradarbiavimo skatinimas“. Tokio istekliaus atsiradimą paskatino tai, kad bendrojo pobūdžio tekstynuose, pvz., Dabartinės lietuvių kalbos tekstyne, pateikiami duomenys ir jų dydis besimokantiesiems lietuvių kalbos kaip užsienio kalbos yra per sudėtinga mokymosi medžiaga. Mokomajame tekstyne yra autentiskos lietuvių kalbos vartosenos tekstų, kurie atrinkti pagal tokius kriterijus, kad būtų suprantami ir aktualūs skirtingų lygių besimokantiesiems. Visi tekstai pagal Bendruosius Europos kalbų mokymosi, mokymo ir vertinimo metmenis suklasifikuoti į A1, A2, B1 ir B2 lygius. Tekstyną sudaro skirtingų kalbos atmainų (rasytiniai ir transkribuoti sakytiniai) tekstai. Is viso mokomąjį lietuvių kalbos tekstyną sudaro 669 000 žodžių: 111 000 žodžių A1–A2 lygio rasytinės ir natūraliosios spontaninės kalbos tekstų, 558 000 žodžių B1–B2 lygio rasytinės ir spontaninės sakytinės kalbos tekstų. Siame straipsnyje issamiai aprasomas rasytinės kalbos patekstynis, kurį sudaro vadovėliniai ir nevadovėliniai tekstai, sio patekstynio dydis – apie 620 000 žodžių. Vadovėlinių tekstų kalbos lygis dažniausiai būdavo aiskus, o nevadovėliniai tekstai buvo automatiskai suklasifikuoti atliekant straipsnyje aprasytą tyrimą. Vadovėliniai ir nevadovėliniai tekstai suklasifikuoti į 29 žanrus (dialogus, pasakojimus, informacinius tekstus ir kt.) ir keturias grupes pagal komunikacinius tikslus (informacinius, pažintinius, apeliacinius ir meninius). Rasytinės kalbos patekstynyje daugiausiai yra informacinių tekstų; skiriasi dažniausi vadovėlinių ir nevadovėlinių tekstų žanrai: trys dažniausi vadovėlinių tekstų žanrai yra pažintiniai tekstai, pasakojimai ir dialogai (kartu sių trijų žanrų tekstai sudaro apie 78 proc. visų vadovėlinių tekstų). Nevadovėlinių tekstų patekstynio žanrų įvairovė didesnė: didžiąją dalį (apie 73 proc.) sudaro penkių žanrų tekstai: subtitrai, informaciniai tekstai, pažintiniai tekstai, proza, patarimai. Straipsnio apibendrinamosiose pastabose paminėta, kokie laukia tolesni darbai, susije su mokomuoju tekstynu, kaip jis gali būti panaudotas. DOI: https://doi.org/10.2478/sm-2020-0019
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
本文介绍了立陶宛语的第一语言结构,即旨在将立陶宛语作为外语进行教学的单一语言特殊结构。该文本是在“促进波罗的海外国中心与立陶宛科学研究机构之间的合作”项目的背景下起草的“这种架构的创建是由这样一个事实驱动的,即一般文本,如当前的立陶宛文本,向立陶宛语学习者提供数据及其大小,因为外语太复杂,无法学习。针对不同层次的学生。欧洲语言学习、培训和评估共同年下的所有文本都分为A1、A2、B1和B2级。文本由不同语言(种族和转录)的文本组成。立陶宛语的总体结构由669000个单词组成:A1-A2级的种族和自然自发文本为1111000个单词,B1-B2级的种族或自然自发文本则为558000个单词。本文描述了种族背景,包括手册和非母语文本,背景大小约为62万字。在本条所述的调查过程中,曾经是错误和非错误文本的文本的语言水平被自动分类。领导者和非领导者文本分为29种类型(对话、叙事、信息文本等)和四组用于交流目的(信息、知识、吸引力和艺术)。主要是源语言的信息文本最常见的手动文本和非手动文本的类型不同:最常见的三种手动文本类型是认知文本、叙事和对话(这三种类型加起来约占所有手动文本的78%)。非次要文本的性别多样性更大:大多数(约73%)由五种性别文本组成:字幕、信息文本、知识文本、散文和建议。这篇文章的摘要说明了如何使用文本结构的预期后续行动。DOI:https://doi.org/10.2478/sm-2020-0019
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
Sustainable Multilingualism
Sustainable Multilingualism Social Sciences-Linguistics and Language
CiteScore
0.50
自引率
0.00%
发文量
10
审稿时长
39 weeks
期刊最新文献
The Role of Linguistic and Cultural Mediation in Learning the Host Country’s Language Lip Synchrony of Bilabial Consonants in the Lithuanian Dubbed Live-Action Film a Dog's Way Home The Nomenclature of Traditional Ornaments in Latvian and Lithuanian Language Attitudes and Policy Preferences: Insights From International Scholarship Applicants to Hungarian Universities Translanguaging in Teaching and Learning of English at University Level: The Perspectives of Ukrainian Students and their Teachers
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1