{"title":"MOKOMASIS LIETUVIŲ KALBOS TEKSTYNAS: NAUJAS IŠTEKLIUS BESIMOKANTIESIEMS LIETUVIŲ KALBOS","authors":"Jolanta Kovalevskaitė, Erika Rimkutė","doi":"10.7220/288","DOIUrl":null,"url":null,"abstract":"Straipsnyje pristatomas pirmasis mokomasis lietuvių kalbos tekstynas, t. y. vienakalbis specialusis tekstynas, skirtas mokyti(s) lietuvių kalbos kaip svetimosios. Tekstynas kuriamas vykdant projektą „Užsienio baltistikos centrų ir Lietuvos mokslo ir studijų institucijų bendradarbiavimo skatinimas“. Tokio istekliaus atsiradimą paskatino tai, kad bendrojo pobūdžio tekstynuose, pvz., Dabartinės lietuvių kalbos tekstyne, pateikiami duomenys ir jų dydis besimokantiesiems lietuvių kalbos kaip užsienio kalbos yra per sudėtinga mokymosi medžiaga. Mokomajame tekstyne yra autentiskos lietuvių kalbos vartosenos tekstų, kurie atrinkti pagal tokius kriterijus, kad būtų suprantami ir aktualūs skirtingų lygių besimokantiesiems. Visi tekstai pagal Bendruosius Europos kalbų mokymosi, mokymo ir vertinimo metmenis suklasifikuoti į A1, A2, B1 ir B2 lygius. Tekstyną sudaro skirtingų kalbos atmainų (rasytiniai ir transkribuoti sakytiniai) tekstai. Is viso mokomąjį lietuvių kalbos tekstyną sudaro 669 000 žodžių: 111 000 žodžių A1–A2 lygio rasytinės ir natūraliosios spontaninės kalbos tekstų, 558 000 žodžių B1–B2 lygio rasytinės ir spontaninės sakytinės kalbos tekstų. Siame straipsnyje issamiai aprasomas rasytinės kalbos patekstynis, kurį sudaro vadovėliniai ir nevadovėliniai tekstai, sio patekstynio dydis – apie 620 000 žodžių. Vadovėlinių tekstų kalbos lygis dažniausiai būdavo aiskus, o nevadovėliniai tekstai buvo automatiskai suklasifikuoti atliekant straipsnyje aprasytą tyrimą. Vadovėliniai ir nevadovėliniai tekstai suklasifikuoti į 29 žanrus (dialogus, pasakojimus, informacinius tekstus ir kt.) ir keturias grupes pagal komunikacinius tikslus (informacinius, pažintinius, apeliacinius ir meninius). Rasytinės kalbos patekstynyje daugiausiai yra informacinių tekstų; skiriasi dažniausi vadovėlinių ir nevadovėlinių tekstų žanrai: trys dažniausi vadovėlinių tekstų žanrai yra pažintiniai tekstai, pasakojimai ir dialogai (kartu sių trijų žanrų tekstai sudaro apie 78 proc. visų vadovėlinių tekstų). Nevadovėlinių tekstų patekstynio žanrų įvairovė didesnė: didžiąją dalį (apie 73 proc.) sudaro penkių žanrų tekstai: subtitrai, informaciniai tekstai, pažintiniai tekstai, proza, patarimai. Straipsnio apibendrinamosiose pastabose paminėta, kokie laukia tolesni darbai, susije su mokomuoju tekstynu, kaip jis gali būti panaudotas. DOI: https://doi.org/10.2478/sm-2020-0019","PeriodicalId":52368,"journal":{"name":"Sustainable Multilingualism","volume":"1 1","pages":"197-230"},"PeriodicalIF":0.0000,"publicationDate":"2020-11-10","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Sustainable Multilingualism","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.7220/288","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q3","JCRName":"Arts and Humanities","Score":null,"Total":0}
MOKOMASIS LIETUVIŲ KALBOS TEKSTYNAS: NAUJAS IŠTEKLIUS BESIMOKANTIESIEMS LIETUVIŲ KALBOS
Straipsnyje pristatomas pirmasis mokomasis lietuvių kalbos tekstynas, t. y. vienakalbis specialusis tekstynas, skirtas mokyti(s) lietuvių kalbos kaip svetimosios. Tekstynas kuriamas vykdant projektą „Užsienio baltistikos centrų ir Lietuvos mokslo ir studijų institucijų bendradarbiavimo skatinimas“. Tokio istekliaus atsiradimą paskatino tai, kad bendrojo pobūdžio tekstynuose, pvz., Dabartinės lietuvių kalbos tekstyne, pateikiami duomenys ir jų dydis besimokantiesiems lietuvių kalbos kaip užsienio kalbos yra per sudėtinga mokymosi medžiaga. Mokomajame tekstyne yra autentiskos lietuvių kalbos vartosenos tekstų, kurie atrinkti pagal tokius kriterijus, kad būtų suprantami ir aktualūs skirtingų lygių besimokantiesiems. Visi tekstai pagal Bendruosius Europos kalbų mokymosi, mokymo ir vertinimo metmenis suklasifikuoti į A1, A2, B1 ir B2 lygius. Tekstyną sudaro skirtingų kalbos atmainų (rasytiniai ir transkribuoti sakytiniai) tekstai. Is viso mokomąjį lietuvių kalbos tekstyną sudaro 669 000 žodžių: 111 000 žodžių A1–A2 lygio rasytinės ir natūraliosios spontaninės kalbos tekstų, 558 000 žodžių B1–B2 lygio rasytinės ir spontaninės sakytinės kalbos tekstų. Siame straipsnyje issamiai aprasomas rasytinės kalbos patekstynis, kurį sudaro vadovėliniai ir nevadovėliniai tekstai, sio patekstynio dydis – apie 620 000 žodžių. Vadovėlinių tekstų kalbos lygis dažniausiai būdavo aiskus, o nevadovėliniai tekstai buvo automatiskai suklasifikuoti atliekant straipsnyje aprasytą tyrimą. Vadovėliniai ir nevadovėliniai tekstai suklasifikuoti į 29 žanrus (dialogus, pasakojimus, informacinius tekstus ir kt.) ir keturias grupes pagal komunikacinius tikslus (informacinius, pažintinius, apeliacinius ir meninius). Rasytinės kalbos patekstynyje daugiausiai yra informacinių tekstų; skiriasi dažniausi vadovėlinių ir nevadovėlinių tekstų žanrai: trys dažniausi vadovėlinių tekstų žanrai yra pažintiniai tekstai, pasakojimai ir dialogai (kartu sių trijų žanrų tekstai sudaro apie 78 proc. visų vadovėlinių tekstų). Nevadovėlinių tekstų patekstynio žanrų įvairovė didesnė: didžiąją dalį (apie 73 proc.) sudaro penkių žanrų tekstai: subtitrai, informaciniai tekstai, pažintiniai tekstai, proza, patarimai. Straipsnio apibendrinamosiose pastabose paminėta, kokie laukia tolesni darbai, susije su mokomuoju tekstynu, kaip jis gali būti panaudotas. DOI: https://doi.org/10.2478/sm-2020-0019