基于德语学习者语料库的语言错误纵向研究

Ирина Аврамовна Котюрова, Георгий Романович Сафонов
{"title":"基于德语学习者语料库的语言错误纵向研究","authors":"Ирина Аврамовна Котюрова, Георгий Романович Сафонов","doi":"10.23951/2307-6127-2024-1-54-64","DOIUrl":null,"url":null,"abstract":"В эпоху цифровизации и активного распространения корпусных технологий в лингвистическом образовании специалисты в области лингводидактики постоянно открывают все новые возможности в работе с большими данными. Одним из относительно новых явлений в российском образовании является сбор корпусов ученических текстов на иностранном языке. Их возможности для лингводидактических исследований зависят прежде всего от продолжительности сбора данных и от разметки, которую содержит тот или иной корпус. В статье речь идет о корпусе немецко-язычных студенческих текстов Петрозаводского аннотированного корпуса текстов и лонгитюдном исследовании типов лингвистических ошибок, допускаемых студентами на всем протяжении изучения немецкого языка в течение 5 лет. Результатом исследования стала статистика по 90 классам ошибок, поделенных на семь основных групп, и динамика этой статистики на протяжении 5 лет обучения немецкому языку. Сравнение наиболее частотных ошибок на первом и пятом курсах показывает, что к темам, которые на протяжении всех годов обучения вызывают наибольшие проблемы у студентов, относятся выбор лексемы, орфография, пропуски, пунктуация и обратный порядок слов. Уходят к концу обучения в вузе проблемы с неопределенным артиклем, склонением прилагательных и существительных, образованием множественного числа и родом существительных, уступая место другим проблемам, таким как лишние элементы, логика, порядок слов в придаточных предложениях и стилистические ошибки.\n In the age of digitalization and the active spread of corpus technologies in linguistic education, linguodidactics specialists are constantly discovering new opportunities in working with big data. One relatively new phenomenon in Russian education is the collection of corpora of student texts in a foreign language. It’s possibilities for linguodidactical research depend primarily on the duration of the data collection and on the markup that corpus contains. The article focuses on the corpus of German-language student texts PACT (Petrozavodsk annotated corpus of texts) and longitudinal research of types of linguistic mistakes made by students throughout the study of the German language for 5 years. The result of the research is statistics for 90 classes of errors, divided into 7 major groups – grammar, vocabulary, orthography, punctuation, discourse, omissions and superfluous elements – and the dynamics of these statistics over the 5 years of German language study. Comparison of the most frequent errors made by 1st and 5th year students respectively shows that subjects causing the most problems for students during all years of study are lexeme selection, orthography, omissions in text, punctuation and reverse word order. At the end of study problems with indefinite articles, adjective and noun declension, formation of plural form and gender of nouns are giving way to other issues such as superfluous elements in text, logic, word order in subordinate sentences and stylistic errors.","PeriodicalId":437532,"journal":{"name":"Pedagogical Review","volume":"347 3","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-02-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Longitudinal studies of language errors based on a German-language learner corpus\",\"authors\":\"Ирина Аврамовна Котюрова, Георгий Романович Сафонов\",\"doi\":\"10.23951/2307-6127-2024-1-54-64\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"В эпоху цифровизации и активного распространения корпусных технологий в лингвистическом образовании специалисты в области лингводидактики постоянно открывают все новые возможности в работе с большими данными. Одним из относительно новых явлений в российском образовании является сбор корпусов ученических текстов на иностранном языке. Их возможности для лингводидактических исследований зависят прежде всего от продолжительности сбора данных и от разметки, которую содержит тот или иной корпус. В статье речь идет о корпусе немецко-язычных студенческих текстов Петрозаводского аннотированного корпуса текстов и лонгитюдном исследовании типов лингвистических ошибок, допускаемых студентами на всем протяжении изучения немецкого языка в течение 5 лет. Результатом исследования стала статистика по 90 классам ошибок, поделенных на семь основных групп, и динамика этой статистики на протяжении 5 лет обучения немецкому языку. Сравнение наиболее частотных ошибок на первом и пятом курсах показывает, что к темам, которые на протяжении всех годов обучения вызывают наибольшие проблемы у студентов, относятся выбор лексемы, орфография, пропуски, пунктуация и обратный порядок слов. Уходят к концу обучения в вузе проблемы с неопределенным артиклем, склонением прилагательных и существительных, образованием множественного числа и родом существительных, уступая место другим проблемам, таким как лишние элементы, логика, порядок слов в придаточных предложениях и стилистические ошибки.\\n In the age of digitalization and the active spread of corpus technologies in linguistic education, linguodidactics specialists are constantly discovering new opportunities in working with big data. One relatively new phenomenon in Russian education is the collection of corpora of student texts in a foreign language. It’s possibilities for linguodidactical research depend primarily on the duration of the data collection and on the markup that corpus contains. The article focuses on the corpus of German-language student texts PACT (Petrozavodsk annotated corpus of texts) and longitudinal research of types of linguistic mistakes made by students throughout the study of the German language for 5 years. The result of the research is statistics for 90 classes of errors, divided into 7 major groups – grammar, vocabulary, orthography, punctuation, discourse, omissions and superfluous elements – and the dynamics of these statistics over the 5 years of German language study. Comparison of the most frequent errors made by 1st and 5th year students respectively shows that subjects causing the most problems for students during all years of study are lexeme selection, orthography, omissions in text, punctuation and reverse word order. At the end of study problems with indefinite articles, adjective and noun declension, formation of plural form and gender of nouns are giving way to other issues such as superfluous elements in text, logic, word order in subordinate sentences and stylistic errors.\",\"PeriodicalId\":437532,\"journal\":{\"name\":\"Pedagogical Review\",\"volume\":\"347 3\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2024-02-28\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Pedagogical Review\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.23951/2307-6127-2024-1-54-64\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Pedagogical Review","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.23951/2307-6127-2024-1-54-64","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

在数字化时代和语料库技术在语言教育领域的积极推广下,语言教学专家不断发现大数据工作的新可能性。俄罗斯教育领域相对较新的现象之一就是收集学生的外语课文语料库。它们在语言教学研究方面的潜力主要取决于数据收集的持续时间和语料库所包含的标记。文章涉及彼得罗扎沃茨克注释文本语料库中的德语学生文本语料库,以及对学生在 5 年德语学习期间所犯语言错误类型的纵向研究。研究结果是统计了分为七大类的 90 种错误,以及这些统计数字在 5 年德语学习期间的动态变化。对第一年和第五年学习中最常见错误的比较表明,在所有学习年限中,给学生造成最多问题的题目包括词素选择、拼写、遗漏、标点符号和词序颠倒。在学习结束时,不定冠词、形容词和名词的变格、复数和名词的性别等问题都已消失,取而代之的是其他问题,如冗余、逻辑、形容词句的词序和文体错误。在数字化时代和语料库技术在语言教育领域的积极推广下,语言教学专家不断发现利用大数据工作的新机遇。俄罗斯教育中一个相对较新的现象就是收集学生的外语课文语料库。它对语言教学研究的可能性主要取决于数据收集的持续时间和语料库所包含的标记。文章重点介绍了德语学生课文语料库 PACT(彼得罗扎沃茨克注释课文语料库)以及对学生在 5 年德语学习过程中所犯语言错误类型的纵向研究。研究结果统计了 90 类错误,分为 7 大类--语法、词汇、正字法、标点符号、语篇、遗漏和多余成分--以及这些统计数据在 5 年德语学习中的动态变化。对一年级和五年级学生最常犯的错误进行比较后发现,各年级学生最常出现问题的科目是词素选择、正字法、文本遗漏、标点符号和语序颠倒。在学习的最后阶段,不定冠词、形容词和名词的变格、复数形式的形成和名词的性别等问题逐渐让位于其他问题,如文本中的多余成分、逻辑、从句中的词序和文体错误。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
Longitudinal studies of language errors based on a German-language learner corpus
В эпоху цифровизации и активного распространения корпусных технологий в лингвистическом образовании специалисты в области лингводидактики постоянно открывают все новые возможности в работе с большими данными. Одним из относительно новых явлений в российском образовании является сбор корпусов ученических текстов на иностранном языке. Их возможности для лингводидактических исследований зависят прежде всего от продолжительности сбора данных и от разметки, которую содержит тот или иной корпус. В статье речь идет о корпусе немецко-язычных студенческих текстов Петрозаводского аннотированного корпуса текстов и лонгитюдном исследовании типов лингвистических ошибок, допускаемых студентами на всем протяжении изучения немецкого языка в течение 5 лет. Результатом исследования стала статистика по 90 классам ошибок, поделенных на семь основных групп, и динамика этой статистики на протяжении 5 лет обучения немецкому языку. Сравнение наиболее частотных ошибок на первом и пятом курсах показывает, что к темам, которые на протяжении всех годов обучения вызывают наибольшие проблемы у студентов, относятся выбор лексемы, орфография, пропуски, пунктуация и обратный порядок слов. Уходят к концу обучения в вузе проблемы с неопределенным артиклем, склонением прилагательных и существительных, образованием множественного числа и родом существительных, уступая место другим проблемам, таким как лишние элементы, логика, порядок слов в придаточных предложениях и стилистические ошибки. In the age of digitalization and the active spread of corpus technologies in linguistic education, linguodidactics specialists are constantly discovering new opportunities in working with big data. One relatively new phenomenon in Russian education is the collection of corpora of student texts in a foreign language. It’s possibilities for linguodidactical research depend primarily on the duration of the data collection and on the markup that corpus contains. The article focuses on the corpus of German-language student texts PACT (Petrozavodsk annotated corpus of texts) and longitudinal research of types of linguistic mistakes made by students throughout the study of the German language for 5 years. The result of the research is statistics for 90 classes of errors, divided into 7 major groups – grammar, vocabulary, orthography, punctuation, discourse, omissions and superfluous elements – and the dynamics of these statistics over the 5 years of German language study. Comparison of the most frequent errors made by 1st and 5th year students respectively shows that subjects causing the most problems for students during all years of study are lexeme selection, orthography, omissions in text, punctuation and reverse word order. At the end of study problems with indefinite articles, adjective and noun declension, formation of plural form and gender of nouns are giving way to other issues such as superfluous elements in text, logic, word order in subordinate sentences and stylistic errors.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
期刊最新文献
Features of professional training of foreign specialists at a medical university On the priorities of education in the context of global problems of the modern world Didactic tools as a condition for retraining welders on the basis of the training center of the enterprise Gender features of the relationship of evaluative conceptions with characteristics of self-attitude in adolescents The study of the relationship of the Dark and Light personality triads with psychological capital in students
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1