The importance of sampling frames in representative historical corpora : a case study of Parisian theater

IF 0.1 Q4 LINGUISTICS CogniTextes Pub Date : 2019-06-17 DOI:10.4000/COGNITEXTES.1671
Angus B. Grieve-Smith
{"title":"The importance of sampling frames in representative historical corpora : a case study of Parisian theater","authors":"Angus B. Grieve-Smith","doi":"10.4000/COGNITEXTES.1671","DOIUrl":null,"url":null,"abstract":"Pour tester les hypotheses avancees par la linguistique cognitive, il n’y a pas d’instrument plus efficace que le corpus. L’echantillonnage representatif (Laplace 1814) est une technique qui permet d’examiner des corpus plus reduits, et ainsi plus abordables, et d’en generaliser les resultats a un cadre d’echantillonnage plus large. Or, un echantillon n’est pas pertinent a une hypothese s’il n’est pas tire d’un cadre d’echantillonnage qui soit lui-meme pertinent a l’hypothese.Dans mon projet doctoral (Grieve-Smith 2009) j’ai employe le corpus FRANTEXT (CNRTL 2018) pour tester l’hypothese selon laquelle l’extension analogique d’une construction depend de sa frequence de type (Bybee 1995). J’ai compare les textes theâtraux dans FRANTEXT pour les annees 1800-1815 avec un nouveau Corpus de la Scene Parisienne, un echantillon tire du catalogue de Wicks (1950 et seq.). Dans ce nouveau corpus, les negations de phrase declarative se forment avec ne … pas dans 73,9 % des instances, tandis que dans FRANTEXT elles ne se forment avec ne … pas que dans 50,5 % des occurrences, une difference qui montre un biais en faveur de la langue litteraire dans FRANTEXT. Pour une evaluation adequate des theories basees sur l’usage concernant le changement linguistique, il faudra un corpus contenant des textes representatifs de la langue sur un siecle au minimum.","PeriodicalId":53774,"journal":{"name":"CogniTextes","volume":"1 1","pages":""},"PeriodicalIF":0.1000,"publicationDate":"2019-06-17","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"CogniTextes","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.4000/COGNITEXTES.1671","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"LINGUISTICS","Score":null,"Total":0}
引用次数: 0

Abstract

Pour tester les hypotheses avancees par la linguistique cognitive, il n’y a pas d’instrument plus efficace que le corpus. L’echantillonnage representatif (Laplace 1814) est une technique qui permet d’examiner des corpus plus reduits, et ainsi plus abordables, et d’en generaliser les resultats a un cadre d’echantillonnage plus large. Or, un echantillon n’est pas pertinent a une hypothese s’il n’est pas tire d’un cadre d’echantillonnage qui soit lui-meme pertinent a l’hypothese.Dans mon projet doctoral (Grieve-Smith 2009) j’ai employe le corpus FRANTEXT (CNRTL 2018) pour tester l’hypothese selon laquelle l’extension analogique d’une construction depend de sa frequence de type (Bybee 1995). J’ai compare les textes theâtraux dans FRANTEXT pour les annees 1800-1815 avec un nouveau Corpus de la Scene Parisienne, un echantillon tire du catalogue de Wicks (1950 et seq.). Dans ce nouveau corpus, les negations de phrase declarative se forment avec ne … pas dans 73,9 % des instances, tandis que dans FRANTEXT elles ne se forment avec ne … pas que dans 50,5 % des occurrences, une difference qui montre un biais en faveur de la langue litteraire dans FRANTEXT. Pour une evaluation adequate des theories basees sur l’usage concernant le changement linguistique, il faudra un corpus contenant des textes representatifs de la langue sur un siecle au minimum.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
代表性历史语料库中采样框架的重要性:以巴黎戏剧为例
要检验认知语言学提出的假设,没有比语料库更有效的工具了。代表性抽样(拉普拉斯1814)是一种技术,它允许检查更小的语料库,因此更负担得起,并将结果推广到更广泛的抽样框架。然而,如果一个样本不是来自一个本身与假设相关的抽样框架,那么它就与假设无关。在我的博士项目(Grieve-Smith 2009)中,我使用了FRANTEXT语料库(CNRTL 2018)来测试构造的模拟扩展依赖于其类型频率的假设(Bybee 1995)。我将《FRANTEXT》1800-1815年的戏剧文本与《巴黎场景》的新语料库进行了比较,这是《威克斯目录》(1950年等)中的一个样本。在这种新的句子大全,negations declarative形成与不... 73.9%的论坛中,而在FRANTEXT只与...不会形成中的赋存50.5%,一个通过difference),该报告显示为在FRANTEXT litteraire语言。为了充分评估与语言变化有关的基于使用的理论,我们需要一个包含至少一个世纪以来代表语言的文本的语料库。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
CogniTextes
CogniTextes LINGUISTICS-
自引率
0.00%
发文量
5
审稿时长
25 weeks
期刊最新文献
Investigating English clippings experimentally: Why markedness is always local: the case of Russian aspect Bounding in French and Romance Probing the role of bounding, definiteness and other factors: bare noun and determiner use in Guianese French Creole Reference, Deixis and Perspective.Aspectual Readings of Italian Ecco- and French
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1