首页 > 最新文献

Discours-Revue de Linguistique Psycholinguistique et Informatique最新文献

英文 中文
Correspondences between Czech and English Coreferential Expressions 捷克语和英语共指表达的对应关系
IF 0.5 Pub Date : 2015-09-09 DOI: 10.4000/DISCOURS.9058
M. Novák, A. Nedoluzhko
In this work, we present a comprehensive study on correspondences between certain classes of coreferential expressions in English and Czech. We focus on central pronouns, relative pronouns, and anaphoric zeros. We designed an alignment-refining algorithm for English personal and possessive pronouns and Czech relative pronouns that improves the quality of alignment links not only for the classes it aimed at but also in general. Moreover, the instances of anaphoric expressions we focus on were manually annotated with their alignment counterparts, which served as a basis for this empirical study. The collected statistics of correspondences are contrasted with theoretical assumptions regarding the use of anaphoric means in the languages under analysis, such as pro-drop properties, the use of finite and non-finite constructions, etc. Finally, we present the ways how the observed correspondences can be exploited in cross-lingual coreference resolution.
在这项工作中,我们对英语和捷克语中某些类型的共指表达之间的对应关系进行了全面研究。我们关注中心代词、关系代词和回指零。我们设计了一种针对英语人称代词和所有格代词以及捷克语关系代词的对齐优化算法,该算法不仅提高了所针对类的对齐链接质量,而且提高了总体的对齐质量。此外,我们还对我们关注的回指表达实例进行了人工注释,并对其进行了对齐,这为本实证研究提供了基础。收集到的对应统计数据与分析语言中回指手段使用的理论假设(如亲降性质、有限和非有限结构的使用等)进行了对比。最后,我们提出了如何在跨语言共参考解析中利用所观察到的对应关系的方法。
{"title":"Correspondences between Czech and English Coreferential Expressions","authors":"M. Novák, A. Nedoluzhko","doi":"10.4000/DISCOURS.9058","DOIUrl":"https://doi.org/10.4000/DISCOURS.9058","url":null,"abstract":"In this work, we present a comprehensive study on correspondences between certain classes of coreferential expressions in English and Czech. We focus on central pronouns, relative pronouns, and anaphoric zeros. We designed an alignment-refining algorithm for English personal and possessive pronouns and Czech relative pronouns that improves the quality of alignment links not only for the classes it aimed at but also in general. Moreover, the instances of anaphoric expressions we focus on were manually annotated with their alignment counterparts, which served as a basis for this empirical study. The collected statistics of correspondences are contrasted with theoretical assumptions regarding the use of anaphoric means in the languages under analysis, such as pro-drop properties, the use of finite and non-finite constructions, etc. Finally, we present the ways how the observed correspondences can be exploited in cross-lingual coreference resolution.","PeriodicalId":51977,"journal":{"name":"Discours-Revue de Linguistique Psycholinguistique et Informatique","volume":null,"pages":null},"PeriodicalIF":0.5,"publicationDate":"2015-09-09","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"88376402","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 19
Nouveaux médias et orthographe. Incompétence ou pluricompétence 新媒体和拼写。无能或多重能力
IF 0.5 Pub Date : 2015-09-09 DOI: 10.4000/DISCOURS.9020
Lénaïs Maskens, Louise-Amélie Cougnon, Sophie Roekhaut, Cédrick Fairon
La presente etude s’interesse a l’existence d’une pluricompetence qui permettrait aux utilisateurs de nouveaux medias de communication de passer de l’ecrit traditionnel a la CEMO (communication ecrite mediee par ordinateur) de la meme facon qu’ils changent de registre. Nous avons recolte les productions ecrites de jeunes de 14 a 15 ans a travers deux supports (electronique / papier) et dans trois situations de communication (dictee, activite en classe, Facebook) afin d’etudier l’influence de ces variables sur la gestion de l’orthographe. Les resultats aux dictees indiquent un niveau relativement bas (une erreur tous les 5 ou 6 mots) avec une majorite d’erreurs grammaticales, ce qui est conforme aux etudes precedemment menees sur le sujet. L’observation des unites communes aux trois corpus montre que l’on retrouve la forme graphique standard dans au moins un des corpus (sinon plusieurs), et ce, chez tous les eleves. Le meme type d’analyse d’unites communes menee sur le corpus Facebook uniquement montre que la forme standard est maitrisee dans un grand nombre de cas (88 % des formes) par les eleves. Enfin, nous observons que la palette de variantes graphiques utilisee dans les conversations Facebook est assez limitee (principalement abreviations, smileys et caracteres echos) et que le taux de compression des formes est assez faible, indiquant que la plupart des formes sont respectees dans leur totalite ou reduites d’un seul caractere.
本研究关注的是多能力的存在,这将允许新媒体的用户从传统的书面形式过渡到CEMO(计算机测量的书面形式),就像他们改变记录一样。我们通过两种媒体(电子/纸)和三种交流情况(听写、课堂活动、Facebook)收集了14 - 15岁青少年的书面作品,以研究这些变量对拼写管理的影响。听写结果显示水平相对较低(每5或6个单词有一个错误),语法错误较多,这与之前对该主题的研究一致。对三个语料库共同单位的观察表明,在所有学生中,至少有一个语料库(如果不是几个)使用标准图形形式。在Facebook语料库中进行的相同类型的公共单元分析仅表明,标准形式在大量情况下(88%的形式)是由学生掌握的。图形。最后,我们看到的是一系列变体使用Facebook聊天中主要是很有限的(缩写、笑脸和字符echos)和压缩率相当低的形式,表明他们中大多数是respectees形式·thick reduites或者单一的性格。
{"title":"Nouveaux médias et orthographe. Incompétence ou pluricompétence","authors":"Lénaïs Maskens, Louise-Amélie Cougnon, Sophie Roekhaut, Cédrick Fairon","doi":"10.4000/DISCOURS.9020","DOIUrl":"https://doi.org/10.4000/DISCOURS.9020","url":null,"abstract":"La presente etude s’interesse a l’existence d’une pluricompetence qui permettrait aux utilisateurs de nouveaux medias de communication de passer de l’ecrit traditionnel a la CEMO (communication ecrite mediee par ordinateur) de la meme facon qu’ils changent de registre. Nous avons recolte les productions ecrites de jeunes de 14 a 15 ans a travers deux supports (electronique / papier) et dans trois situations de communication (dictee, activite en classe, Facebook) afin d’etudier l’influence de ces variables sur la gestion de l’orthographe. Les resultats aux dictees indiquent un niveau relativement bas (une erreur tous les 5 ou 6 mots) avec une majorite d’erreurs grammaticales, ce qui est conforme aux etudes precedemment menees sur le sujet. L’observation des unites communes aux trois corpus montre que l’on retrouve la forme graphique standard dans au moins un des corpus (sinon plusieurs), et ce, chez tous les eleves. Le meme type d’analyse d’unites communes menee sur le corpus Facebook uniquement montre que la forme standard est maitrisee dans un grand nombre de cas (88 % des formes) par les eleves. Enfin, nous observons que la palette de variantes graphiques utilisee dans les conversations Facebook est assez limitee (principalement abreviations, smileys et caracteres echos) et que le taux de compression des formes est assez faible, indiquant que la plupart des formes sont respectees dans leur totalite ou reduites d’un seul caractere.","PeriodicalId":51977,"journal":{"name":"Discours-Revue de Linguistique Psycholinguistique et Informatique","volume":null,"pages":null},"PeriodicalIF":0.5,"publicationDate":"2015-09-09","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"80645221","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 5
Anaphore possessive et anaphore associative : le cas des noms collectifs 所有格和联想的回指:集体名词的情况
IF 0.5 Pub Date : 2015-09-09 DOI: 10.4000/DISCOURS.8981
M. Salles
Cet article est consacre a differentes relations anaphoriques pouvant s’etablir entre un nom collectif (ex. regiment, caravane, foret) et les noms de ses membres (ex. soldats, chameaux, arbres, pour les trois noms collectifs precedents) : anaphore associative dans des sequences telles que un regiment… les soldats, anaphore possessive de la collection aux membres (un regiment… ses soldats) ou des membres a la collection (des soldats… leur regiment), entre autres exemples. Parfois d’une grande souplesse anaphorique, comparee a une relation semantique proche comme la meronymie (ex. arbre / tronc, voiture / moteur), la relation membre-collection presente aussi des restrictions surprenantes. Cette souplesse comme ces blocages s’expliquent a la fois par les proprietes referentielles des collections (leur pluralite et leur homogeneite internes) et par certaines proprietes semantiques de la relation membre-collection (notamment le caractere generalement non relationnel ou categorematique du nom de membre). On s’interessera plus specifiquement ici a l’alternance du defini associatif et du possessif devant les noms de membres. L’homogeneite interne qui caracterise les collections expliquera pourquoi l’anaphore associative n’est pas possible avec certains noms, les noms generiques de membres (qui, eux, sont relationnels ; ex. membre, element) : ces derniers ne laissent en effet aucune place a la differenciation reclamee par l’anaphore associative et imposent alors l’emploi du possessif. Le caractere generalement non relationnel du nom de membre expliquera pourquoi le possessif ne constitue pas un veritable concurrent au defini associatif dans les autres cas. On soulignera pour finir que, lorsque toutes les conditions sont reunies pour l’emploi de l’un ou l’autre determinant, le choix referentiel n’est pas sans incidence sur l’interpretation des relations de coherence.
本文是不同关系花了霍姆斯的名号与集体之间可能s’etablir(例如:兵团、房车、foret)及其成员姓名(如兵、骆驼、树木,对于前三个名字集体):anaphore联想这样的序列中的一个兵团...兵、anaphore占有欲的藏品的成员(一个兵团...兵)或其直系收藏了...士兵(兵团),他们之间的其他例子。与密切的语义关系(如树/树干,汽车/引擎)相比,成员-收集关系有时具有很大的回指灵活性,但也有一些令人惊讶的限制。这种灵活性和这些阻塞都可以用集合的引用属性(它们的内部多元性和同质性)和成员-集合关系的某些语义属性(特别是成员名的非关系或分类特征)来解释。在这里,我们将特别关注成员名称前的联想定义和所有格的交替。集合特征的内部同质性将解释为什么某些名称不可能有联想的隐喻,成员的通用名称(它们本身是关系的;例如,成员,元素):后者实际上没有留下任何空间来区分联想隐喻所要求的,因此强制使用所有格。成员名通常不相关的特征将解释为什么所有格在其他情况下不构成联想定义的真正竞争对手。最后,应该强调的是,当使用一种或另一种决定因素的所有条件都满足时,参考选择对一致性关系的解释并非没有影响。
{"title":"Anaphore possessive et anaphore associative : le cas des noms collectifs","authors":"M. Salles","doi":"10.4000/DISCOURS.8981","DOIUrl":"https://doi.org/10.4000/DISCOURS.8981","url":null,"abstract":"Cet article est consacre a differentes relations anaphoriques pouvant s’etablir entre un nom collectif (ex. regiment, caravane, foret) et les noms de ses membres (ex. soldats, chameaux, arbres, pour les trois noms collectifs precedents) : anaphore associative dans des sequences telles que un regiment… les soldats, anaphore possessive de la collection aux membres (un regiment… ses soldats) ou des membres a la collection (des soldats… leur regiment), entre autres exemples. Parfois d’une grande souplesse anaphorique, comparee a une relation semantique proche comme la meronymie (ex. arbre / tronc, voiture / moteur), la relation membre-collection presente aussi des restrictions surprenantes. Cette souplesse comme ces blocages s’expliquent a la fois par les proprietes referentielles des collections (leur pluralite et leur homogeneite internes) et par certaines proprietes semantiques de la relation membre-collection (notamment le caractere generalement non relationnel ou categorematique du nom de membre). On s’interessera plus specifiquement ici a l’alternance du defini associatif et du possessif devant les noms de membres. L’homogeneite interne qui caracterise les collections expliquera pourquoi l’anaphore associative n’est pas possible avec certains noms, les noms generiques de membres (qui, eux, sont relationnels ; ex. membre, element) : ces derniers ne laissent en effet aucune place a la differenciation reclamee par l’anaphore associative et imposent alors l’emploi du possessif. Le caractere generalement non relationnel du nom de membre expliquera pourquoi le possessif ne constitue pas un veritable concurrent au defini associatif dans les autres cas. On soulignera pour finir que, lorsque toutes les conditions sont reunies pour l’emploi de l’un ou l’autre determinant, le choix referentiel n’est pas sans incidence sur l’interpretation des relations de coherence.","PeriodicalId":51977,"journal":{"name":"Discours-Revue de Linguistique Psycholinguistique et Informatique","volume":null,"pages":null},"PeriodicalIF":0.5,"publicationDate":"2015-09-09","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"86339898","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 1
Dislocation clitique de l’objet à gauche en français écrit 用法语书写的左边物体的clitic位移
IF 0.5 Pub Date : 2015-09-09 DOI: 10.4000/DISCOURS.9037
Etienne Riou, Barbara Hemforth
Cet article porte sur l’acceptabilite des constructions syntaxiques a la lumiere de la distinction entre francais oral et francais ecrit. Nous presentons cette distinction comme un facteur appartenant a une approche multifactorielle. Ladite approche inclut les contraintes pragmatiques, stylistiques, et syntaxiques qui influencent l’acceptabilite d’un enonce. Nous argumentons qu’il est possible d’ameliorer l’acceptabilite d’une construction associee au francais oral, la dislocation clitique de l’objet a gauche, dans un contexte ecrit en modifiant la structure informationnelle du discours. Nous presentons une serie d’experiences testant l’acceptabilite de la construction a l’ecrit sous diverses contraintes informationnelles. Nous proposerons un modele incluant les memes contraintes pour le francais parle et ecrit en integrant la modalite comme predicteur.
本文从口语法语和书面法语的区别来研究句法结构的可接受性。我们将这种区别作为多因素方法中的一个因素提出。这种方法包括影响陈述可接受性的语用、文体和句法约束。我们认为,在书面语境中,通过改变话语的信息结构,有可能提高与口语法语相关的结构的可接受性,即左侧客体的clilocation。我们提出了一系列的实验,以测试书面结构在各种信息约束下的可接受性。我们将提出一个模型,包括法语口语和写作的相同约束,将情态作为谓词。
{"title":"Dislocation clitique de l’objet à gauche en français écrit","authors":"Etienne Riou, Barbara Hemforth","doi":"10.4000/DISCOURS.9037","DOIUrl":"https://doi.org/10.4000/DISCOURS.9037","url":null,"abstract":"Cet article porte sur l’acceptabilite des constructions syntaxiques a la lumiere de la distinction entre francais oral et francais ecrit. Nous presentons cette distinction comme un facteur appartenant a une approche multifactorielle. Ladite approche inclut les contraintes pragmatiques, stylistiques, et syntaxiques qui influencent l’acceptabilite d’un enonce. Nous argumentons qu’il est possible d’ameliorer l’acceptabilite d’une construction associee au francais oral, la dislocation clitique de l’objet a gauche, dans un contexte ecrit en modifiant la structure informationnelle du discours. Nous presentons une serie d’experiences testant l’acceptabilite de la construction a l’ecrit sous diverses contraintes informationnelles. Nous proposerons un modele incluant les memes contraintes pour le francais parle et ecrit en integrant la modalite comme predicteur.","PeriodicalId":51977,"journal":{"name":"Discours-Revue de Linguistique Psycholinguistique et Informatique","volume":null,"pages":null},"PeriodicalIF":0.5,"publicationDate":"2015-09-09","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"73959951","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 2
MDMA. Un modèle pour l’identification et l’annotation des marqueurs discursifs « potentiels » en contexte MDMA。在语境中识别和注释“潜在”话语标记的模型
IF 0.5 Pub Date : 2015-09-09 DOI: 10.4000/DISCOURS.9009
C. Bolly, Ludivine Crible, Liesbeth Degand, Deniz Uygur-Distexhe
Partant du constat qu’il n’existe pas de categorie fermee de marqueurs discursifs (MD) et que la definition de ces marqueurs varie fortement selon le cadre epistemologique adopte, l’objectif du projet MDMA (« Model for Discourse Marker Annotation ») est d’etablir une methode empirique d’identification et d’annotation des MD en francais oral. La methode vise tout d’abord a decrire les MD en faisceaux de variables et ensuite, d’un point de vue combinatoire, en patrons specifiques. Notre demarche comprend trois etapes : (i) reperage manuel de tous les MD dits « potentiels » dans un corpus equilibre en francais oral (5 000 mots ; Belgique et France) ; (ii) extraction automatique de toutes les formes qui correspondent aux MD potentiels identifies precedemment (1 181 occurrences) ; (iii) analyse parametrique d’un echantillon aleatoire de 200 MD potentiels en contexte (variables syntaxiques, formelles et semantico-pragmatiques). L’hypothese est que l’analyse statistique des contraintes distributionnelles imposees aux differents MD potentiels devrait reveler une certaine hierarchisation entre variables annotees, concernant leur pertinence, leur fiabilite et leur generalisabilite (voire leur specificite). Dans cet article, nous presenterons les principes d’annotation des MD, nous aborderons ensuite la problematique de l’accord inter-juges, pour finalement discuter de maniere plus approfondie les resultats de l’analyse sur corpus.
认知出发,尚无fermee类话语标记(MD),并定义这些标志物epistemologique框架而异,通过该项目的MDMA(«Model for马克最终讨论加注»)是妨碍一切实证方法的识别和加注MD法语口语。该方法的目的首先是将MD描述为一组变量,然后从组合的角度描述为特定的模式。我们的方法包括三个步骤:(i)在一个平衡的法语口语语料库(5000个单词;比利时和法国);(ii)自动提取与上述识别的潜在MD相对应的所有表格(1181次);(iii)对200个潜在MD随机样本进行参数分析(句法、形式和语义-语用变量)。假设是,对不同潜在MD的分布约束的统计分析应该揭示注释变量之间关于它们的相关性、可靠性和通用性(甚至它们的特殊性)的某种层次结构。在本文中,我们将介绍dm注释的原则,然后讨论法官间协议的问题,最后更深入地讨论语料库分析的结果。
{"title":"MDMA. Un modèle pour l’identification et l’annotation des marqueurs discursifs « potentiels » en contexte","authors":"C. Bolly, Ludivine Crible, Liesbeth Degand, Deniz Uygur-Distexhe","doi":"10.4000/DISCOURS.9009","DOIUrl":"https://doi.org/10.4000/DISCOURS.9009","url":null,"abstract":"Partant du constat qu’il n’existe pas de categorie fermee de marqueurs discursifs (MD) et que la definition de ces marqueurs varie fortement selon le cadre epistemologique adopte, l’objectif du projet MDMA (« Model for Discourse Marker Annotation ») est d’etablir une methode empirique d’identification et d’annotation des MD en francais oral. La methode vise tout d’abord a decrire les MD en faisceaux de variables et ensuite, d’un point de vue combinatoire, en patrons specifiques. Notre demarche comprend trois etapes : (i) reperage manuel de tous les MD dits « potentiels » dans un corpus equilibre en francais oral (5 000 mots ; Belgique et France) ; (ii) extraction automatique de toutes les formes qui correspondent aux MD potentiels identifies precedemment (1 181 occurrences) ; (iii) analyse parametrique d’un echantillon aleatoire de 200 MD potentiels en contexte (variables syntaxiques, formelles et semantico-pragmatiques). L’hypothese est que l’analyse statistique des contraintes distributionnelles imposees aux differents MD potentiels devrait reveler une certaine hierarchisation entre variables annotees, concernant leur pertinence, leur fiabilite et leur generalisabilite (voire leur specificite). Dans cet article, nous presenterons les principes d’annotation des MD, nous aborderons ensuite la problematique de l’accord inter-juges, pour finalement discuter de maniere plus approfondie les resultats de l’analyse sur corpus.","PeriodicalId":51977,"journal":{"name":"Discours-Revue de Linguistique Psycholinguistique et Informatique","volume":null,"pages":null},"PeriodicalIF":0.5,"publicationDate":"2015-09-09","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"87001893","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 6
Evaluative Meaning and Cohesion: The Structuring Function of Evaluative Meaning in Scientific Writing 评价意义与衔接:科技写作中评价意义的结构功能
IF 0.5 Pub Date : 2015-09-09 DOI: 10.4000/DISCOURS.9053
Stefania Degaetano-Ortlieb
We present a diachronic study of evaluative meaning in scientific writing, focusing on evaluative expressions that possibly serve the interpersonal as well as the textual metafunction in terms of Systemic Functional Linguistics (SFL). These are expressions such as importantly or obviously used in sentence-initial position to evaluate what follows but which also establish a cohesive link with the adjacent discourse. For the analysis, the SciTex corpus, comprising nine scientific disciplines, was used. The data were analyzed in macro and micro-analytical steps combining quantitative and qualitative analyses. This allows us to observe generalizable trends as well as fine-grained distinctions.
本文从系统功能语言学的角度对科学写作中的评价意义进行了历时性研究,重点研究了可能服务于人际关系和语篇元功能的评价表达。这些短语如important或obvious用于句子开头位置,用来评价后面的内容,但也与相邻的话语建立起衔接联系。为了进行分析,使用了包含9个科学学科的SciTex语料库。采用定量与定性相结合的宏观与微观分析方法对数据进行分析。这使我们能够观察到可概括的趋势以及细粒度的区别。
{"title":"Evaluative Meaning and Cohesion: The Structuring Function of Evaluative Meaning in Scientific Writing","authors":"Stefania Degaetano-Ortlieb","doi":"10.4000/DISCOURS.9053","DOIUrl":"https://doi.org/10.4000/DISCOURS.9053","url":null,"abstract":"We present a diachronic study of evaluative meaning in scientific writing, focusing on evaluative expressions that possibly serve the interpersonal as well as the textual metafunction in terms of Systemic Functional Linguistics (SFL). These are expressions such as importantly or obviously used in sentence-initial position to evaluate what follows but which also establish a cohesive link with the adjacent discourse. For the analysis, the SciTex corpus, comprising nine scientific disciplines, was used. The data were analyzed in macro and micro-analytical steps combining quantitative and qualitative analyses. This allows us to observe generalizable trends as well as fine-grained distinctions.","PeriodicalId":51977,"journal":{"name":"Discours-Revue de Linguistique Psycholinguistique et Informatique","volume":null,"pages":null},"PeriodicalIF":0.5,"publicationDate":"2015-09-09","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"75970162","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 2
A Quantitative Analysis of Discourse Phenomena in Machine Translation 机器翻译语篇现象的定量分析
IF 0.5 Pub Date : 2015-09-09 DOI: 10.4000/DISCOURS.9047
Carolina Scarton, Lucia Specia
State-of-the-art Machine Translation (MT) systems translate documents by considering isolated sentences, disregarding information beyond sentence level. As a result, machine-translated documents often contain problems related to discourse coherence and cohesion. Recently, some initiatives in the evaluation and quality estimation of MT outputs have attempted to detect discourse problems in order to assess the quality of these machine translations. However, a quantitative analysis of discourse phenomena in MT outputs is still needed in order to better understand the phenomena and identify possible solutions or ways to improve evaluation. This paper aims to answer the following questions: What is the impact of discourse phenomena on MT quality? Can we capture and measure quantitatively any issues related to discourse in MT outputs? In order to answer these questions, we present a quantitative analysis of several discourse phenomena and correlate the resulting figures with scores from automatic translation quality evaluation metrics. We show that figures related to discourse phenomena present a higher correlation with quality scores than the baseline counts widely used for quality estimation of MT.
最先进的机器翻译(MT)系统通过考虑孤立的句子来翻译文档,而忽略句子级别以外的信息。因此,机器翻译文档中经常存在语篇连贯和衔接的问题。最近,在机器翻译输出的评估和质量估计中,一些举措试图检测话语问题,以评估这些机器翻译的质量。然而,仍然需要对机器翻译输出中的语篇现象进行定量分析,以便更好地理解这些现象,并确定可能的解决方案或改进评估的方法。本文旨在回答以下问题:话语现象对机器翻译质量的影响是什么?我们能否在机器翻译输出中捕获和定量测量与话语相关的任何问题?为了回答这些问题,我们对几种话语现象进行了定量分析,并将结果与自动翻译质量评估指标的得分相关联。我们表明,与话语现象相关的数字与质量分数的相关性高于广泛用于机器翻译质量估计的基线计数。
{"title":"A Quantitative Analysis of Discourse Phenomena in Machine Translation","authors":"Carolina Scarton, Lucia Specia","doi":"10.4000/DISCOURS.9047","DOIUrl":"https://doi.org/10.4000/DISCOURS.9047","url":null,"abstract":"State-of-the-art Machine Translation (MT) systems translate documents by considering isolated sentences, disregarding information beyond sentence level. As a result, machine-translated documents often contain problems related to discourse coherence and cohesion. Recently, some initiatives in the evaluation and quality estimation of MT outputs have attempted to detect discourse problems in order to assess the quality of these machine translations. However, a quantitative analysis of discourse phenomena in MT outputs is still needed in order to better understand the phenomena and identify possible solutions or ways to improve evaluation. This paper aims to answer the following questions: What is the impact of discourse phenomena on MT quality? Can we capture and measure quantitatively any issues related to discourse in MT outputs? In order to answer these questions, we present a quantitative analysis of several discourse phenomena and correlate the resulting figures with scores from automatic translation quality evaluation metrics. We show that figures related to discourse phenomena present a higher correlation with quality scores than the baseline counts widely used for quality estimation of MT.","PeriodicalId":51977,"journal":{"name":"Discours-Revue de Linguistique Psycholinguistique et Informatique","volume":null,"pages":null},"PeriodicalIF":0.5,"publicationDate":"2015-09-09","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"74511388","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 8
Quelques orientations méthodologiques pour étudier la gestuelle dans des corpus spontanés et semi-contrôlés 自发和半控制语料库中手势研究的方法学方向
IF 0.5 Pub Date : 2014-12-19 DOI: 10.4000/DISCOURS.8917
Marion Tellier
Cet article dresse un panorama methodologique en vue de l’etude de la parole dans une perspective multimodale. Il ne s’agit donc pas de donner ici des resultats mais de montrer un peu les coulisses d’une etude multimodale en revelant les questionnements methodologiques que tout chercheur doit se poser avant d’entreprendre une telle etude. Ainsi, cet article abordera la question du recueil des elements constituant un corpus multimodal, de l’annotation (et notamment de la conception d’un schema d’annotation) et enfin de la methodologie du contre-codage en vue de valider les annotations. Il presentera donc diverses etudes et se fera le temoin de plusieurs experiences methodologiques. L’accent sera mis en particulier sur les etudes de la gestuelle coverbale mais tout en envisageant le transfert de ces approches methodologiques a d’autres modalites telles que les expressions faciales, le regard ou encore les postures.
本文概述了多模态语音研究的方法论。因此,这里的目的不是给出结果,而是通过揭示每个研究人员在进行这样的研究之前必须问自己的方法论问题,来展示多模式研究的一些幕后情况。因此,本文将讨论多模态语料库元素的收集、注释(特别是注释模式的设计)以及验证注释的反编码方法。因此,它将提出各种各样的研究,并将展示一些方法实验。重点将特别放在对位手势的研究上,但同时考虑将这些方法转移到其他模式,如面部表情、凝视或姿势。
{"title":"Quelques orientations méthodologiques pour étudier la gestuelle dans des corpus spontanés et semi-contrôlés","authors":"Marion Tellier","doi":"10.4000/DISCOURS.8917","DOIUrl":"https://doi.org/10.4000/DISCOURS.8917","url":null,"abstract":"Cet article dresse un panorama methodologique en vue de l’etude de la parole dans une perspective multimodale. Il ne s’agit donc pas de donner ici des resultats mais de montrer un peu les coulisses d’une etude multimodale en revelant les questionnements methodologiques que tout chercheur doit se poser avant d’entreprendre une telle etude. Ainsi, cet article abordera la question du recueil des elements constituant un corpus multimodal, de l’annotation (et notamment de la conception d’un schema d’annotation) et enfin de la methodologie du contre-codage en vue de valider les annotations. Il presentera donc diverses etudes et se fera le temoin de plusieurs experiences methodologiques. L’accent sera mis en particulier sur les etudes de la gestuelle coverbale mais tout en envisageant le transfert de ces approches methodologiques a d’autres modalites telles que les expressions faciales, le regard ou encore les postures.","PeriodicalId":51977,"journal":{"name":"Discours-Revue de Linguistique Psycholinguistique et Informatique","volume":null,"pages":null},"PeriodicalIF":0.5,"publicationDate":"2014-12-19","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"87187371","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 15
Expressions parenthétiques dans un corpus parallèle français-grec : les adverbiaux de conviction personnelle 法希平行语料库中的括号表达式:个人信念副词
IF 0.5 Pub Date : 2014-12-19 DOI: 10.4000/DISCOURS.8929
Fryni Kakoyianni-Doa
Le present article est consacre a l’etude descriptive et comparative d’un sous-ensemble d’adverbiaux de phrase francais et grecs, dits parenthetiques, qui se referent a la conviction personnelle du locuteur vis-a-vis de l’information transmise. Plus particulierement, sont examinees, dans un corpus reel, des formes adverbiales de conviction personnelle qui ont des rapports etroits avec les verbes parenthetiques croire et penser.
这篇文章致力于描述性和比较研究法语和希腊短语副词的一个子集,称为括号,指的是说话者对所传递信息的个人信念。更具体地说,在一个真实的语料库中,个人信念的状语形式与括号动词belief和think密切相关。
{"title":"Expressions parenthétiques dans un corpus parallèle français-grec : les adverbiaux de conviction personnelle","authors":"Fryni Kakoyianni-Doa","doi":"10.4000/DISCOURS.8929","DOIUrl":"https://doi.org/10.4000/DISCOURS.8929","url":null,"abstract":"Le present article est consacre a l’etude descriptive et comparative d’un sous-ensemble d’adverbiaux de phrase francais et grecs, dits parenthetiques, qui se referent a la conviction personnelle du locuteur vis-a-vis de l’information transmise. Plus particulierement, sont examinees, dans un corpus reel, des formes adverbiales de conviction personnelle qui ont des rapports etroits avec les verbes parenthetiques croire et penser.","PeriodicalId":51977,"journal":{"name":"Discours-Revue de Linguistique Psycholinguistique et Informatique","volume":null,"pages":null},"PeriodicalIF":0.5,"publicationDate":"2014-12-19","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"85581678","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Authorial Presence in French and English: “Pronoun + Verb” Patterns in Biology and Medicine Research Articles 法语和英语作者的存在:生物学和医学研究文章中的“代词+动词”模式
IF 0.5 Pub Date : 2014-12-19 DOI: 10.4000/DISCOURS.8941
Laura M. Hartwell, Marie-Paule Jacques
Certain subjective qualities of scientific research articles are exposed when authors refer to themselves through various means including pronoun use. Drawing upon the online bilingual “Scientext” corpus, we compare personal pronoun and syntactically linked verb constructions within 180 published articles in English and French in the fields of medicine and biology. This study found that overall pronoun frequency was significantly higher (χ2 = 69.45, df = 1, p < 0.001) in English (22.6 per 10,000) than in French (14 per 10,000) and that the French on [one] (23.8%) was significantly more frequent (χ2 = 163.35, df = 1, p < 0.001) than the English pronoun “one” (3.8%). Furthermore, while most French verbs were limited to the present and passe compose, English conjugation was distributed mainly between the simple past, the simple present, and the present perfect. Both the lexis and the conjugation vary with the progression of the research article and the author roles of researcher, writer, arguer, and evaluator. This paper contributes to the discussion of the representation of objectivity in scientific discourse.
当作者通过各种方式包括代词的使用来指代自己时,会暴露出科研文章的某些主观品质。利用在线双语“科学文本”语料库,我们比较了180篇发表在医学和生物学领域的英语和法语文章中的人称代词和句法连接动词结构。本研究发现,英语代词的总频率(22.6 / 10000)显著高于法语(14 / 10000)(χ2 = 69.45, df = 1, p < 0.001),法语on [one](23.8%)显著高于英语代词“one”(3.8%)(χ2 = 163.35, df = 1, p < 0.001)。此外,大多数法语动词仅限于现在时和过去时,而英语动词的变化主要分布在一般过去时、一般现在时和现在完成时之间。词汇和词形随研究文章的进展以及作者的角色(研究者、作者、论证者和评价者)而变化。本文对科学话语中的客观性表征进行了探讨。
{"title":"Authorial Presence in French and English: “Pronoun + Verb” Patterns in Biology and Medicine Research Articles","authors":"Laura M. Hartwell, Marie-Paule Jacques","doi":"10.4000/DISCOURS.8941","DOIUrl":"https://doi.org/10.4000/DISCOURS.8941","url":null,"abstract":"Certain subjective qualities of scientific research articles are exposed when authors refer to themselves through various means including pronoun use. Drawing upon the online bilingual “Scientext” corpus, we compare personal pronoun and syntactically linked verb constructions within 180 published articles in English and French in the fields of medicine and biology. This study found that overall pronoun frequency was significantly higher (χ2 = 69.45, df = 1, p < 0.001) in English (22.6 per 10,000) than in French (14 per 10,000) and that the French on [one] (23.8%) was significantly more frequent (χ2 = 163.35, df = 1, p < 0.001) than the English pronoun “one” (3.8%). Furthermore, while most French verbs were limited to the present and passe compose, English conjugation was distributed mainly between the simple past, the simple present, and the present perfect. Both the lexis and the conjugation vary with the progression of the research article and the author roles of researcher, writer, arguer, and evaluator. This paper contributes to the discussion of the representation of objectivity in scientific discourse.","PeriodicalId":51977,"journal":{"name":"Discours-Revue de Linguistique Psycholinguistique et Informatique","volume":null,"pages":null},"PeriodicalIF":0.5,"publicationDate":"2014-12-19","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"91225701","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 5
期刊
Discours-Revue de Linguistique Psycholinguistique et Informatique
全部 Acc. Chem. Res. ACS Applied Bio Materials ACS Appl. Electron. Mater. ACS Appl. Energy Mater. ACS Appl. Mater. Interfaces ACS Appl. Nano Mater. ACS Appl. Polym. Mater. ACS BIOMATER-SCI ENG ACS Catal. ACS Cent. Sci. ACS Chem. Biol. ACS Chemical Health & Safety ACS Chem. Neurosci. ACS Comb. Sci. ACS Earth Space Chem. ACS Energy Lett. ACS Infect. Dis. ACS Macro Lett. ACS Mater. Lett. ACS Med. Chem. Lett. ACS Nano ACS Omega ACS Photonics ACS Sens. ACS Sustainable Chem. Eng. ACS Synth. Biol. Anal. Chem. BIOCHEMISTRY-US Bioconjugate Chem. BIOMACROMOLECULES Chem. Res. Toxicol. Chem. Rev. Chem. Mater. CRYST GROWTH DES ENERG FUEL Environ. Sci. Technol. Environ. Sci. Technol. Lett. Eur. J. Inorg. Chem. IND ENG CHEM RES Inorg. Chem. J. Agric. Food. Chem. J. Chem. Eng. Data J. Chem. Educ. J. Chem. Inf. Model. J. Chem. Theory Comput. J. Med. Chem. J. Nat. Prod. J PROTEOME RES J. Am. Chem. Soc. LANGMUIR MACROMOLECULES Mol. Pharmaceutics Nano Lett. Org. Lett. ORG PROCESS RES DEV ORGANOMETALLICS J. Org. Chem. J. Phys. Chem. J. Phys. Chem. A J. Phys. Chem. B J. Phys. Chem. C J. Phys. Chem. Lett. Analyst Anal. Methods Biomater. Sci. Catal. Sci. Technol. Chem. Commun. Chem. Soc. Rev. CHEM EDUC RES PRACT CRYSTENGCOMM Dalton Trans. Energy Environ. Sci. ENVIRON SCI-NANO ENVIRON SCI-PROC IMP ENVIRON SCI-WAT RES Faraday Discuss. Food Funct. Green Chem. Inorg. Chem. Front. Integr. Biol. J. Anal. At. Spectrom. J. Mater. Chem. A J. Mater. Chem. B J. Mater. Chem. C Lab Chip Mater. Chem. Front. Mater. Horiz. MEDCHEMCOMM Metallomics Mol. Biosyst. Mol. Syst. Des. Eng. Nanoscale Nanoscale Horiz. Nat. Prod. Rep. New J. Chem. Org. Biomol. Chem. Org. Chem. Front. PHOTOCH PHOTOBIO SCI PCCP Polym. Chem.
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1