{"title":"COMPILACIÓN Y ANÁLISIS DE UN CORPUS PARALELO PARA LA INVESTIGACIÓN EN TRADUCCIÓN: PROYECTO CON DÉJÀ VU, TREETAGGER E IMS OPEN CORPUS WORKBENCH","authors":"Teresa Molés-Cases","doi":"10.4067/S0718-48832016000100008","DOIUrl":null,"url":null,"abstract":"Aunque en los ultimos anos la linguistica de corpus ha experimentado una gran evolucion y en la actualidad cuenta con una creciente presencia en proyectos de investigacion en torno a estudios de Linguistica y Traduccion (por ejemplo: Kubler y Foucou, 2003; Laroche y Langlais, 2010), los procedimientos tecnicos mas avanzados enfocados a la compilacion y explotacion de corpus siguen siendo un escollo. El principal proposito de este trabajo es, por tanto, hacer accesible este tipo de informacion a toda la comunidad investigadora poco experta en la materia. En concreto, presenta la experiencia de creacion de un corpus paralelo alineado con Deja Vu, etiquetado linguisticamente con TreeTagger, documentado con Notepad+ + e indexado con IMS Open Corpus Workbench. Ademas, incluye una breve introduccion a la exploracion y el analisis de corpus con Corpus Query Processor, la principal herramienta de IMS Open Corpus Workbench.","PeriodicalId":35168,"journal":{"name":"RLA","volume":"114 1","pages":"149-174"},"PeriodicalIF":0.6000,"publicationDate":"2016-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"7","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"RLA","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.4067/S0718-48832016000100008","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"0","JCRName":"LANGUAGE & LINGUISTICS","Score":null,"Total":0}
引用次数: 7
Abstract
Aunque en los ultimos anos la linguistica de corpus ha experimentado una gran evolucion y en la actualidad cuenta con una creciente presencia en proyectos de investigacion en torno a estudios de Linguistica y Traduccion (por ejemplo: Kubler y Foucou, 2003; Laroche y Langlais, 2010), los procedimientos tecnicos mas avanzados enfocados a la compilacion y explotacion de corpus siguen siendo un escollo. El principal proposito de este trabajo es, por tanto, hacer accesible este tipo de informacion a toda la comunidad investigadora poco experta en la materia. En concreto, presenta la experiencia de creacion de un corpus paralelo alineado con Deja Vu, etiquetado linguisticamente con TreeTagger, documentado con Notepad+ + e indexado con IMS Open Corpus Workbench. Ademas, incluye una breve introduccion a la exploracion y el analisis de corpus con Corpus Query Processor, la principal herramienta de IMS Open Corpus Workbench.
尽管近年来语料库语言学经历了巨大的发展,目前在语言学和翻译研究的研究项目中越来越多地出现(例如:Kubler & Foucou, 2003;在这种情况下,语料库的构建和利用的技术程序仍然是一个障碍。因此,这项工作的主要目的是使在这一领域缺乏经验的研究团体能够获得这类信息。具体来说,它展示了创建一个与Deja Vu对齐的平行语料库的经验,用TreeTagger语言标记,用notepad++文档记录,用IMS Open corpus Workbench索引。此外,它还简要介绍了IMS Open corpus Workbench的主要工具语料库查询处理器的语料库探索和分析。