Linguamatica最新文献

英文中文

Prefácio 引言

IF 0.6 Q4 LINGUISTICS

Linguamatica

Pub Date : 2018-12-07 DOI: 10.30875/5176659a-es

C. O. Nascimento

El presente volumen constituye un número especial de Análisis Filosófico dedicado a nuestro querido profesor, colega y amigo Alberto Moretti. Presenta una selección de los trabajos presentados en el Coloquio SADAF 2015 Lógica, lenguaje y representación: homenaje a Alberto Moretti, a los que se agregaron otros de colegas, discípulos, tesistas y colaboradores que de un modo u otro han querido participar en este homenaje. Todos ellos reflexionan con profundidad y rigor sobre varias de las ideas centrales que Alberto ha propuesto y desarrollado a lo largo de su carrera académica. Tanto los debates que tuvieron lugar durante el coloquio como los argumentos discutidos en estos artículos están estrechamente relacionados con las distintas facetas que sirven para trazar un primer retrato de la figura de Alberto. En primer lugar, revelan la originalidad, el rigor, la actualidad de su pensamiento filosófico, la combinación poco frecuente de vuelo filosófico y rigor formal que siempre lo caracterizó. Por otro lado, son también un fiel reflejo de su permanente y generosa disposición al diálogo y al intercambio de ideas con todos aquellos que quieran discutir seria y profundamente. Una tercera faceta de Alberto que no podemos dejar de destacar, y que también se refleja en esta compilación, es su vocación docente: su capacidad para transmitir de manera clara contenidos de suma complejidad teórica, como es habitual tanto en sus clases en el ámbito universitario como en sus exposiciones en el marco de los seminarios de SADAF. La cuarta faceta que queremos destacar es su interés por la vida institucional, en particular, por participar en todas las instancias en las que se enmarca la vida del filósofo profesional, por fomentar y enriquecer las formas existentes, y por crear nuevas formas. De ello son ejemplos contundentes tanto su actuación en la universidad como su compromiso incondicional con todas las propuestas realizadas DOI: 10.36446/af.2020.421

这本书是哲学分析的特刊，献给我们亲爱的教授、同事和朋友阿尔贝托·莫雷蒂。它展示了2015年SADAF研讨会逻辑、语言和表现:向Alberto Moretti致敬的作品选集，并添加了其他同事、门徒、tesistas和合作者，他们以某种方式希望参与这次致敬。所有这些都深入而严谨地反映了阿尔贝托在他的学术生涯中提出和发展的几个中心思想。在研讨会期间进行的讨论和这些文章中讨论的论点都与不同的方面密切相关，这些方面有助于描绘阿尔贝托的形象。首先，它们揭示了他哲学思想的原创性、严谨性和现实性，以及哲学飞行和形式严谨性的罕见结合，这一直是他的特点。另一方面，它们也忠实地反映了你一贯和慷慨地愿意同所有希望进行认真和深入讨论的人进行对话和交换意见。第三项阿尔贝托我们不能不强调的方面,也反映在了这个汇编,是教师的天职:明确传达的能力等内容的高度复杂性理论,是无论是在学术领域课下的发言SADAF讲习班。我们要强调的第四个方面是它对制度生活的兴趣，特别是参与构成职业哲学家生活框架的所有实例，促进和丰富现有形式，并创造新的形式。这是他在大学的表现和他无条件承诺的所有建议的有力例子DOI: 10.36446/af.2020.421

{"title":"Prefácio","authors":"C. O. Nascimento","doi":"10.30875/5176659a-es","DOIUrl":"https://doi.org/10.30875/5176659a-es","url":null,"abstract":"El presente volumen constituye un número especial de Análisis Filosófico dedicado a nuestro querido profesor, colega y amigo Alberto Moretti. Presenta una selección de los trabajos presentados en el Coloquio SADAF 2015 Lógica, lenguaje y representación: homenaje a Alberto Moretti, a los que se agregaron otros de colegas, discípulos, tesistas y colaboradores que de un modo u otro han querido participar en este homenaje. Todos ellos reflexionan con profundidad y rigor sobre varias de las ideas centrales que Alberto ha propuesto y desarrollado a lo largo de su carrera académica. Tanto los debates que tuvieron lugar durante el coloquio como los argumentos discutidos en estos artículos están estrechamente relacionados con las distintas facetas que sirven para trazar un primer retrato de la figura de Alberto. En primer lugar, revelan la originalidad, el rigor, la actualidad de su pensamiento filosófico, la combinación poco frecuente de vuelo filosófico y rigor formal que siempre lo caracterizó. Por otro lado, son también un fiel reflejo de su permanente y generosa disposición al diálogo y al intercambio de ideas con todos aquellos que quieran discutir seria y profundamente. Una tercera faceta de Alberto que no podemos dejar de destacar, y que también se refleja en esta compilación, es su vocación docente: su capacidad para transmitir de manera clara contenidos de suma complejidad teórica, como es habitual tanto en sus clases en el ámbito universitario como en sus exposiciones en el marco de los seminarios de SADAF. La cuarta faceta que queremos destacar es su interés por la vida institucional, en particular, por participar en todas las instancias en las que se enmarca la vida del filósofo profesional, por fomentar y enriquecer las formas existentes, y por crear nuevas formas. De ello son ejemplos contundentes tanto su actuación en la universidad como su compromiso incondicional con todas las propuestas realizadas DOI: 10.36446/af.2020.421","PeriodicalId":41819,"journal":{"name":"Linguamatica","volume":"14 1","pages":"iii-ix"},"PeriodicalIF":0.6,"publicationDate":"2018-12-07","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"41668842","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 0

Explorando a Geração Automática de Adivinhas em Português 探索葡萄牙语谜语的自动生成

IF 0.6 Q4 LINGUISTICS

Linguamatica

Pub Date : 2018-08-04 DOI: 10.21814/LM.10.1.268

Hugo Gonçalo Oliveira, Ricardo Rodrigues

begin{resumo} Neste artigo descrevemos um conjunto de experiências realizadas com o objectivo de gerar, de forma automática, adivinhas em português, tendo por base características conhecidas de um conceito. Para além de fazerem sentido, um dos objectivos seria a geração de adivinhas inéditas e, idealmente, com potencial humorístico, nem que por comparação às chamadas ``piadas secas''. Parte do desafio passou pela identificação de recursos linguísticos adequados ao nosso objectivo, a que se seguiu a definição de um conjunto de regras para os explorar, tendo em conta um conjunto de hipóteses que poderiam potenciar a originalidade e o valor humorístico. Por fim, as adivinhas foram apresentadas sob a forma de pares pergunta-resposta. O artigo foca-se principalmente num tipo de adivinha, cujo modelo de geração é dissecado e resultados são apresentados a título de exemplo. Uma amostra de adivinhas deste tipo foi classificada manualmente por avaliadores humanos que as consideraram geralmente coerentes, moderadamente originais, mas, na sua maioria, com um baixo potencial humorístico. De forma a mostrar que muito pode ainda ser feito para melhorar os resultados anteriores, nomeadamente ao nível do humor, são também apresentadas, de forma breve, outras experiências num estado ainda incipiente.

在这篇文章中，我们描述了一组实验，目的是根据一个概念的已知特征，用葡萄牙语自动生成谜语。除了使它们有意义之外，其中一个目标将是产生新的谜语，理想情况下，具有幽默的潜力，即使与所谓的“枯燥的笑话”相比。挑战的一部分是确定适合我们目标的语言资源，然后定义一套规则来探索它们，考虑一系列假设，可以增强原创性和幽默价值。最后，谜语以问答对的形式呈现。本文主要研究了一种猜谜的类型，并对其生成模型进行了剖析，并以实例的形式给出了结果。人类评价者对这类谜题的样本进行了手工分类，他们认为这些谜题通常是连贯的，适度的原创，但大多数都没有幽默的潜力。为了表明在改善之前的结果方面还有很多工作要做，特别是在情绪方面，还简要介绍了处于早期阶段的其他实验。

{"title":"Explorando a Geração Automática de Adivinhas em Português","authors":"Hugo Gonçalo Oliveira, Ricardo Rodrigues","doi":"10.21814/LM.10.1.268","DOIUrl":"https://doi.org/10.21814/LM.10.1.268","url":null,"abstract":"begin{resumo} Neste artigo descrevemos um conjunto de experiências realizadas com o objectivo de gerar, de forma automática, adivinhas em português, tendo por base características conhecidas de um conceito. Para além de fazerem sentido, um dos objectivos seria a geração de adivinhas inéditas e, idealmente, com potencial humorístico, nem que por comparação às chamadas ``piadas secas''. \u0000Parte do desafio passou pela identificação de recursos linguísticos adequados ao nosso objectivo, a que se seguiu a definição de um conjunto de regras para os explorar, tendo em conta um conjunto de hipóteses que poderiam potenciar a originalidade e o valor humorístico. Por fim, as adivinhas foram apresentadas sob a forma de pares pergunta-resposta. O artigo foca-se principalmente num tipo de adivinha, cujo modelo de geração é dissecado e resultados são apresentados a título de exemplo. Uma amostra de adivinhas deste tipo foi classificada manualmente por avaliadores humanos que as consideraram geralmente coerentes, moderadamente originais, mas, na sua maioria, com um baixo potencial humorístico. De forma a mostrar que muito pode ainda ser feito para melhorar os resultados anteriores, nomeadamente ao nível do humor, são também apresentadas, de forma breve, outras experiências num estado ainda incipiente.","PeriodicalId":41819,"journal":{"name":"Linguamatica","volume":"10 1","pages":"3-18"},"PeriodicalIF":0.6,"publicationDate":"2018-08-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"42196960","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 5

PLN.pt: Processamento de Linguagem Natural para Português como um Serviço pt:作为服务的葡萄牙语自然语言处理

IF 0.6 Q4 LINGUISTICS

Linguamatica

Pub Date : 2018-08-04 DOI: 10.21814/LM.10.1.267

N. Carvalho, Alberto Simões

As técnicas da área de Processamento de Linguagem Natural (PLN) são cada vez mais utilizadas para enriquecer aplicações nas mais diversas áreas. As ferramentas que implementam ou apoiam o desenvolvimento destas técnicas podem ser complexas de manter e explorar, sendo por vezes necessário conhecimento específico do domínio. Este artigo introduz o projeto PLN.PT, uma plataforma online que disponibiliza um conjunto de ferramentas para PLN como um serviço web (REST API), orientado principalmente para a língua portuguesa.

自然语言处理(nlp)技术越来越多地用于丰富不同领域的应用。实现或支持这些技术开发的工具可能很难维护和利用，有时需要特定领域的知识。本文介绍了PLN项目。PT是一个在线平台，为PLN提供了一套工具作为web服务(REST API)，主要面向葡萄牙语。

引用次数: 0

Estratégias Lexicométricas para Detetar Especificidades Textuais 检测文本特异性的词汇计量策略

IF 0.6 Q4 LINGUISTICS

Linguamatica

Pub Date : 2018-08-04 DOI: 10.21814/LM.10.1.263

Álvaro Iriarte Sanromán, Pablo Gamallo, Alberto Simões

Neste artigo propomo-nos a definir e desenvolver uma estratégia automática para procurar especificidades lexicais dentro de conjuntos de textos utilizando unidades lexicais simples e expressões com várias palavras, ou termos multipalavra (MWE, a sua sigla em inglês). Propomos uma metodologia para o cálculo da divergência de distribuições de lemas e de MWE que permitirá encontrar, automaticamente, diferenças e semelhanças entre textos não anotados. Esta metodologia poderá ser utilizada para posteriormente identificar grupos de textos sobre os quais se procederá a análises quantitativas e qualitativas semiautomáticas e/ou com intervenção humana. Num primeiro teste, utilizamos dois textos de especialidade (da área da pediatria) e um texto literário, presumindo que os textos de especialidade deveriam apresentar maiores divergências relativamente ao texto literário do que entre eles próprios. Como os testes feitos mostraram a tendência esperada, decidimos aplicar a mesma metodologia a um segundo grupo de textos (três conjuntos de entrevistas a visitantes da cidade de Santiago de Compostela).

在本文中，我们建议定义和发展一种自动策略，使用简单的词汇单位和多词表达，或多词术语(MWE)在文本集中搜索词汇细节。我们提出了一种计算标语和MWE分布散度的方法，该方法可以自动发现未注释文本之间的异同。该方法可用于随后识别定量和定性分析半自动和/或人工干预的文本组。在第一个测试中，我们使用了两篇专业文本(儿科领域)和一篇文学文本，假设专业文本与文学文本的差异应该大于它们之间的差异。由于测试显示了预期的趋势，我们决定将同样的方法应用于第二组文本(对圣地亚哥德孔波斯特拉市游客的三组访谈)。

引用次数: 5

Prefácio 前言

IF 0.6 Q4 LINGUISTICS

Linguamatica

Pub Date : 2018-08-04 DOI: 10.21814/lm.10.1.269

Alberto Simões, J. Almeida, Xavier Gómez Guinovart

Unha vez máis, Linguamática ve a luz neste seu décimo ano grazas á colaboración de todas e de todos, nun esforzo sostido de mantermos aberto e activo este foro de comunicación estabelecido nas nosas linguas peninsulares e no ámbito das tecnoloxías lingüísticas dos nosos idiomas. Nos últimos anos, a revista Linguamática foise consolidando na comunidade científica do procesamento da linguaxe como un medio prestixioso de difusión dos resultados da investigación e de presentación de proxectos, sendo incluída e reseñada en índices de grande relevancia como Emerging Sources Citation Index, Scopus, ERIH Plus, DBLP, LLBA ou REDIB, entre outros. Dentro deste esforzo para mantermos e mellorarmos Linguamática como medio de comunicación da nosa comunidade científica e lingüística, para este volume actualizamos o sistema de publicación de Open Journal Systems que sustenta as actividades de edición, publicación e libre acceso aos contidos da revista, ofrecendo así un deseño anovado máis versátil e eficiente que esperamos que sexa do voso agrado.

在这第十年里，Linguamatics再次看到了曙光，这要归功于每个人和每个人的合作，持续努力，以保持这个以我们半岛语言和我们语言的语言技术领域建立的交流论坛的开放和活跃。近年来，《语言》杂志一直在科学界巩固语言处理这一传播研究成果和项目演示的著名手段，并被纳入高相关性指数中，如新兴资源引文指数、Scopus、ERIH Plus、DBLP、LLBA或REDIB等。为了维护和改进语言作为我们科学和语言学界交流的一种手段，在本卷中，我们更新了开放期刊系统出版系统，该系统支持杂志的出版、出版和免费访问活动，-从而提供一个更通用、更高效的更新设计，我们希望能让您满意。

引用次数: 0

Extracción automática de definiciones analíticas y relaciones semánticas de hiponimia-hiperonimia con un sistema basado en patrones lingüísticos 使用基于语言模式的系统自动提取低同义词-高同义词的分析定义和语义关系

IF 0.6 Q4 LINGUISTICS

Linguamatica

Pub Date : 2018-01-16 DOI: 10.21814/lm.9.2.257

M. A. Dorantes, Alejandro Pimentel, Gerardo E Sierra, Gemma Bel Enguix, Claudio Molina

espanolEn el presente trabajo se muestra parte de un proyecto en curso centrada en el diseno de un automata lexicografico. El objetivo principal de la investigacion es la extraccion de definiciones analiticas y relaciones semanticas de terminos con datos tomados directamente de internet. Presentamos dos de las capacidades del sistema: la extraccion de definiciones analiticas y de hiperonimos. La metodologia consiste principalmente en la busqueda automatica de esta informacion con patrones construidos manualmente basados en la estructura lexica de definiciones analiticas en lenguaje natural. Con este desarrollo, ha sido posible mejorar la precision reportada en el estado del arte. Se ha conseguido una precision de 92.5% para la tarea de extraccion de definiciones analiticas y de las relaciones de hiperonimia. EnglishThis work is part of an ongoing project that is focused on the design of a lexicographic automaton. The main objective of the research is the extraction of analytical definitions and semantic relations of terms with data taken exclusively from internet. We present two of the abilities of the system: the extraction of a) analytical definitions and b) hypernyms. The methodology consists of the automatic search of that information with manually-built patterns based on the lexical structure of analytic definitions in natural language. This method has improved the precision reported in the state of the art. Se have reached a precision of 92.5% for the extraction of analytical definitions and for the hypernymy relations.

西班牙人这项工作是一个正在进行的项目的一部分，该项目的重点是设计词典自动化。该研究的主要目的是从直接从互联网上获取的数据中提取术语的分析定义和语义关系。我们介绍了该系统的两种功能：提取分析定义和超音波。该方法主要包括根据自然语言中分析定义的词汇结构，用人工构建的模式自动搜索这些信息。随着这一发展，有可能提高最新报告的准确性。提取分析定义和高渗关系的任务精度为92.5%。这项工作是一个正在进行的项目的一部分，该项目的重点是设计词典自动化。该研究的主要目标是提取专门从互联网上获取的术语的分析定义和语义关系。我们介绍了该系统的两种能力：提取（a）分析定义和（b）超音词。该方法包括根据自然语言分析定义的词汇结构，以人工构建的模式自动搜索该信息。该方法提高了目前报告的准确性。分析定义的提取和超音词关系的准确度达到92.5%。

{"title":"Extracción automática de definiciones analíticas y relaciones semánticas de hiponimia-hiperonimia con un sistema basado en patrones lingüísticos","authors":"M. A. Dorantes, Alejandro Pimentel, Gerardo E Sierra, Gemma Bel Enguix, Claudio Molina","doi":"10.21814/lm.9.2.257","DOIUrl":"https://doi.org/10.21814/lm.9.2.257","url":null,"abstract":"espanolEn el presente trabajo se muestra parte de un proyecto en curso centrada en el diseno de un automata lexicografico. El objetivo principal de la investigacion es la extraccion de definiciones analiticas y relaciones semanticas de terminos con datos tomados directamente de internet. Presentamos dos de las capacidades del sistema: la extraccion de definiciones analiticas y de hiperonimos. La metodologia consiste principalmente en la busqueda automatica de esta informacion con patrones construidos manualmente basados en la estructura lexica de definiciones analiticas en lenguaje natural. Con este desarrollo, ha sido posible mejorar la precision reportada en el estado del arte. Se ha conseguido una precision de 92.5% para la tarea de extraccion de definiciones analiticas y de las relaciones de hiperonimia. EnglishThis work is part of an ongoing project that is focused on the design of a lexicographic automaton. The main objective of the research is the extraction of analytical definitions and semantic relations of terms with data taken exclusively from internet. We present two of the abilities of the system: the extraction of a) analytical definitions and b) hypernyms. The methodology consists of the automatic search of that information with manually-built patterns based on the lexical structure of analytic definitions in natural language. This method has improved the precision reported in the state of the art. Se have reached a precision of 92.5% for the extraction of analytical definitions and for the hypernymy relations.","PeriodicalId":41819,"journal":{"name":"Linguamatica","volume":"9 1","pages":"33-44"},"PeriodicalIF":0.6,"publicationDate":"2018-01-16","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"44818185","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 1

Detección automática de nombres eventivos no deverbales en castellano: un enfoque cuantitativo basado en corpus 西班牙语非非语言事件名的自动检测:一种基于语料库的定量方法

IF 0.6 Q4 LINGUISTICS

Linguamatica

Pub Date : 2018-01-16 DOI: 10.21814/lm.9.2.253

Rogelio Nazar, Rebeca Soto, Karen Urrejola

espanolPresentamos un estudio en el campo de la deteccion de nombres eventivos no deverbales, que son aquellos nombres que designan eventos pero que no han pasado por un proceso de derivacion a partir de verbos, como fiesta o coctel, y no presentan por ello las pistas morfologicas tipicas de los nombres deverbales, como los afijos -cion, -miento, etc., por lo que son justamente los mas dificiles de detectar. En el presente articulo continuamos y extendemos el trabajo iniciado por Resnik (2010), quien ya ofrece pistas para la deteccion automatica de este tipo de unidades lexicas. A las sugerencias de Resnik anadimos otras, entre ellas el analisis inductivo de corpus, analizando con que tipo de palabras suele coocurrir el nombre eventivo, y utilizandolas como predictores de esta condicion. Ademas, simplificamos considerablemente el algoritmo de deteccion y aplicamos los experimentos a un corpus de mayor tamano, el EsTenTen, de mas de 9 mil millones de palabras. Finalmente, presentamos los primeros resultados de nombres eventivos extraidos automaticamente, incluyendo numerosos no deverbales. EnglishWe present a study in the field of the automatic detection of non-deverbal eventive nouns, which are those nouns that designate events but have not experienced a process of derivation from verbs, such as fiesta (`party') or coctel (`cocktail') and, for this reason, do not present the typical morphological features of deverbal nouns, such as -cion, -miento, and are therefore more difficult to detect. In the present research we continue and extend the work initiated by Resnik (2010), who offers a number of cues for the detection of this type of lexical unit. We apply Resnik's ideas and we also add new ones, among them, the inductive analysis of the words that tend to co-occur with eventive nouns in corpora, in order to use them as predictors of this condition. Furthermore, we simplify the classification algorithm considerably, and we apply the experiments to a larger corpus, the EsTenTen, comprising more than 9 billion running words. Finally, we present the first results of the automatic extraction of eventive nouns from the corpus, among which we find plenty non-deverbal nouns.

espanolPresentamos名称成为领域的研究中得到了证实eventivos deverbales的,是那些名字认知事件但尚未通过的一个流程的derivacion从动词,比如聚会或coctel,并无因此线索morfologicas tipicas deverbales人名,例如afijos -cion, -miento等等,因此正好比较难辨别。在本文中，我们继续并扩展了Resnik(2010)开始的工作，他已经为自动检测这些类型的词汇单位提供了线索。在Resnik的建议中，我们添加了其他的建议，包括归纳语料库分析，分析什么类型的词通常与事件名一起出现，并使用它们作为条件的预测器。此外，我们大大简化了检测算法，并将实验应用到一个更大的语料库，EsTenTen，超过90亿字。最后，我们提出了自动提取事件名称的第一个结果，包括许多非非事件名称。EnglishWe目前a study in the field of the automatic检测of non-deverbal eventive nouns, which are nouns that designate events的人but have not from verbs experienced a process of类别之一,如聚会(party ') or coctel“鸡尾酒”()and for this reason, do not目前the typical morphological特写of deverbal -cion nouns,,如-miento and are因此more to干扰源。在目前的研究中，我们继续并扩展了Resnik(2010)发起的工作，他为检测这类词汇单位提供了许多线索。We apply Resnik ' s ideas and We还add new ones,书籍,inductive analysis of the words that tend to co-occur with eventive nouns in的,in order to use them as predictors of this condition。此外，我们大大简化了分类算法，并将实验应用到一个更大的语料库，扩展，包括超过90亿个运行单词。最后,我们目前the first of the automatic提取结果of eventive nouns from the语料库,which we find北区中non-deverbal nouns。

{"title":"Detección automática de nombres eventivos no deverbales en castellano: un enfoque cuantitativo basado en corpus","authors":"Rogelio Nazar, Rebeca Soto, Karen Urrejola","doi":"10.21814/lm.9.2.253","DOIUrl":"https://doi.org/10.21814/lm.9.2.253","url":null,"abstract":"espanolPresentamos un estudio en el campo de la deteccion de nombres eventivos no deverbales, que son aquellos nombres que designan eventos pero que no han pasado por un proceso de derivacion a partir de verbos, como fiesta o coctel, y no presentan por ello las pistas morfologicas tipicas de los nombres deverbales, como los afijos -cion, -miento, etc., por lo que son justamente los mas dificiles de detectar. En el presente articulo continuamos y extendemos el trabajo iniciado por Resnik (2010), quien ya ofrece pistas para la deteccion automatica de este tipo de unidades lexicas. A las sugerencias de Resnik anadimos otras, entre ellas el analisis inductivo de corpus, analizando con que tipo de palabras suele coocurrir el nombre eventivo, y utilizandolas como predictores de esta condicion. Ademas, simplificamos considerablemente el algoritmo de deteccion y aplicamos los experimentos a un corpus de mayor tamano, el EsTenTen, de mas de 9 mil millones de palabras. Finalmente, presentamos los primeros resultados de nombres eventivos extraidos automaticamente, incluyendo numerosos no deverbales. EnglishWe present a study in the field of the automatic detection of non-deverbal eventive nouns, which are those nouns that designate events but have not experienced a process of derivation from verbs, such as fiesta (`party') or coctel (`cocktail') and, for this reason, do not present the typical morphological features of deverbal nouns, such as -cion, -miento, and are therefore more difficult to detect. In the present research we continue and extend the work initiated by Resnik (2010), who offers a number of cues for the detection of this type of lexical unit. We apply Resnik's ideas and we also add new ones, among them, the inductive analysis of the words that tend to co-occur with eventive nouns in corpora, in order to use them as predictors of this condition. Furthermore, we simplify the classification algorithm considerably, and we apply the experiments to a larger corpus, the EsTenTen, comprising more than 9 billion running words. Finally, we present the first results of the automatic extraction of eventive nouns from the corpus, among which we find plenty non-deverbal nouns.","PeriodicalId":41819,"journal":{"name":"Linguamatica","volume":"9 1","pages":"21-31"},"PeriodicalIF":0.6,"publicationDate":"2018-01-16","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"41562971","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 2

Una eina per a una llengua en procés d'estandardització: el traductor automàtic català-sard 一种语言标准化过程中的工具：加泰罗尼亚语撒丁语自动翻译器

IF 0.6 Q4 LINGUISTICS

Linguamatica

Pub Date : 2018-01-16 DOI: 10.21814/lm.9.2.255

Gianfranco Fronteddu, Hèctor Alòs i Font, Francis M. Tyers

catalaAquest article presenta el desenvolupament d'un sistema de traduccio automatica en codi obert basat en regles del catala al sard mitjancant la plataforma Apertium, parant una atencio especial a la creacio del diccionari bilingue i de les regles de seleccio lexica i transferencia estructural. Es mostren alguns problemes derivats de l'estat actual del sard estandard. S'ha obtingut una tassa d'error per paraula (WER) del 20,5% i una tassa d'error per paraula independent de la posicio (PER) del 13,9%. Mitjancant l'analisi qualitativa de la traduccio de quatre articles enciclopedics, s'analitzen les causes d'aquests resultats. EnglishThis article describes the development of a free/open-source rule-based machine translation system for Catalan to Sardinian based on the Apertium platform. Special attention is given to the components of the system related with transfer (structural and lexical) and lexical selection, drawing attention to issues stemming from the current state of the Sardinian written norm. The system has a word-error rate (WER) of 20.5% and a position-independent word-error rate (PER) of 13.9%. We analyse the remaining errors by doing a qualitative analysis of the translation of four articles from the encyclopaedic domain.

catala本文通过Apertium平台开发了一个基于规则的自动开源翻译系统，从catala到sard，特别关注双语词典的创建以及词汇选择和结构转换的规则。从标准sard的现状可以看出一些问题。已获得20.5%的每字错误率（WER）和13.9%的与位置无关的每字误差率（per）。通过对四篇百科全书式文章的翻译进行定性分析，分析造成这些结果的原因。英语特别关注与迁移（结构和词汇）和词汇选择相关的系统组成部分，引起人们对撒丁岛书面规范现状的关注。该系统的单词错误率（WER）为20.5%，位置无关错误率（PER）为13.9%。我们通过对百科全书领域的四篇文章的翻译进行定性分析来分析剩余的错误。

{"title":"Una eina per a una llengua en procés d'estandardització: el traductor automàtic català-sard","authors":"Gianfranco Fronteddu, Hèctor Alòs i Font, Francis M. Tyers","doi":"10.21814/lm.9.2.255","DOIUrl":"https://doi.org/10.21814/lm.9.2.255","url":null,"abstract":"catalaAquest article presenta el desenvolupament d'un sistema de traduccio automatica en codi obert basat en regles del catala al sard mitjancant la plataforma Apertium, parant una atencio especial a la creacio del diccionari bilingue i de les regles de seleccio lexica i transferencia estructural. Es mostren alguns problemes derivats de l'estat actual del sard estandard. S'ha obtingut una tassa d'error per paraula (WER) del 20,5% i una tassa d'error per paraula independent de la posicio (PER) del 13,9%. Mitjancant l'analisi qualitativa de la traduccio de quatre articles enciclopedics, s'analitzen les causes d'aquests resultats. EnglishThis article describes the development of a free/open-source rule-based machine translation system for Catalan to Sardinian based on the Apertium platform. Special attention is given to the components of the system related with transfer (structural and lexical) and lexical selection, drawing attention to issues stemming from the current state of the Sardinian written norm. The system has a word-error rate (WER) of 20.5% and a position-independent word-error rate (PER) of 13.9%. We analyse the remaining errors by doing a qualitative analysis of the translation of four articles from the encyclopaedic domain.","PeriodicalId":41819,"journal":{"name":"Linguamatica","volume":"9 1","pages":"3-20"},"PeriodicalIF":0.6,"publicationDate":"2018-01-16","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"45124895","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 1

Creació d'un motor de TAE especialitzat en farmàcia i medicina per a la combinació romanés-castellà 为罗马-西班牙的结合创造了一个制药和医疗引擎

IF 0.6 Q4 LINGUISTICS

Linguamatica

Pub Date : 2018-01-16 DOI: 10.21814/lm.9.2.254

Adrià Martín-Mor, Víctor Peña-Irles

catalaAquest article descriu el proces de creacio d’un motor de traduccio automatica estadistica especialitzat en medicina per a la combinacio linguistica romanes–castella a partir de corpus lliures disponibles a internet. S’utilitza la plataforma MTradumatica, creada en el marc d'un projecte de recerca del grup Tradumatica per a fomentar l’us de la TA entre els traductors. L’article es pot interpretar com una mostra que aquest proposit s’ha assolit en el cas d’us que presentem, la qual cosa suggereix que el perfil dels traductors es valid per dur a terme processos de personalitzacio de TA. EnglishThis article describes the process of creation of a statistical machine translation engine specialised in medicine for the Romanian–Spanish language pair. The engine was based on free corpora available in internet. The article describes the use of the platform MTradumatica developed in the context of a research project by the Tradumatica research group, aimed at promoting the use of MT among translators. The article can be interpreted as the evidence that the aim of promoting MT among translators has been attained in this particular case, and it suggests that the profile of the translators is valid to carry out processes of customisation of MT engines.

catala本文描述了从互联网上提供的免费语料库中为罗马城堡语言组合创建一个专门用于医学的自动统计翻译引擎的过程。MTradumatica平台是Tradumatica集团研究项目的一部分，用于促进TA在翻译人员之间的枢纽。这篇文章可以被解释为在我们向您介绍的案例中已经提出了这一建议，这表明译者档案对于进行TA的个性化过程是有效的。英语该引擎基于互联网上的免费语料库。本文介绍了在Tradumatica研究小组的一个研究项目中开发的MTradumatica平台的使用情况，该项目旨在促进翻译对MT的使用。这篇文章可以被解释为在这种特殊的情况下，在译者中推广机器翻译的目的已经实现的证据，并表明译者的概况对于进行机器翻译引擎的定制过程是有效的。

{"title":"Creació d'un motor de TAE especialitzat en farmàcia i medicina per a la combinació romanés-castellà","authors":"Adrià Martín-Mor, Víctor Peña-Irles","doi":"10.21814/lm.9.2.254","DOIUrl":"https://doi.org/10.21814/lm.9.2.254","url":null,"abstract":"catalaAquest article descriu el proces de creacio d’un motor de traduccio automatica estadistica especialitzat en medicina per a la combinacio linguistica romanes–castella a partir de corpus lliures disponibles a internet. S’utilitza la plataforma MTradumatica, creada en el marc d'un projecte de recerca del grup Tradumatica per a fomentar l’us de la TA entre els traductors. L’article es pot interpretar com una mostra que aquest proposit s’ha assolit en el cas d’us que presentem, la qual cosa suggereix que el perfil dels traductors es valid per dur a terme processos de personalitzacio de TA. EnglishThis article describes the process of creation of a statistical machine translation engine specialised in medicine for the Romanian–Spanish language pair. The engine was based on free corpora available in internet. The article describes the use of the platform MTradumatica developed in the context of a research project by the Tradumatica research group, aimed at promoting the use of MT among translators. The article can be interpreted as the evidence that the aim of promoting MT among translators has been attained in this particular case, and it suggests that the profile of the translators is valid to carry out processes of customisation of MT engines.","PeriodicalId":41819,"journal":{"name":"Linguamatica","volume":"9 1","pages":"45-53"},"PeriodicalIF":0.6,"publicationDate":"2018-01-16","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"41538462","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 0

GECO, un Gestor de Corpus colaborativo basado en web GECO，一个基于web的协作语料库管理器

IF 0.6 Q4 LINGUISTICS

Linguamatica

Pub Date : 2018-01-16 DOI: 10.21814/lm.9.2.256

Gerardo E Sierra, Julián Solórzano-Soto, A. Díaz

This paper presents GEstor de COrpus (GECO), an online corpus management software that lets users upload document collections and turn them into digital corpora. Inside the system, corpora can be further processed by other applications, which are implemented as modules over the GECO framework. In this document, GECO’s features are described in detail, as well as the functionality of a concordance generator module developed on top of it.

本文介绍了GEstor de COrpus (GECO)，一个在线语料库管理软件，允许用户上传文档集合并将其转换为数字语料库。在系统内部，语料库可以由其他应用程序进一步处理，这些应用程序在GECO框架上作为模块实现。在本文档中，详细描述了GECO的特性，以及在其基础上开发的一致性生成器模块的功能。

引用次数: 4

首页上一页

下一页尾页

类型

全部化学•材料生命科学医学物理工程技术环境•农林材料科学地球科学法学管理学化学环境科学与生态学计算机科学教育学经济学农林科学人文科学生物学数学物理与天体物理心理学综合性期刊其他工业工程理学历史学农学文学信息工程

数据库

全部 ACS Publications Elsevier ieeexplore Springer The Royal Society of Chemistry Wiley

期刊

Linguamatica

全部 Acc. Chem. Res. ACS Applied Bio Materials ACS Appl. Electron. Mater. ACS Appl. Energy Mater. ACS Appl. Mater. Interfaces ACS Appl. Nano Mater. ACS Appl. Polym. Mater. ACS BIOMATER-SCI ENG ACS Catal. ACS Cent. Sci. ACS Chem. Biol. ACS Chemical Health & Safety ACS Chem. Neurosci. ACS Comb. Sci. ACS Earth Space Chem. ACS Energy Lett. ACS Infect. Dis. ACS Macro Lett. ACS Mater. Lett. ACS Med. Chem. Lett. ACS Nano ACS Omega ACS Photonics ACS Sens. ACS Sustainable Chem. Eng. ACS Synth. Biol. Anal. Chem. BIOCHEMISTRY-US Bioconjugate Chem. BIOMACROMOLECULES Chem. Res. Toxicol. Chem. Rev. Chem. Mater. CRYST GROWTH DES ENERG FUEL Environ. Sci. Technol. Environ. Sci. Technol. Lett. Eur. J. Inorg. Chem. IND ENG CHEM RES Inorg. Chem. J. Agric. Food. Chem. J. Chem. Eng. Data J. Chem. Educ. J. Chem. Inf. Model. J. Chem. Theory Comput. J. Med. Chem. J. Nat. Prod. J PROTEOME RES J. Am. Chem. Soc. LANGMUIR MACROMOLECULES Mol. Pharmaceutics Nano Lett. Org. Lett. ORG PROCESS RES DEV ORGANOMETALLICS J. Org. Chem. J. Phys. Chem. J. Phys. Chem. A J. Phys. Chem. B J. Phys. Chem. C J. Phys. Chem. Lett. Analyst Anal. Methods Biomater. Sci. Catal. Sci. Technol. Chem. Commun. Chem. Soc. Rev. CHEM EDUC RES PRACT CRYSTENGCOMM Dalton Trans. Energy Environ. Sci. ENVIRON SCI-NANO ENVIRON SCI-PROC IMP ENVIRON SCI-WAT RES Faraday Discuss. Food Funct. Green Chem. Inorg. Chem. Front. Integr. Biol. J. Anal. At. Spectrom. J. Mater. Chem. A J. Mater. Chem. B J. Mater. Chem. C Lab Chip Mater. Chem. Front. Mater. Horiz. MEDCHEMCOMM Metallomics Mol. Biosyst. Mol. Syst. Des. Eng. Nanoscale Nanoscale Horiz. Nat. Prod. Rep. New J. Chem. Org. Biomol. Chem. Org. Chem. Front. PHOTOCH PHOTOBIO SCI PCCP Polym. Chem.

﹀