Erick Rocha Fonseca, L. Santos, Marcelo Criscuolo, Sandra M. Aluísio
{"title":"Visão Geral da Avaliação de Similaridade Semântica e Inferência Textual","authors":"Erick Rocha Fonseca, L. Santos, Marcelo Criscuolo, Sandra M. Aluísio","doi":"10.21814/LM.8.2.235","DOIUrl":null,"url":null,"abstract":"Inferencia Textual e Similaridade Semântica sao duas tarefas do processamento de linguas naturais que tratam de pares de trechos de textos. O objetivo da primeira e determinar se o significado de um trecho implica o outro, enquanto que a segunda atribui uma pontuacao de similaridade semântica ao par. Esse artigo apresenta os resultados da avaliacao conjunta ASSIN (Avaliacao de Similaridade Semântica e Inferencia) e seu corpus, que foi anotado para ambas as tarefas nas variantes brasileira e europeia da lingua portuguesa. O corpus difere de similares na literatura em suas tres classes para a tarefa de inferencia textual (Implicacao, Parafrase e Neutro) e por ter sido composto de sentencas extraidas de textos jornalisticos. Seis equipes participaram da avaliacao conjunta, explorando diferentes estrategias.","PeriodicalId":41819,"journal":{"name":"Linguamatica","volume":"35 1","pages":"3-13"},"PeriodicalIF":0.3000,"publicationDate":"2016-12-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"39","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Linguamatica","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.21814/LM.8.2.235","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"LINGUISTICS","Score":null,"Total":0}
引用次数: 39
Abstract
Inferencia Textual e Similaridade Semântica sao duas tarefas do processamento de linguas naturais que tratam de pares de trechos de textos. O objetivo da primeira e determinar se o significado de um trecho implica o outro, enquanto que a segunda atribui uma pontuacao de similaridade semântica ao par. Esse artigo apresenta os resultados da avaliacao conjunta ASSIN (Avaliacao de Similaridade Semântica e Inferencia) e seu corpus, que foi anotado para ambas as tarefas nas variantes brasileira e europeia da lingua portuguesa. O corpus difere de similares na literatura em suas tres classes para a tarefa de inferencia textual (Implicacao, Parafrase e Neutro) e por ter sido composto de sentencas extraidas de textos jornalisticos. Seis equipes participaram da avaliacao conjunta, explorando diferentes estrategias.