Procedimentos para construção do Corpus da Computação da Língua Inglesa (CoCLI) e cálculo do esforço na construção manual de corpora / Procedures for Corpus of Computing in English (CoCLI) construction and effort calculation in manual construction of corpora
{"title":"Procedimentos para construção do Corpus da Computação da Língua Inglesa (CoCLI) e cálculo do esforço na construção manual de corpora / Procedures for Corpus of Computing in English (CoCLI) construction and effort calculation in manual construction of corpora","authors":"F. P. Oliveira","doi":"10.17851/2237-2083.29.2.909-958","DOIUrl":null,"url":null,"abstract":"Resumo: O presente trabalho tem como objetivo descrever os procedimentos metodologicos da pesquisa intitulada “ ToGatherUp : um prototipo de ferramenta para a construcao de corpora” que verificou o efeito da incorporacao da ferramenta ToGatherUp no tempo e no esforco necessarios para a construcao manual de um corpus que elaboramos: o Corpus da Computacao da Lingua Inglesa (CoCLI). Para tanto, discorremos sobre como os autores da pesquisa desenvolveram um conjunto de metricas de medicao de esforco – Esforco da Atividade (EA), Esforco Total de Coleta do Texto (ETCT) e Esforco Total do Projeto (ETP) – que serviram de base para a realizacao de um experimento estatistico comparativo entre os projetos de elaboracao manual de duas versoes identicas do CoCLI que se diferenciam por em um deles utilizar o ToGatherUp e o outro nao. O resultado do experimento demonstrou uma reducao media de 7,47% no ETP do projeto em que o ToGatherUp foi incorporado em relacao ao ETP do projeto em que a ferramenta nao foi utilizada, o que corroborou a hipotese de que ela reduz o tempo e o esforco despendidos pelo pesquisador em projetos de elaboracao manual de corpora . Palavras-chave: Linguistica de Corpus ; construcao manual de corpus ; metricas de medicao de esforco; ToGatherUp. Abstract: The present work aims to describe the methodological procedures of the research entitled “ ToGatherUp : a prototype of a tool for corpora construction” that verified the effect of incorporating ToGatherUp in necessary time and effort invested in manual construction of Corpus of Computing in English (CoCLI). To this end, we discuss how the research authors developed a set of metrics for measuring effort – Activity Effort (EA), Total Effort for Text Collection (ETCT) and Total Project Effort (ETP) – which served as the basis for conducting a comparative statistical experiment between the manual elaboration of two identical versions of the CoCLI: which differ from each other by one of them using the ToGatherUp and the other one not using it. The experiment shows an average reduction of 7.47% in the ETP when using ToGatherUp compared to the ETP when not using the tool. This result corroborates the hypothesis that the tool reduces the time and effort spent by the researcher on manual elaboration projects of corpora . Keywords: Corpus Linguistics; manual construction of corpus ; effort measurement metrics; ToGatherUp .","PeriodicalId":42188,"journal":{"name":"Revista de Estudos da Linguagem","volume":"29 1","pages":"909-958"},"PeriodicalIF":0.2000,"publicationDate":"2021-03-19","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revista de Estudos da Linguagem","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.17851/2237-2083.29.2.909-958","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"0","JCRName":"LANGUAGE & LINGUISTICS","Score":null,"Total":0}
引用次数: 0
Abstract
Resumo: O presente trabalho tem como objetivo descrever os procedimentos metodologicos da pesquisa intitulada “ ToGatherUp : um prototipo de ferramenta para a construcao de corpora” que verificou o efeito da incorporacao da ferramenta ToGatherUp no tempo e no esforco necessarios para a construcao manual de um corpus que elaboramos: o Corpus da Computacao da Lingua Inglesa (CoCLI). Para tanto, discorremos sobre como os autores da pesquisa desenvolveram um conjunto de metricas de medicao de esforco – Esforco da Atividade (EA), Esforco Total de Coleta do Texto (ETCT) e Esforco Total do Projeto (ETP) – que serviram de base para a realizacao de um experimento estatistico comparativo entre os projetos de elaboracao manual de duas versoes identicas do CoCLI que se diferenciam por em um deles utilizar o ToGatherUp e o outro nao. O resultado do experimento demonstrou uma reducao media de 7,47% no ETP do projeto em que o ToGatherUp foi incorporado em relacao ao ETP do projeto em que a ferramenta nao foi utilizada, o que corroborou a hipotese de que ela reduz o tempo e o esforco despendidos pelo pesquisador em projetos de elaboracao manual de corpora . Palavras-chave: Linguistica de Corpus ; construcao manual de corpus ; metricas de medicao de esforco; ToGatherUp. Abstract: The present work aims to describe the methodological procedures of the research entitled “ ToGatherUp : a prototype of a tool for corpora construction” that verified the effect of incorporating ToGatherUp in necessary time and effort invested in manual construction of Corpus of Computing in English (CoCLI). To this end, we discuss how the research authors developed a set of metrics for measuring effort – Activity Effort (EA), Total Effort for Text Collection (ETCT) and Total Project Effort (ETP) – which served as the basis for conducting a comparative statistical experiment between the manual elaboration of two identical versions of the CoCLI: which differ from each other by one of them using the ToGatherUp and the other one not using it. The experiment shows an average reduction of 7.47% in the ETP when using ToGatherUp compared to the ETP when not using the tool. This result corroborates the hypothesis that the tool reduces the time and effort spent by the researcher on manual elaboration projects of corpora . Keywords: Corpus Linguistics; manual construction of corpus ; effort measurement metrics; ToGatherUp .