Daniel Cirne Vilas-Boas dos Santos, Cleber Zanchettin
{"title":"学校作品作者归属的文体学和文本方法的比较研究","authors":"Daniel Cirne Vilas-Boas dos Santos, Cleber Zanchettin","doi":"10.5753/sbie.2021.217413","DOIUrl":null,"url":null,"abstract":"O aumento no volume de documentos digitais associado ao seu uso no processo de verificação de aprendizagem demanda recursos computacionais para compreensão e análise de autoria. A literatura propõe distinguir os autores pelo estilo de escrita e palavras-chave. Entretanto, estes trabalhos não estão inseridos no contexto educacional e são majoritariamente em inglês. Este artigo se distingue por explorar a verificação de autoria numa base de atividades pedagógicas escritas na língua portuguesa. Devido ao baixo volume de exemplos, usamos bases jornalísticas robustas como referência. Por meio dos experimentos verificamos que em domínios restritos, representações baseadas em características de estilo são superiores à abordagens textuais, que sofrem influência do tópico em corpora mais abrangente. Este trabalho revelou que o modelo Extremelly Randomized Trees associado às características de estilo propostas foi superior aos demais modelos, em todas as bases utilizadas, alcançando uma média de 70% na taxa de acerto e AUC 0.81.","PeriodicalId":298990,"journal":{"name":"Anais do XXXII Simpósio Brasileiro de Informática na Educação (SBIE 2021)","volume":"15 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2021-11-22","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Estudo comparativo entre abordagens estilométricas e textuais para atribuição de autoria em trabalhos escolares\",\"authors\":\"Daniel Cirne Vilas-Boas dos Santos, Cleber Zanchettin\",\"doi\":\"10.5753/sbie.2021.217413\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"O aumento no volume de documentos digitais associado ao seu uso no processo de verificação de aprendizagem demanda recursos computacionais para compreensão e análise de autoria. A literatura propõe distinguir os autores pelo estilo de escrita e palavras-chave. Entretanto, estes trabalhos não estão inseridos no contexto educacional e são majoritariamente em inglês. Este artigo se distingue por explorar a verificação de autoria numa base de atividades pedagógicas escritas na língua portuguesa. Devido ao baixo volume de exemplos, usamos bases jornalísticas robustas como referência. Por meio dos experimentos verificamos que em domínios restritos, representações baseadas em características de estilo são superiores à abordagens textuais, que sofrem influência do tópico em corpora mais abrangente. Este trabalho revelou que o modelo Extremelly Randomized Trees associado às características de estilo propostas foi superior aos demais modelos, em todas as bases utilizadas, alcançando uma média de 70% na taxa de acerto e AUC 0.81.\",\"PeriodicalId\":298990,\"journal\":{\"name\":\"Anais do XXXII Simpósio Brasileiro de Informática na Educação (SBIE 2021)\",\"volume\":\"15 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2021-11-22\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Anais do XXXII Simpósio Brasileiro de Informática na Educação (SBIE 2021)\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.5753/sbie.2021.217413\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Anais do XXXII Simpósio Brasileiro de Informática na Educação (SBIE 2021)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/sbie.2021.217413","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Estudo comparativo entre abordagens estilométricas e textuais para atribuição de autoria em trabalhos escolares
O aumento no volume de documentos digitais associado ao seu uso no processo de verificação de aprendizagem demanda recursos computacionais para compreensão e análise de autoria. A literatura propõe distinguir os autores pelo estilo de escrita e palavras-chave. Entretanto, estes trabalhos não estão inseridos no contexto educacional e são majoritariamente em inglês. Este artigo se distingue por explorar a verificação de autoria numa base de atividades pedagógicas escritas na língua portuguesa. Devido ao baixo volume de exemplos, usamos bases jornalísticas robustas como referência. Por meio dos experimentos verificamos que em domínios restritos, representações baseadas em características de estilo são superiores à abordagens textuais, que sofrem influência do tópico em corpora mais abrangente. Este trabalho revelou que o modelo Extremelly Randomized Trees associado às características de estilo propostas foi superior aos demais modelos, em todas as bases utilizadas, alcançando uma média de 70% na taxa de acerto e AUC 0.81.