学校作品作者归属的文体学和文本方法的比较研究

Daniel Cirne Vilas-Boas dos Santos, Cleber Zanchettin
{"title":"学校作品作者归属的文体学和文本方法的比较研究","authors":"Daniel Cirne Vilas-Boas dos Santos, Cleber Zanchettin","doi":"10.5753/sbie.2021.217413","DOIUrl":null,"url":null,"abstract":"O aumento no volume de documentos digitais associado ao seu uso no processo de verificação de aprendizagem demanda recursos computacionais para compreensão e análise de autoria. A literatura propõe distinguir os autores pelo estilo de escrita e palavras-chave. Entretanto, estes trabalhos não estão inseridos no contexto educacional e são majoritariamente em inglês. Este artigo se distingue por explorar a verificação de autoria numa base de atividades pedagógicas escritas na língua portuguesa. Devido ao baixo volume de exemplos, usamos bases jornalísticas robustas como referência. Por meio dos experimentos verificamos que em domínios restritos, representações baseadas em características de estilo são superiores à abordagens textuais, que sofrem influência do tópico em corpora mais abrangente. Este trabalho revelou que o modelo Extremelly Randomized Trees associado às características de estilo propostas foi superior aos demais modelos, em todas as bases utilizadas, alcançando uma média de 70% na taxa de acerto e AUC 0.81.","PeriodicalId":298990,"journal":{"name":"Anais do XXXII Simpósio Brasileiro de Informática na Educação (SBIE 2021)","volume":"15 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2021-11-22","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Estudo comparativo entre abordagens estilométricas e textuais para atribuição de autoria em trabalhos escolares\",\"authors\":\"Daniel Cirne Vilas-Boas dos Santos, Cleber Zanchettin\",\"doi\":\"10.5753/sbie.2021.217413\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"O aumento no volume de documentos digitais associado ao seu uso no processo de verificação de aprendizagem demanda recursos computacionais para compreensão e análise de autoria. A literatura propõe distinguir os autores pelo estilo de escrita e palavras-chave. Entretanto, estes trabalhos não estão inseridos no contexto educacional e são majoritariamente em inglês. Este artigo se distingue por explorar a verificação de autoria numa base de atividades pedagógicas escritas na língua portuguesa. Devido ao baixo volume de exemplos, usamos bases jornalísticas robustas como referência. Por meio dos experimentos verificamos que em domínios restritos, representações baseadas em características de estilo são superiores à abordagens textuais, que sofrem influência do tópico em corpora mais abrangente. Este trabalho revelou que o modelo Extremelly Randomized Trees associado às características de estilo propostas foi superior aos demais modelos, em todas as bases utilizadas, alcançando uma média de 70% na taxa de acerto e AUC 0.81.\",\"PeriodicalId\":298990,\"journal\":{\"name\":\"Anais do XXXII Simpósio Brasileiro de Informática na Educação (SBIE 2021)\",\"volume\":\"15 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2021-11-22\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Anais do XXXII Simpósio Brasileiro de Informática na Educação (SBIE 2021)\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.5753/sbie.2021.217413\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Anais do XXXII Simpósio Brasileiro de Informática na Educação (SBIE 2021)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/sbie.2021.217413","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

与学习验证过程相关的数字文档数量的增加需要计算资源来理解和分析作者身份。文献建议通过写作风格和关键词来区分作者。然而,这些作品并不是教育背景的一部分,主要是英语。本文以葡萄牙语教学活动为基础,探讨作者身份验证。由于示例数量少,我们使用健壮的新闻数据库作为参考。通过实验发现,在有限的领域中,基于风格特征的表现优于文本方法,后者在更广泛的语料库中受到主题的影响。本研究表明,与所提出的风格特征相关的极端随机树模型在所有基础上都优于其他模型,平均命中率达到70%,AUC为0.81。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
Estudo comparativo entre abordagens estilométricas e textuais para atribuição de autoria em trabalhos escolares
O aumento no volume de documentos digitais associado ao seu uso no processo de verificação de aprendizagem demanda recursos computacionais para compreensão e análise de autoria. A literatura propõe distinguir os autores pelo estilo de escrita e palavras-chave. Entretanto, estes trabalhos não estão inseridos no contexto educacional e são majoritariamente em inglês. Este artigo se distingue por explorar a verificação de autoria numa base de atividades pedagógicas escritas na língua portuguesa. Devido ao baixo volume de exemplos, usamos bases jornalísticas robustas como referência. Por meio dos experimentos verificamos que em domínios restritos, representações baseadas em características de estilo são superiores à abordagens textuais, que sofrem influência do tópico em corpora mais abrangente. Este trabalho revelou que o modelo Extremelly Randomized Trees associado às características de estilo propostas foi superior aos demais modelos, em todas as bases utilizadas, alcançando uma média de 70% na taxa de acerto e AUC 0.81.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
期刊最新文献
O Pensamento Computacional como base para o ensino-aprendizagem de matemática através da OBMEP Materiais didáticos utilizados nas formações de professores em Pensamento Computacional Gamificando o Ensino de Programação de Computadores: um Mapeamento Sistemático Representação da Interação em Fóruns de Discussão On-line: uma Revisão Sistemática Integrativa Students' perceptions of academic performance in Distance Education evaluated by Learning Analytics and Ontologies
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1