Eficiência de softwares nacionais e internacionais na detecção de similaridade e de plágio em manuscrito

IF 0.2 Q4 INFORMATION SCIENCE & LIBRARY SCIENCE Em Questao Pub Date : 2022-09-27 DOI:10.19132/1808-5245284.123123
Marcelo Krokoscz
{"title":"Eficiência de softwares nacionais e internacionais na detecção de similaridade e de plágio em manuscrito","authors":"Marcelo Krokoscz","doi":"10.19132/1808-5245284.123123","DOIUrl":null,"url":null,"abstract":"Este estudo visa identificar a eficiência de quatorze softwares de detecção de similaridades em um texto com fragmentos sobre educação financeira, encontrados em websites da internet, anais de eventos acadêmicos e revistas científicas de acesso aberto e restrito. Os fragmentos foram usados para elaborar um texto coeso, escrito em língua portuguesa, contendo reproduções textuais literais, paráfrases, com trechos traduzidos do idioma inglês, manipulados com inserção de caractere oculto e com substituição de palavras por sinônimos. Os relatórios de similaridade gerados pelos softwares foram analisados de acordo com quatro critérios: 1 identificação de fragmentos citados corretamente; 2 identificação de fragmentos plagiados; 3 identificação de textos manipulados para enganar o software; 4 identificação de fontes originais; os quais foram pontuados em uma escala de 0 a 4 pontos. Os softwares Turnitin, StrikePlagiarism, PlagScan e Plagium tiveram performance elevada e CopySpider e Plagium (complemento do Google) foram os mais ineficientes. Constatou-se que os softwares operam com eficiência variável, o que reforça a convicção de que embora sejam ferramentas úteis para a identificação de plágio, contribuem de forma limitada para aspectos como reconhecimento de reproduções textuais literais que nem sempre correspondem à fonte original. As fontes originais de textos reescritos, manipulados e traduzidos não foram encontradas por nenhum software. O estudo contribui para o aprimoramento da capacidade do usuário na escolha, uso e análise dos relatórios de similaridades gerados por softwares, cuja eficiência pode ser maior no caso da utilização de mais de um software.","PeriodicalId":43249,"journal":{"name":"Em Questao","volume":"1 1","pages":""},"PeriodicalIF":0.2000,"publicationDate":"2022-09-27","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Em Questao","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.19132/1808-5245284.123123","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"INFORMATION SCIENCE & LIBRARY SCIENCE","Score":null,"Total":0}
引用次数: 0

Abstract

Este estudo visa identificar a eficiência de quatorze softwares de detecção de similaridades em um texto com fragmentos sobre educação financeira, encontrados em websites da internet, anais de eventos acadêmicos e revistas científicas de acesso aberto e restrito. Os fragmentos foram usados para elaborar um texto coeso, escrito em língua portuguesa, contendo reproduções textuais literais, paráfrases, com trechos traduzidos do idioma inglês, manipulados com inserção de caractere oculto e com substituição de palavras por sinônimos. Os relatórios de similaridade gerados pelos softwares foram analisados de acordo com quatro critérios: 1 identificação de fragmentos citados corretamente; 2 identificação de fragmentos plagiados; 3 identificação de textos manipulados para enganar o software; 4 identificação de fontes originais; os quais foram pontuados em uma escala de 0 a 4 pontos. Os softwares Turnitin, StrikePlagiarism, PlagScan e Plagium tiveram performance elevada e CopySpider e Plagium (complemento do Google) foram os mais ineficientes. Constatou-se que os softwares operam com eficiência variável, o que reforça a convicção de que embora sejam ferramentas úteis para a identificação de plágio, contribuem de forma limitada para aspectos como reconhecimento de reproduções textuais literais que nem sempre correspondem à fonte original. As fontes originais de textos reescritos, manipulados e traduzidos não foram encontradas por nenhum software. O estudo contribui para o aprimoramento da capacidade do usuário na escolha, uso e análise dos relatórios de similaridades gerados por softwares, cuja eficiência pode ser maior no caso da utilização de mais de um software.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
国内外软件在检测稿件相似性和剽窃方面的效率
本研究旨在识别14个相似检测软件在互联网网站、学术事件编年史和开放和限制访问的科学期刊上发现的金融教育片段文本中的效率。这些片段被用来发展一个连贯的文本,用葡萄牙语写,包括逐字复制,意译,从英语翻译的摘录,操纵插入隐藏字符和用同义词替换单词。根据4个标准对软件生成的相似度报告进行分析:1识别正确引用的片段;2识别错误引用的片段;3识别错误引用的片段2 .剽窃片段的鉴定;识别为欺骗软件而操纵的文本;4 .识别原始来源;他们的评分范围从0到4分。Turnitin、StrikePlagiarism、PlagScan和Plagium软件性能较高,CopySpider和Plagium(谷歌插件)效率最低。研究发现,软件的运行效率各不相同,这加强了这样一种信念,即尽管它们是识别剽窃的有用工具,但它们对识别并不总是与原始来源相对应的逐字复制等方面的贡献有限。任何软件都找不到重写、操纵和翻译文本的原始来源。本研究有助于提高用户选择、使用和分析软件生成的相似度报告的能力,如果使用多个软件,其效率可能会更高。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
Em Questao
Em Questao INFORMATION SCIENCE & LIBRARY SCIENCE-
自引率
0.00%
发文量
71
审稿时长
25 weeks
期刊最新文献
Competência em Informação, fake news e desinformação: análise das pesquisas no contexto brasileiro Informação e empoderamento feminino no Instagram: estudo a partir de coletivos feministas Raízes do epistemicídio negro: análise da produção científica do ENANCIB (1994-2019) Bibliotecas universitárias públicas no YouTube: métricas dos canais Lei Geral de Proteção de Dados (LGPD) e repositórios institucionais: reflexões e adequações
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1