qFEx - um crawler para busca e extração de questionários de pesquisa em documentos HTML

Gilney Nathanael Mathias, C. Dorneles
{"title":"qFEx - um crawler para busca e extração de questionários de pesquisa em documentos HTML","authors":"Gilney Nathanael Mathias, C. Dorneles","doi":"10.5753/dsw.2021.17409","DOIUrl":null,"url":null,"abstract":"Questionários de pesquisa podem ser utilizados por empresas ou instituições para avaliar itens ou produtos, mediar a satisfação de seus funcionários/clientes, ou serem utilizados por pesquisadores para coleta de dados que podem ser usados em estudos. Alguns problemas na criação de tais questionários envolvem: decidir quais perguntas fazer, como fazê-las e como organizá-las. Visando isso, este trabalho propõe a criação de um Web Crawler, que varre a Web em busca de sites que possivelmente contenham questionários, e de um Extrator, capaz de extrair os questionários da lista de páginas coletadas pelo crawler e salvá-las em um banco de dados relacional. A base de dados criada pode depois, servir para a análise desses dados e/ou como uma base centralizada de exemplos para a elaboração de novos questionários ou ainda para o reuso de questões existentes. Alguns experimentos são apresentados para demonstrar a correta coleta de questionários pelo crawler, e a posterior extração das questões presentes nos questionários.","PeriodicalId":314975,"journal":{"name":"Anais do III Dataset Showcase Workshop (DSW 2021)","volume":"24 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2017-11-06","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Anais do III Dataset Showcase Workshop (DSW 2021)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/dsw.2021.17409","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Questionários de pesquisa podem ser utilizados por empresas ou instituições para avaliar itens ou produtos, mediar a satisfação de seus funcionários/clientes, ou serem utilizados por pesquisadores para coleta de dados que podem ser usados em estudos. Alguns problemas na criação de tais questionários envolvem: decidir quais perguntas fazer, como fazê-las e como organizá-las. Visando isso, este trabalho propõe a criação de um Web Crawler, que varre a Web em busca de sites que possivelmente contenham questionários, e de um Extrator, capaz de extrair os questionários da lista de páginas coletadas pelo crawler e salvá-las em um banco de dados relacional. A base de dados criada pode depois, servir para a análise desses dados e/ou como uma base centralizada de exemplos para a elaboração de novos questionários ou ainda para o reuso de questões existentes. Alguns experimentos são apresentados para demonstrar a correta coleta de questionários pelo crawler, e a posterior extração das questões presentes nos questionários.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
qFEx -一个在HTML文档中搜索和提取调查问卷的爬虫
调查问卷可以被公司或机构用来评估项目或产品,调解其员工/客户的满意度,或被研究人员用来收集可用于研究的数据。制作这类问卷的一些问题包括:决定问什么问题,如何问问题,以及如何组织问题。针对这一目标,本文提出创建一个网络爬虫,扫描网络上可能包含问卷的网站,以及一个提取器,能够从爬虫收集的页面列表中提取问卷,并将它们保存在关系数据库中。然后,创建的数据库可以用于分析这些数据和/或作为一个集中的示例数据库,用于开发新的问卷或重用现有的问题。通过实验证明了爬虫正确收集问卷,并对问卷中出现的问题进行了提取。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
0
期刊最新文献
SAT-ESPEC: Análise e Coleta de Dados da Transmissão de Estações Terrenas de uma Rede Satélite Datasets Curados e Enriquecidos com Proveniência da Campanha Nacional de Vacinação Contra COVID-19 Três Datasets criados a partir de um banco de Canções Populares Brasileiras de Sucesso e Não-Sucesso de 2014 a 2019 BovDB: A data set of stock quotes for Machine Learning on all companies from B3 between 1995 and 2020 Central de Fatos: Um Repositório de Checagens de Fatos
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1