如何为教育目的自动提取和分析信息

IF 5.1 1区 文学 Q1 COMMUNICATION Comunicar Pub Date : 2023-01-01 DOI:10.3916/c74-2023-02
Miriam Calvera-Isabal, Patrícia Santos, H. Hoppe, Cleo Schulten
{"title":"如何为教育目的自动提取和分析信息","authors":"Miriam Calvera-Isabal, Patrícia Santos, H. Hoppe, Cleo Schulten","doi":"10.3916/c74-2023-02","DOIUrl":null,"url":null,"abstract":"There is an increasing interest and growing practice in Citizen Science (CS) that goes along with the usage of websites for communication as well as for capturing and processing data and materials. From an educational perspective, it is expected that by integrating information about CS in a formal educational setting, it will inspire teachers to create learning activities. This is an interesting case for using bots to automate the process of data extraction from online CS platforms to better understand its use in educational contexts. Although this information is publicly available, it has to follow GDPR rules. This paper aims to explain (1) how CS communicates and is promoted on websites, (2) how web scraping methods and anonymization techniques have been designed, developed and applied to collect information from online sources and (3) how these data could be used for educational purposes. After the analysis of 72 websites, some of the results obtained show that only 24.8% includes detailed information about the CS project and 48.61% includes information about educational purposes or materials.\nEl interés y la práctica de la ciencia ciudadana (CC) ha aumentado en los últimos años. Esto ha derivado en el uso de páginas web como herramienta de comunicación, recolección o análisis datos o repositorio materiales y recursos. Desde una perspectiva educativa, se espera que al integrar información sobre proyectos de CC en un entorno educativo formal, se inspire a los maestros a crear actividades de aprendizaje. Este, es un caso interesante para usar bots que automaticen el proceso de extracción de datos de webs de CC que ayuden a comprender mejor su uso en contextos educativos. Aunque esta información está disponible públicamente, se deben seguir las reglas de la ley de protección de datos o GDPR. Este artículo tiene como objetivo explicar: 1) cómo la CC se comunica y promueve en los sitios web; 2) cómo se diseñan, desarrollan y aplican los métodos de web scraping y las técnicas de anonimización para recopilar información en línea; y 3) cómo se podrían usar estos datos con fines educativos. Tras el análisis de 72 webs algunos de los resultados son que solo el 24,8% incluye información detallada sobre el proyecto, y el 48,61% incluye información sobre propósitos o materiales educativos.","PeriodicalId":10773,"journal":{"name":"Comunicar","volume":" ","pages":""},"PeriodicalIF":5.1000,"publicationDate":"2023-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":"{\"title\":\"How to automate the extraction and analysis of information for educational purposes\",\"authors\":\"Miriam Calvera-Isabal, Patrícia Santos, H. Hoppe, Cleo Schulten\",\"doi\":\"10.3916/c74-2023-02\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"There is an increasing interest and growing practice in Citizen Science (CS) that goes along with the usage of websites for communication as well as for capturing and processing data and materials. From an educational perspective, it is expected that by integrating information about CS in a formal educational setting, it will inspire teachers to create learning activities. This is an interesting case for using bots to automate the process of data extraction from online CS platforms to better understand its use in educational contexts. Although this information is publicly available, it has to follow GDPR rules. This paper aims to explain (1) how CS communicates and is promoted on websites, (2) how web scraping methods and anonymization techniques have been designed, developed and applied to collect information from online sources and (3) how these data could be used for educational purposes. After the analysis of 72 websites, some of the results obtained show that only 24.8% includes detailed information about the CS project and 48.61% includes information about educational purposes or materials.\\nEl interés y la práctica de la ciencia ciudadana (CC) ha aumentado en los últimos años. Esto ha derivado en el uso de páginas web como herramienta de comunicación, recolección o análisis datos o repositorio materiales y recursos. Desde una perspectiva educativa, se espera que al integrar información sobre proyectos de CC en un entorno educativo formal, se inspire a los maestros a crear actividades de aprendizaje. Este, es un caso interesante para usar bots que automaticen el proceso de extracción de datos de webs de CC que ayuden a comprender mejor su uso en contextos educativos. Aunque esta información está disponible públicamente, se deben seguir las reglas de la ley de protección de datos o GDPR. Este artículo tiene como objetivo explicar: 1) cómo la CC se comunica y promueve en los sitios web; 2) cómo se diseñan, desarrollan y aplican los métodos de web scraping y las técnicas de anonimización para recopilar información en línea; y 3) cómo se podrían usar estos datos con fines educativos. Tras el análisis de 72 webs algunos de los resultados son que solo el 24,8% incluye información detallada sobre el proyecto, y el 48,61% incluye información sobre propósitos o materiales educativos.\",\"PeriodicalId\":10773,\"journal\":{\"name\":\"Comunicar\",\"volume\":\" \",\"pages\":\"\"},\"PeriodicalIF\":5.1000,\"publicationDate\":\"2023-01-01\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"1\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Comunicar\",\"FirstCategoryId\":\"98\",\"ListUrlMain\":\"https://doi.org/10.3916/c74-2023-02\",\"RegionNum\":1,\"RegionCategory\":\"文学\",\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"Q1\",\"JCRName\":\"COMMUNICATION\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Comunicar","FirstCategoryId":"98","ListUrlMain":"https://doi.org/10.3916/c74-2023-02","RegionNum":1,"RegionCategory":"文学","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q1","JCRName":"COMMUNICATION","Score":null,"Total":0}
引用次数: 1

摘要

随着网站用于通信以及捕获和处理数据和材料,人们对《公民科学》的兴趣越来越大,实践也越来越多。从教育的角度来看,预计通过将有关Cs的信息整合到正式的教育环境中,它将激励教师创建学习活动。这是一个有趣的案例,可以使用机器人来自动化从在线Cs平台中提取数据的过程,以更好地了解其在教育环境中的使用。虽然这一信息是公开的,但必须遵守GDPR规则。本文件旨在解释(1)Cs是如何在网站上交流和推广的,(2)如何设计、开发和应用网络筛选方法和匿名技术来从在线来源收集信息,(3)这些数据如何用于教育目的。在分析了72个网站后,获得的一些结果表明,只有24.8%包含有关Cs项目的详细信息,48.61%包含有关教育目的或材料的信息。近年来,人们对公民科学的兴趣和实践有所增加。这导致使用网页作为交流、收集或分析数据或材料和资源存储库的工具。从教育的角度来看,通过将有关CC项目的信息整合到正式的教育环境中,预计将激励教师创建学习活动。这是一个有趣的案例,可以使用机器人来自动化CC网站的数据挖掘过程,以帮助更好地理解其在教育背景下的使用。虽然这些信息是公开的,但必须遵守《数据保护法》或GDPR的规则。本文旨在解释:(1)CC如何在网站上交流和推广;2) 如何设计、开发和应用Web擦除方法和匿名技术来收集在线信息;3)如何将这些数据用于教育目的。在对72个网站进行分析后,一些结果是,只有24.8%的网站包含有关该项目的详细信息,48.61%的网站包含有关教育目的或材料的信息。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
How to automate the extraction and analysis of information for educational purposes
There is an increasing interest and growing practice in Citizen Science (CS) that goes along with the usage of websites for communication as well as for capturing and processing data and materials. From an educational perspective, it is expected that by integrating information about CS in a formal educational setting, it will inspire teachers to create learning activities. This is an interesting case for using bots to automate the process of data extraction from online CS platforms to better understand its use in educational contexts. Although this information is publicly available, it has to follow GDPR rules. This paper aims to explain (1) how CS communicates and is promoted on websites, (2) how web scraping methods and anonymization techniques have been designed, developed and applied to collect information from online sources and (3) how these data could be used for educational purposes. After the analysis of 72 websites, some of the results obtained show that only 24.8% includes detailed information about the CS project and 48.61% includes information about educational purposes or materials. El interés y la práctica de la ciencia ciudadana (CC) ha aumentado en los últimos años. Esto ha derivado en el uso de páginas web como herramienta de comunicación, recolección o análisis datos o repositorio materiales y recursos. Desde una perspectiva educativa, se espera que al integrar información sobre proyectos de CC en un entorno educativo formal, se inspire a los maestros a crear actividades de aprendizaje. Este, es un caso interesante para usar bots que automaticen el proceso de extracción de datos de webs de CC que ayuden a comprender mejor su uso en contextos educativos. Aunque esta información está disponible públicamente, se deben seguir las reglas de la ley de protección de datos o GDPR. Este artículo tiene como objetivo explicar: 1) cómo la CC se comunica y promueve en los sitios web; 2) cómo se diseñan, desarrollan y aplican los métodos de web scraping y las técnicas de anonimización para recopilar información en línea; y 3) cómo se podrían usar estos datos con fines educativos. Tras el análisis de 72 webs algunos de los resultados son que solo el 24,8% incluye información detallada sobre el proyecto, y el 48,61% incluye información sobre propósitos o materiales educativos.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
Comunicar
Comunicar Multiple-
CiteScore
10.10
自引率
5.40%
发文量
40
审稿时长
20 weeks
期刊介绍: Comunicar specialized in educommunication: communication and education, ICT, audiences, new languages...; monographs specialized in current issues. Double format: printed and online; digitally, accessible in full text, free of charge, for the entire scientific community and researchers around the world. Coeditions printed in Spanish and English for the whole world. Published by Oxbridge Publishing House which collaborates with many international centres and universities.
期刊最新文献
English learners’ intentions to adopt online learning post-pandemic: Ease precedes usefulness Writing, creativity, and artificial intelligence. ChatGPT in the university context Lockdown, cyberhate, and protective factor of social-emotional and moral competencies in Primary Education Using YouTube to seek answers and make decisions: Implications for Australian adult media and information literacy Social web and photojournalism: User-generated content of the Russo-Ukranian war
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1