La base de données EuRED (European Reading Experience Database) vise à rassembler des expériences de lecture des Européens de l’invention de l’imprimerie à nos jours. Cette preuve de concept a nécessité la mise au point d’une ontologie, de thesaurus et l’adoption du standard xml-TEI et s’appuie sur la réutilisation de données existantes (35 000 fiches) qui proviennent de la base britannique UK-RED lancée en 2006. Cette dernière a été constituée par des bénévoles formés à l’utilisation et par le grand public lesquels, soit dépouillaient des corpus d’auteurs, soit déposaient des témoignages familiaux, ce qui a généré malheureusement un nombre si important d’erreurs diverses que la possibilité de réutiliser ces données s’en trouvait menacée. Ces obstacles nous ont conduit à encadrer la participation du public dans EuRED et plus encore dans un projet H2020 qui en est la suite et qui prévoit également l’exploration de données massives. Ici, notre approche de la science participative et du crowdsourcing repose sur deux axes : 1) la contribution sera toujours possible mais avec une saisie contrôlée pointant vers des référentiels externes et internes ; 2) l’amélioration continue de ces mêmes thesaurus et des algorithmes d’exploration sera rendue possible par les retours d’utilisateurs non-professionnels et de citoyens-experts. Ce sont les constats qui ont guidé cette réflexion et les orientations retenues que nous souhaitons présenter dans cet article.
{"title":"Crowdsourcing et bases de données","authors":"François Vignale","doi":"10.17184/eac.3914","DOIUrl":"https://doi.org/10.17184/eac.3914","url":null,"abstract":"La base de données EuRED (European Reading Experience Database) vise à rassembler des expériences de lecture des Européens de l’invention de l’imprimerie à nos jours. Cette preuve de concept a nécessité la mise au point d’une ontologie, de thesaurus et l’adoption du standard xml-TEI et s’appuie sur la réutilisation de données existantes (35 000 fiches) qui proviennent de la base britannique UK-RED lancée en 2006. Cette dernière a été constituée par des bénévoles formés à l’utilisation et par le grand public lesquels, soit dépouillaient des corpus d’auteurs, soit déposaient des témoignages familiaux, ce qui a généré malheureusement un nombre si important d’erreurs diverses que la possibilité de réutiliser ces données s’en trouvait menacée. Ces obstacles nous ont conduit à encadrer la participation du public dans EuRED et plus encore dans un projet H2020 qui en est la suite et qui prévoit également l’exploration de données massives. Ici, notre approche de la science participative et du crowdsourcing repose sur deux axes : 1) la contribution sera toujours possible mais avec une saisie contrôlée pointant vers des référentiels externes et internes ; 2) l’amélioration continue de ces mêmes thesaurus et des algorithmes d’exploration sera rendue possible par les retours d’utilisateurs non-professionnels et de citoyens-experts. Ce sont les constats qui ont guidé cette réflexion et les orientations retenues que nous souhaitons présenter dans cet article.","PeriodicalId":259385,"journal":{"name":"Le Crowdsourcing","volume":"56 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-06-02","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"122069954","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Les passionnés d’histoire familiale sont des acteurs centraux du crowdsourcing archivistique. Cette communauté d’utilisateurs, bien organisée dans le monde réel et déjà productrice de contenus sous forme de tables et de bases de données, a investi le numérique sans état d’âme pour occuper un espace central dans l’écosystème archivistique. Ces usagers consommateurs de nombreux documents d’archives, sont prêts à s’investir dans tout type d’usages participatifs, l’exemple le plus frappant étant l’indexation collaborative. Ils enrichissent et partagent des contenus patrimoniaux via le cadre institutionnel et en dehors de lui. En dehors des services, ils créent des communautés apprenantes en ligne qui forment des espaces sociaux d’échange hautement spécialisés (Geneanet par exemple), où se déploient leurs pratiques propres : redocumentarisation des documents (réagencement, annotation, organisation de collections personnelles, intégration de liens etc.) et production de documents totalement factices – les «fiches» manquantes du fichier des morts pour la France mis en ligne par le service historique de la Défense par exemple. Après une analyse de l’offre de projets collaboratifs autour des documents d’archives, nous tenterons de mieux cerner le profil des généanautes et nous interrogerons sur l’éventualité d’un ethos spécifique du généalogiste et sur les conséquences à moyen terme dans la relation aux archives.
{"title":"L’ethos participatif","authors":"Bénédicte Grailles","doi":"10.17184/eac.3912","DOIUrl":"https://doi.org/10.17184/eac.3912","url":null,"abstract":"Les passionnés d’histoire familiale sont des acteurs centraux du crowdsourcing archivistique. Cette communauté d’utilisateurs, bien organisée dans le monde réel et déjà productrice de contenus sous forme de tables et de bases de données, a investi le numérique sans état d’âme pour occuper un espace central dans l’écosystème archivistique. Ces usagers consommateurs de nombreux documents d’archives, sont prêts à s’investir dans tout type d’usages participatifs, l’exemple le plus frappant étant l’indexation collaborative. Ils enrichissent et partagent des contenus patrimoniaux via le cadre institutionnel et en dehors de lui. En dehors des services, ils créent des communautés apprenantes en ligne qui forment des espaces sociaux d’échange hautement spécialisés (Geneanet par exemple), où se déploient leurs pratiques propres : redocumentarisation des documents (réagencement, annotation, organisation de collections personnelles, intégration de liens etc.) et production de documents totalement factices – les «fiches» manquantes du fichier des morts pour la France mis en ligne par le service historique de la Défense par exemple. Après une analyse de l’offre de projets collaboratifs autour des documents d’archives, nous tenterons de mieux cerner le profil des généanautes et nous interrogerons sur l’éventualité d’un ethos spécifique du généalogiste et sur les conséquences à moyen terme dans la relation aux archives.","PeriodicalId":259385,"journal":{"name":"Le Crowdsourcing","volume":"44 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-06-02","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"125010359","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}