{"title":"Crowdsourcing et bases de données","authors":"François Vignale","doi":"10.17184/eac.3914","DOIUrl":null,"url":null,"abstract":"La base de données EuRED (European Reading Experience Database) vise à rassembler des expériences de lecture des Européens de l’invention de l’imprimerie à nos jours. Cette preuve de concept a nécessité la mise au point d’une ontologie, de thesaurus et l’adoption du standard xml-TEI et s’appuie sur la réutilisation de données existantes (35 000 fiches) qui proviennent de la base britannique UK-RED lancée en 2006. Cette dernière a été constituée par des bénévoles formés à l’utilisation et par le grand public lesquels, soit dépouillaient des corpus d’auteurs, soit déposaient des témoignages familiaux, ce qui a généré malheureusement un nombre si important d’erreurs diverses que la possibilité de réutiliser ces données s’en trouvait menacée. Ces obstacles nous ont conduit à encadrer la participation du public dans EuRED et plus encore dans un projet H2020 qui en est la suite et qui prévoit également l’exploration de données massives. Ici, notre approche de la science participative et du crowdsourcing repose sur deux axes : 1) la contribution sera toujours possible mais avec une saisie contrôlée pointant vers des référentiels externes et internes ; 2) l’amélioration continue de ces mêmes thesaurus et des algorithmes d’exploration sera rendue possible par les retours d’utilisateurs non-professionnels et de citoyens-experts. Ce sont les constats qui ont guidé cette réflexion et les orientations retenues que nous souhaitons présenter dans cet article.","PeriodicalId":259385,"journal":{"name":"Le Crowdsourcing","volume":"56 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2021-06-02","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Le Crowdsourcing","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.17184/eac.3914","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
La base de données EuRED (European Reading Experience Database) vise à rassembler des expériences de lecture des Européens de l’invention de l’imprimerie à nos jours. Cette preuve de concept a nécessité la mise au point d’une ontologie, de thesaurus et l’adoption du standard xml-TEI et s’appuie sur la réutilisation de données existantes (35 000 fiches) qui proviennent de la base britannique UK-RED lancée en 2006. Cette dernière a été constituée par des bénévoles formés à l’utilisation et par le grand public lesquels, soit dépouillaient des corpus d’auteurs, soit déposaient des témoignages familiaux, ce qui a généré malheureusement un nombre si important d’erreurs diverses que la possibilité de réutiliser ces données s’en trouvait menacée. Ces obstacles nous ont conduit à encadrer la participation du public dans EuRED et plus encore dans un projet H2020 qui en est la suite et qui prévoit également l’exploration de données massives. Ici, notre approche de la science participative et du crowdsourcing repose sur deux axes : 1) la contribution sera toujours possible mais avec une saisie contrôlée pointant vers des référentiels externes et internes ; 2) l’amélioration continue de ces mêmes thesaurus et des algorithmes d’exploration sera rendue possible par les retours d’utilisateurs non-professionnels et de citoyens-experts. Ce sont les constats qui ont guidé cette réflexion et les orientations retenues que nous souhaitons présenter dans cet article.