{"title":"用于分析历史资料的计算机","authors":"Sébastien de Valeriola","doi":"10.4000/HISTOIREMESURE.13534","DOIUrl":null,"url":null,"abstract":"L’historien qui mobilise un corpus d’actes est amene a extraire de chacun de ces documents une serie d’informations necessaires a son etude, comme les noms des protagonistes, les dates, les montants, etc. Lorsque la taille de l’ensemble documentaire considere est importante, cette etape de depouillement peut poser un probleme. Nous presentons ici une methodologie d’analyse semi-automatique d’un tel corpus mettant en œuvre des methodes quantitatives. Nous nous concentrons sur trois etapes de ce processus : le decoupage des actes en sous-parties, la lemmatisation des anthroponymes et l’extraction des dates. Nous soulignons l’importance de l’intervention de l’humain apres l’action de la machine, etape indispensable de tout dispositif d’analyse de ce type.","PeriodicalId":39718,"journal":{"name":"Histoire et Mesure","volume":"1 1","pages":"171-196"},"PeriodicalIF":0.0000,"publicationDate":"2020-12-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"L’ordinateur au service du dépouillement de sources historiques\",\"authors\":\"Sébastien de Valeriola\",\"doi\":\"10.4000/HISTOIREMESURE.13534\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"L’historien qui mobilise un corpus d’actes est amene a extraire de chacun de ces documents une serie d’informations necessaires a son etude, comme les noms des protagonistes, les dates, les montants, etc. Lorsque la taille de l’ensemble documentaire considere est importante, cette etape de depouillement peut poser un probleme. Nous presentons ici une methodologie d’analyse semi-automatique d’un tel corpus mettant en œuvre des methodes quantitatives. Nous nous concentrons sur trois etapes de ce processus : le decoupage des actes en sous-parties, la lemmatisation des anthroponymes et l’extraction des dates. Nous soulignons l’importance de l’intervention de l’humain apres l’action de la machine, etape indispensable de tout dispositif d’analyse de ce type.\",\"PeriodicalId\":39718,\"journal\":{\"name\":\"Histoire et Mesure\",\"volume\":\"1 1\",\"pages\":\"171-196\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2020-12-31\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Histoire et Mesure\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.4000/HISTOIREMESURE.13534\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"Q2\",\"JCRName\":\"Arts and Humanities\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Histoire et Mesure","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.4000/HISTOIREMESURE.13534","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q2","JCRName":"Arts and Humanities","Score":null,"Total":0}
L’ordinateur au service du dépouillement de sources historiques
L’historien qui mobilise un corpus d’actes est amene a extraire de chacun de ces documents une serie d’informations necessaires a son etude, comme les noms des protagonistes, les dates, les montants, etc. Lorsque la taille de l’ensemble documentaire considere est importante, cette etape de depouillement peut poser un probleme. Nous presentons ici une methodologie d’analyse semi-automatique d’un tel corpus mettant en œuvre des methodes quantitatives. Nous nous concentrons sur trois etapes de ce processus : le decoupage des actes en sous-parties, la lemmatisation des anthroponymes et l’extraction des dates. Nous soulignons l’importance de l’intervention de l’humain apres l’action de la machine, etape indispensable de tout dispositif d’analyse de ce type.