用于分析历史资料的计算机

Q2 Arts and Humanities Histoire et Mesure Pub Date : 2020-12-31 DOI:10.4000/HISTOIREMESURE.13534
Sébastien de Valeriola
{"title":"用于分析历史资料的计算机","authors":"Sébastien de Valeriola","doi":"10.4000/HISTOIREMESURE.13534","DOIUrl":null,"url":null,"abstract":"L’historien qui mobilise un corpus d’actes est amene a extraire de chacun de ces documents une serie d’informations necessaires a son etude, comme les noms des protagonistes, les dates, les montants, etc. Lorsque la taille de l’ensemble documentaire considere est importante, cette etape de depouillement peut poser un probleme. Nous presentons ici une methodologie d’analyse semi-automatique d’un tel corpus mettant en œuvre des methodes quantitatives. Nous nous concentrons sur trois etapes de ce processus : le decoupage des actes en sous-parties, la lemmatisation des anthroponymes et l’extraction des dates. Nous soulignons l’importance de l’intervention de l’humain apres l’action de la machine, etape indispensable de tout dispositif d’analyse de ce type.","PeriodicalId":39718,"journal":{"name":"Histoire et Mesure","volume":"1 1","pages":"171-196"},"PeriodicalIF":0.0000,"publicationDate":"2020-12-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"L’ordinateur au service du dépouillement de sources historiques\",\"authors\":\"Sébastien de Valeriola\",\"doi\":\"10.4000/HISTOIREMESURE.13534\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"L’historien qui mobilise un corpus d’actes est amene a extraire de chacun de ces documents une serie d’informations necessaires a son etude, comme les noms des protagonistes, les dates, les montants, etc. Lorsque la taille de l’ensemble documentaire considere est importante, cette etape de depouillement peut poser un probleme. Nous presentons ici une methodologie d’analyse semi-automatique d’un tel corpus mettant en œuvre des methodes quantitatives. Nous nous concentrons sur trois etapes de ce processus : le decoupage des actes en sous-parties, la lemmatisation des anthroponymes et l’extraction des dates. Nous soulignons l’importance de l’intervention de l’humain apres l’action de la machine, etape indispensable de tout dispositif d’analyse de ce type.\",\"PeriodicalId\":39718,\"journal\":{\"name\":\"Histoire et Mesure\",\"volume\":\"1 1\",\"pages\":\"171-196\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2020-12-31\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Histoire et Mesure\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.4000/HISTOIREMESURE.13534\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"Q2\",\"JCRName\":\"Arts and Humanities\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Histoire et Mesure","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.4000/HISTOIREMESURE.13534","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q2","JCRName":"Arts and Humanities","Score":null,"Total":0}
引用次数: 0

摘要

动员一系列行为的历史学家必须从每一份文件中提取其研究所需的一系列信息,如主角的姓名、日期、金额等。当所考虑的文件集的大小很重要时,这一步骤可能会引起问题。在这里,我们提出了一种使用定量方法对此类语料库进行半自动分析的方法。我们专注于这一过程中的三个步骤:将行为分解为子部分、将人类地名分类和提取日期。我们强调机器动作后人工干预的重要性,这是任何此类分析设备的必要步骤。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
L’ordinateur au service du dépouillement de sources historiques
L’historien qui mobilise un corpus d’actes est amene a extraire de chacun de ces documents une serie d’informations necessaires a son etude, comme les noms des protagonistes, les dates, les montants, etc. Lorsque la taille de l’ensemble documentaire considere est importante, cette etape de depouillement peut poser un probleme. Nous presentons ici une methodologie d’analyse semi-automatique d’un tel corpus mettant en œuvre des methodes quantitatives. Nous nous concentrons sur trois etapes de ce processus : le decoupage des actes en sous-parties, la lemmatisation des anthroponymes et l’extraction des dates. Nous soulignons l’importance de l’intervention de l’humain apres l’action de la machine, etape indispensable de tout dispositif d’analyse de ce type.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
Histoire et Mesure
Histoire et Mesure Arts and Humanities-History
CiteScore
0.30
自引率
0.00%
发文量
1
期刊最新文献
Expertiser l’instrumentation scientifique sur une scène industrielle Un fait, un discours et une analyse : la révolte de Adel bey en 1867 vue par le consul de France à Tunis Corine Maitte & Didier Terrier, Les rythmes du labeur. Enquête sur le temps de travail en Europe occidentale, La nouvelle carrière impériale des magistrats espagnols de la fin de l’Ancien Régime L’émergence de la troisième dimension dans les plans de Lyon : de l’histoire à l’archéologie
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1