Click, click boom: Using Wikipedia data to predict changes in battle-related deaths

IF 1.5 3区 社会学 Q2 INTERNATIONAL RELATIONS International Interactions Pub Date : 2022-04-29 DOI:10.1080/03050629.2022.2061969
C. Oswald, Daniel Ohrenhofer
{"title":"Click, click boom: Using Wikipedia data to predict changes in battle-related deaths","authors":"C. Oswald, Daniel Ohrenhofer","doi":"10.1080/03050629.2022.2061969","DOIUrl":null,"url":null,"abstract":"Abstract Data and methods development are key to improve our ability to forecast conflict. Relatively recent data sources such as mobile phone and social media data or images have received widespread attention in conflict research. Oftentimes these do not cover substantial parts of the globe or they are difficult to obtain and manipulate, which makes regular updating challenging. The sometimes vast amounts of data can also be computationally and financially costly. The data source we propose instead is cheap, readily and openly available, and updated in real time, and it provides global coverage: Wikipedia. We argue that the number of country page views can be considered a measure of interest or salience, whereas the number of page changes can be considered a measure of controversy between competing political views. We expect these predictors to be particularly successful in capturing tensions before a conflict escalates. We test our argument by predicting changes in battle-related deaths in Africa on the country-month level. We find evidence that country page views do increase predictive performance while page changes do not. Contrary to our expectation, our model seems to capture long-term trends better than sharp short-term changes. El desarrollo de datos y métodos es fundamental para perfeccionar nuestra habilidad de previsión de conflictos. Las fuentes de datos relativamente nuevas, tales como los datos o las imágenes de los teléfonos celulares y de las redes sociales, han recibido una atención generalizada en la investigación de conflictos. A menudo, dichas fuentes no cubren las partes primordiales del mundo o son difíciles de obtener y manejar, lo que hace que la actualización periódica sea un desafío. Las cantidades de datos, en ocasiones enormes, también pueden ser costosas desde el punto de vista informático y financiero. En su lugar, la fuente de datos que proponemos es económica, está disponible fácil y públicamente, se actualiza en tiempo real y proporciona una cobertura global: Wikipedia. Planteamos que la cantidad de páginas vistas por país puede considerarse una medida de interés o prominencia, mientras que el número de cambios de página puede considerarse una medida de controversia entre las opiniones políticas rivales. Esperamos que estos indicadores tengan especial éxito a la hora de captar las tensiones antes de que el conflicto se intensifique. Ponemos a prueba nuestro argumento prediciendo cambios en las muertes relacionadas con las batallas en África a nivel mensual y por país. Encontramos pruebas de que esas páginas vistas por país aumentan el rendimiento predictivo, mientras que los cambios de página no lo hacen. Al contrario de lo que esperábamos, nuestro modelo parece registrar mejor las tendencias a largo plazo que los cambios bruscos a corto plazo. Les données et le développement des méthodes sont essentiels à l’amélioration de notre capacité à prévoir les conflits. La recherche sur les conflits a étudié avec application des sources de données relativement récentes, telles que celles fournies par les téléphones portables ou les médias sociaux. Néanmoins, dans de nombreux cas, les données obtenues n’englobent pas l’ensemble de la planète. Elles sont parfois difficiles à obtenir et sont délicates à manipuler, ce qui rend difficile toute mise à jour régulière. En outre, du fait de leur quantité, l’analyse de ces données peut être chronophage et coûteuse. Au contraire, la source de données que nous proposons est bon marché, publique et immédiatement disponible, mise à jour en temps réel, et inclut l’ensemble de la planète : Wikipédia. Nous soutenons que le nombre de pages vues par pays permet de mesurer l’intérêt ou l’importance d’un sujet, tandis que le nombre de changements apportés aux pages permet de mesurer le niveau de controverses entre des opinions politiques concurrentes. Nous estimons que ces éléments permettent d’identifier avec succès des tensions avant qu’un conflit n’éclate. Nous vérifions la justesse de nos hypothèses en prédisant des changements en ce qui concerne le nombre de victimes dans des combats en Afrique, par pays et par mois. Nous apportons la preuve que le nombre de pages vues par pays a une valeur prédictive, mais que le nombre de changements apportés aux pages n’en a pas. Contrairement à nos attentes, notre modèle semble permettre d’identifier des tendances de long terme, et non des changements soudains de court terme.","PeriodicalId":51513,"journal":{"name":"International Interactions","volume":"48 1","pages":"678 - 696"},"PeriodicalIF":1.5000,"publicationDate":"2022-04-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"5","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"International Interactions","FirstCategoryId":"90","ListUrlMain":"https://doi.org/10.1080/03050629.2022.2061969","RegionNum":3,"RegionCategory":"社会学","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q2","JCRName":"INTERNATIONAL RELATIONS","Score":null,"Total":0}
引用次数: 5

Abstract

Abstract Data and methods development are key to improve our ability to forecast conflict. Relatively recent data sources such as mobile phone and social media data or images have received widespread attention in conflict research. Oftentimes these do not cover substantial parts of the globe or they are difficult to obtain and manipulate, which makes regular updating challenging. The sometimes vast amounts of data can also be computationally and financially costly. The data source we propose instead is cheap, readily and openly available, and updated in real time, and it provides global coverage: Wikipedia. We argue that the number of country page views can be considered a measure of interest or salience, whereas the number of page changes can be considered a measure of controversy between competing political views. We expect these predictors to be particularly successful in capturing tensions before a conflict escalates. We test our argument by predicting changes in battle-related deaths in Africa on the country-month level. We find evidence that country page views do increase predictive performance while page changes do not. Contrary to our expectation, our model seems to capture long-term trends better than sharp short-term changes. El desarrollo de datos y métodos es fundamental para perfeccionar nuestra habilidad de previsión de conflictos. Las fuentes de datos relativamente nuevas, tales como los datos o las imágenes de los teléfonos celulares y de las redes sociales, han recibido una atención generalizada en la investigación de conflictos. A menudo, dichas fuentes no cubren las partes primordiales del mundo o son difíciles de obtener y manejar, lo que hace que la actualización periódica sea un desafío. Las cantidades de datos, en ocasiones enormes, también pueden ser costosas desde el punto de vista informático y financiero. En su lugar, la fuente de datos que proponemos es económica, está disponible fácil y públicamente, se actualiza en tiempo real y proporciona una cobertura global: Wikipedia. Planteamos que la cantidad de páginas vistas por país puede considerarse una medida de interés o prominencia, mientras que el número de cambios de página puede considerarse una medida de controversia entre las opiniones políticas rivales. Esperamos que estos indicadores tengan especial éxito a la hora de captar las tensiones antes de que el conflicto se intensifique. Ponemos a prueba nuestro argumento prediciendo cambios en las muertes relacionadas con las batallas en África a nivel mensual y por país. Encontramos pruebas de que esas páginas vistas por país aumentan el rendimiento predictivo, mientras que los cambios de página no lo hacen. Al contrario de lo que esperábamos, nuestro modelo parece registrar mejor las tendencias a largo plazo que los cambios bruscos a corto plazo. Les données et le développement des méthodes sont essentiels à l’amélioration de notre capacité à prévoir les conflits. La recherche sur les conflits a étudié avec application des sources de données relativement récentes, telles que celles fournies par les téléphones portables ou les médias sociaux. Néanmoins, dans de nombreux cas, les données obtenues n’englobent pas l’ensemble de la planète. Elles sont parfois difficiles à obtenir et sont délicates à manipuler, ce qui rend difficile toute mise à jour régulière. En outre, du fait de leur quantité, l’analyse de ces données peut être chronophage et coûteuse. Au contraire, la source de données que nous proposons est bon marché, publique et immédiatement disponible, mise à jour en temps réel, et inclut l’ensemble de la planète : Wikipédia. Nous soutenons que le nombre de pages vues par pays permet de mesurer l’intérêt ou l’importance d’un sujet, tandis que le nombre de changements apportés aux pages permet de mesurer le niveau de controverses entre des opinions politiques concurrentes. Nous estimons que ces éléments permettent d’identifier avec succès des tensions avant qu’un conflit n’éclate. Nous vérifions la justesse de nos hypothèses en prédisant des changements en ce qui concerne le nombre de victimes dans des combats en Afrique, par pays et par mois. Nous apportons la preuve que le nombre de pages vues par pays a une valeur prédictive, mais que le nombre de changements apportés aux pages n’en a pas. Contrairement à nos attentes, notre modèle semble permettre d’identifier des tendances de long terme, et non des changements soudains de court terme.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
点击,点击热潮:使用维基百科数据预测与战斗有关的死亡人数的变化
摘要数据和方法开发是提高我们预测冲突能力的关键。在冲突研究中,手机和社交媒体数据或图像等相对较新的数据来源受到了广泛关注。这些实体往往不覆盖地球的大部分地区,或者很难获得和操纵,这使得定期更新具有挑战性。有时大量的数据也可以在计算和财务上花费高昂。相反,我们提议的数据来源便宜、现成和公开,并实时更新,提供全球覆盖范围:维基百科。我们认为,国家页数可以被视为利益或知名度的衡量标准,而页数的变化可以被视为竞争性政治观点之间争议的衡量标准。我们希望这些预测在冲突升级之前特别成功地捕捉到紧张局势。我们通过预测非洲与战斗有关的死亡人数在国家一级的变化来检验我们的论点。我们发现证据表明,国家页面视图提高了预测性能,而页面更改没有。与我们的预期相反,我们的模型似乎捕捉到了比短期急剧变化更好的长期趋势。数据和方法的发展对于提高我们的冲突预测能力至关重要。相对较新的数据来源,如手机和社交网络上的数据或图像,在冲突研究中得到了广泛关注。这些来源往往不包括世界的主要部分,或者很难获得和管理,这使得定期更新成为一项挑战。从计算机和财务的角度来看,有时是巨大的数据量也可能很昂贵。相反,我们提出的数据来源是经济的,易于公开获得,实时更新,并提供全球覆盖范围:维基百科。我们提出,每个国家浏览的页面数量可以被视为一种有趣或突出的衡量标准,而页面更改的数量可以被视为竞争政治观点之间争议的衡量标准。我们希望,这些指标将特别成功地在冲突升级之前捕捉到紧张局势。我们通过预测每月和每个国家与非洲战斗有关的死亡人数的变化来检验我们的论点。我们发现证据表明,这些按国家查看的页面提高了预测性能,而页面更改则没有。与我们的预期相反,我们的模型似乎比短期的突然变化更好地记录了长期趋势。数据和方法的发展对于提高我们预防冲突的能力至关重要。冲突研究利用相对较新的数据来源进行了研究,例如手机或社交媒体提供的数据来源。然而,在许多情况下,获得的数据并不“包括”地球的整体。有时很难获得,也很难处理,这使得任何定期更新都很困难。此外,从它们的数量来看,对这些数据的分析可能是计时和昂贵的。相反,我们提供的数据来源是廉价的、公开的和立即可用的、实时更新的,包括“地球的整体:维基百科”。我们支持每个国家看到的页面数量可以衡量一个主题的“兴趣”或“重要性”,而页面带来的变化数量可以衡量相互竞争的政治观点之间的争议程度。我们认为,这些因素有助于在“冲突”爆发之前“成功地确定紧张局势”。我们正在核实我们假设的正确性,预测非洲、各国和每月战斗中受害者人数的变化。我们支持证据表明,每个国家看到的页面数量具有预测价值,但给页面带来的变化数量并不存在。与我们的预期相反,我们的模型似乎可以识别长期趋势,而不是短期的突然变化。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
International Interactions
International Interactions INTERNATIONAL RELATIONS-
CiteScore
2.40
自引率
7.70%
发文量
38
期刊介绍: International Interactions is a leading interdisciplinary journal that publishes original empirical, analytic, and theoretical studies of conflict and political economy. The journal has a particular interest in research that focuses upon the broad range of relations and interactions among the actors in the global system. Relevant topics include ethnic and religious conflict, interstate and intrastate conflict, conflict resolution, conflict management, economic development, regional integration, trade relations, institutions, globalization, terrorism, and geopolitical analyses.
期刊最新文献
Demographic Consequences of Major Wars Bombs and Banners: Battlefield Dynamics and Armed Groups’ Use of Nonviolent Tactics in Civil War Climate Harshness, Opportunity, and Environmental Violence Sequencing the Steps to War Corrupting the Battlefield: How Corruption Influences Belligerents’ Battlefield Performance
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1