Direction Augmentation in the Evaluation of Armed Conflict Predictions

IF 1.5 3区 社会学 Q2 INTERNATIONAL RELATIONS International Interactions Pub Date : 2023-09-19 DOI:10.1080/03050629.2023.2255923
Johannes Bracher, Lotta Rüter, Fabian Krüger, Sebastian Lerch, Melanie Schienle
{"title":"Direction Augmentation in the Evaluation of Armed Conflict Predictions","authors":"Johannes Bracher, Lotta Rüter, Fabian Krüger, Sebastian Lerch, Melanie Schienle","doi":"10.1080/03050629.2023.2255923","DOIUrl":null,"url":null,"abstract":"AbstractIn many forecasting settings, there is a specific interest in predicting the sign of an outcome variable correctly in addition to its magnitude. For instance, when forecasting armed conflicts, positive and negative log-changes in monthly fatalities represent escalation and de-escalation, respectively, and have very different implications. In the ViEWS forecasting challenge, a prediction competition on state-based violence, a novel evaluation score called targeted absolute deviation with direction augmentation (TADDA) has therefore been suggested, which accounts for both for the sign and magnitude of log-changes. While it has a straightforward intuitive motivation, the empirical results of the challenge show that a no-change model always predicting a log-change of zero outperforms all submitted forecasting models under the TADDA score. We provide a statistical explanation for this phenomenon. Analyzing the properties of TADDA, we find that in order to achieve good scores, forecasters often have an incentive to predict no or only modest log-changes. In particular, there is often an incentive to report conservative point predictions considerably closer to zero than the forecaster’s actual predictive median or mean. In an empirical application, we demonstrate that a no-change model can be improved upon by tailoring predictions to the particularities of the TADDA score. We conclude by outlining some alternative scoring concepts.En muchos de los entornos de previsión, existe un interés específico en predecir correctamente el signo de una variable resultante, además de su magnitud. Por ejemplo, cuando se hacen previsiones referentes a los conflictos armados, los cambios logarítmicos, tanto positivos como negativos, en las muertes mensuales representan, respectivamente, una escalada y una distensión y tienen implicaciones muy diferentes. El reto en materia de previsión «ViEWS (por sus siglas en inglés, Violence and Impacts Early-Warning System: Sistema de alerta temprana de violencia e impactos)» es una competición de predicción en materia de la violencia por parte del Estado. Dentro del marco del “ViEWS” se ha sugerido una nueva puntuación, con el fin de realizar esta evaluación, denominada desviación absoluta dirigida con aumento de dirección (TADDA, por sus siglas en inglés), que explica tanto el signo como la magnitud de los cambios logarítmicos. Si bien esto tiene una motivación intuitiva directa, los resultados empíricos de este desafío muestran que un modelo sin cambios, que siempre predice un cambio logarítmico por valor de cero, supera el rendimiento de todos los modelos de pronóstico que habían sido presentados bajo la puntuación TADDA. Proporcionamos una explicación estadística para este fenómeno. Concluimos, mediante el análisis de las propiedades del TADDA, que, con frecuencia, los pronosticadores tienen un incentivo para predecir cambios logarítmicos nulos o pequeños con el fin de poder conseguir unas buenas puntuaciones. En concreto, vemos que muchas veces existe un incentivo para reportar predicciones puntuales conservadoras que están considerablemente más cercanas a cero que la mediana o la media predictiva real obtenidas por el pronosticador. Demostramos, mediante la aplicación empírica de todo esto, que un modelo sin cambios puede mejorarse adaptando las predicciones a las particularidades de la puntuación TADDA. Finalizamos esbozando algunos conceptos de puntuación alternativos.En prévision, on s’intéresse souvent tout particulièrement à la prédiction exacte du signe d’une variable de résultat en plus de sa grandeur. Par exemple, dans le cadre de prévisions sur les conflits armés, les changements logarithmiques positifs et négatifs dans le nombre de morts mensuelles représentent respectivement une escalade ou un apaisement, et s’accompagnent d’implications bien différentes. Dans le défi de prévisions de VIEWS, une compétition portant sur la prévision de violences étatiques, un nouveau score d’évaluation appelé déviation absolue ciblée avec augmentation de la direction (TADDA) a donc été suggéré : il prend en compte à la fois le signe et la grandeur des changements logarithmiques. Bien que sa motivation soit claire et intuitive, les résultats empiriques de ce défi montrent qu’un modèle de non-changement qui prédit toujours un changement logarithmique de zéro surpasse tous les modèles de prévision proposés dans le cadre du score TADDA. Nous proposons une explication statistique de ce phénomène. En analysant les propriétés de TADDA, nous observons qu’afin d’obtenir de bons scores, les auteurs de prévision sont souvent incités à prévoir des changements logarithmiques modestes, voire nuls. Plus précisément, il est souvent avantageux d'indiquer des prédictions de points prudentes et bien plus proches de zéro que la réeelle moyenne ou médiane prédictive de l'auteur des prévisions. Dans le cadre d’une application empirique, nous démontrons qu’un modèle de non-changement peut être amélioré en adaptant les prédictions aux particularités du score TADDA. Nous concluons en décrivant d’autres concepts de score.Keywords: Armed conflictforecast evaluationpoint forecastpolitical violenceTADDA Disclosure statementNo potential conflict of interest was reported by the author(s).Data and code availability statementCode and data to reproduce the presented results can be found at https://github.com/KITmetricslab/tadda. Replication materials will moreover be made available at https://dataverse.harvard.edu/dataverse/internationalinteractions.Notes1 ViEWS stands for Violence Early Warning System, a publicly available ensemble approach for predicting monthly indicators of violence on a global scale, see Hegre et al. (Citation2019) for more details.2 Uppsala Conflict Data Program (Citation2023).3 PRIO-GRID was chosen as a finer-resolution alternative to the country-level approach. “It is a vector grid network with a resolution of 0.5×0.5 decimal degrees, covering all terrestrial areas of the world”, see Tollefsen et al. (Citation2012).Additional informationFundingJohannes Bracher was supported by the Helmholtz Information and Data Science Project SIMCARD as well as Deutsche Forschungsgemeinschaft (DFG, German Research Foundation) – project number 512483310. Sebastian Lerch gratefully acknowledges support by the Vector Stiftung through the Young Investigator Group “Artificial Intelligence for Probabilistic Weather Forecasting”. Melanie Schienle gratefully acknowledges funding by the HEiKA EXC-scouting initiative.","PeriodicalId":51513,"journal":{"name":"International Interactions","volume":"49 1","pages":"0"},"PeriodicalIF":1.5000,"publicationDate":"2023-09-19","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"International Interactions","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.1080/03050629.2023.2255923","RegionNum":3,"RegionCategory":"社会学","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q2","JCRName":"INTERNATIONAL RELATIONS","Score":null,"Total":0}
引用次数: 0

Abstract

AbstractIn many forecasting settings, there is a specific interest in predicting the sign of an outcome variable correctly in addition to its magnitude. For instance, when forecasting armed conflicts, positive and negative log-changes in monthly fatalities represent escalation and de-escalation, respectively, and have very different implications. In the ViEWS forecasting challenge, a prediction competition on state-based violence, a novel evaluation score called targeted absolute deviation with direction augmentation (TADDA) has therefore been suggested, which accounts for both for the sign and magnitude of log-changes. While it has a straightforward intuitive motivation, the empirical results of the challenge show that a no-change model always predicting a log-change of zero outperforms all submitted forecasting models under the TADDA score. We provide a statistical explanation for this phenomenon. Analyzing the properties of TADDA, we find that in order to achieve good scores, forecasters often have an incentive to predict no or only modest log-changes. In particular, there is often an incentive to report conservative point predictions considerably closer to zero than the forecaster’s actual predictive median or mean. In an empirical application, we demonstrate that a no-change model can be improved upon by tailoring predictions to the particularities of the TADDA score. We conclude by outlining some alternative scoring concepts.En muchos de los entornos de previsión, existe un interés específico en predecir correctamente el signo de una variable resultante, además de su magnitud. Por ejemplo, cuando se hacen previsiones referentes a los conflictos armados, los cambios logarítmicos, tanto positivos como negativos, en las muertes mensuales representan, respectivamente, una escalada y una distensión y tienen implicaciones muy diferentes. El reto en materia de previsión «ViEWS (por sus siglas en inglés, Violence and Impacts Early-Warning System: Sistema de alerta temprana de violencia e impactos)» es una competición de predicción en materia de la violencia por parte del Estado. Dentro del marco del “ViEWS” se ha sugerido una nueva puntuación, con el fin de realizar esta evaluación, denominada desviación absoluta dirigida con aumento de dirección (TADDA, por sus siglas en inglés), que explica tanto el signo como la magnitud de los cambios logarítmicos. Si bien esto tiene una motivación intuitiva directa, los resultados empíricos de este desafío muestran que un modelo sin cambios, que siempre predice un cambio logarítmico por valor de cero, supera el rendimiento de todos los modelos de pronóstico que habían sido presentados bajo la puntuación TADDA. Proporcionamos una explicación estadística para este fenómeno. Concluimos, mediante el análisis de las propiedades del TADDA, que, con frecuencia, los pronosticadores tienen un incentivo para predecir cambios logarítmicos nulos o pequeños con el fin de poder conseguir unas buenas puntuaciones. En concreto, vemos que muchas veces existe un incentivo para reportar predicciones puntuales conservadoras que están considerablemente más cercanas a cero que la mediana o la media predictiva real obtenidas por el pronosticador. Demostramos, mediante la aplicación empírica de todo esto, que un modelo sin cambios puede mejorarse adaptando las predicciones a las particularidades de la puntuación TADDA. Finalizamos esbozando algunos conceptos de puntuación alternativos.En prévision, on s’intéresse souvent tout particulièrement à la prédiction exacte du signe d’une variable de résultat en plus de sa grandeur. Par exemple, dans le cadre de prévisions sur les conflits armés, les changements logarithmiques positifs et négatifs dans le nombre de morts mensuelles représentent respectivement une escalade ou un apaisement, et s’accompagnent d’implications bien différentes. Dans le défi de prévisions de VIEWS, une compétition portant sur la prévision de violences étatiques, un nouveau score d’évaluation appelé déviation absolue ciblée avec augmentation de la direction (TADDA) a donc été suggéré : il prend en compte à la fois le signe et la grandeur des changements logarithmiques. Bien que sa motivation soit claire et intuitive, les résultats empiriques de ce défi montrent qu’un modèle de non-changement qui prédit toujours un changement logarithmique de zéro surpasse tous les modèles de prévision proposés dans le cadre du score TADDA. Nous proposons une explication statistique de ce phénomène. En analysant les propriétés de TADDA, nous observons qu’afin d’obtenir de bons scores, les auteurs de prévision sont souvent incités à prévoir des changements logarithmiques modestes, voire nuls. Plus précisément, il est souvent avantageux d'indiquer des prédictions de points prudentes et bien plus proches de zéro que la réeelle moyenne ou médiane prédictive de l'auteur des prévisions. Dans le cadre d’une application empirique, nous démontrons qu’un modèle de non-changement peut être amélioré en adaptant les prédictions aux particularités du score TADDA. Nous concluons en décrivant d’autres concepts de score.Keywords: Armed conflictforecast evaluationpoint forecastpolitical violenceTADDA Disclosure statementNo potential conflict of interest was reported by the author(s).Data and code availability statementCode and data to reproduce the presented results can be found at https://github.com/KITmetricslab/tadda. Replication materials will moreover be made available at https://dataverse.harvard.edu/dataverse/internationalinteractions.Notes1 ViEWS stands for Violence Early Warning System, a publicly available ensemble approach for predicting monthly indicators of violence on a global scale, see Hegre et al. (Citation2019) for more details.2 Uppsala Conflict Data Program (Citation2023).3 PRIO-GRID was chosen as a finer-resolution alternative to the country-level approach. “It is a vector grid network with a resolution of 0.5×0.5 decimal degrees, covering all terrestrial areas of the world”, see Tollefsen et al. (Citation2012).Additional informationFundingJohannes Bracher was supported by the Helmholtz Information and Data Science Project SIMCARD as well as Deutsche Forschungsgemeinschaft (DFG, German Research Foundation) – project number 512483310. Sebastian Lerch gratefully acknowledges support by the Vector Stiftung through the Young Investigator Group “Artificial Intelligence for Probabilistic Weather Forecasting”. Melanie Schienle gratefully acknowledges funding by the HEiKA EXC-scouting initiative.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
武装冲突预测评估中的方向增强
在许多预测设置中,除了预测结果变量的大小外,还对正确预测结果变量的符号有特殊的兴趣。例如,在预测武装冲突时,每月死亡人数的正对数变化和负对数变化分别代表冲突升级和冲突降级,并具有非常不同的影响。在ViEWS预测挑战中,基于状态的暴力预测竞争,因此提出了一种新的评估分数,称为定向绝对偏差与方向增强(TADDA),它同时考虑了对数变化的符号和大小。虽然它具有直接的直观动机,但挑战的实证结果表明,在TADDA得分下,始终预测对数变化为零的无变化模型优于所有提交的预测模型。我们对这一现象提供了统计上的解释。分析TADDA的性质,我们发现为了获得好的分数,预测者通常有动机不预测或只预测适度的对数变化。特别是,通常会有一种动机,即报告保守的预测点,比预测者的实际预测中位数或平均值更接近于零。在一个实证应用中,我们证明了通过根据TADDA分数的特殊性调整预测可以改进无变化模型。最后,我们概述了一些可供选择的评分概念。在许多情况下,对于previsión而言,存在一个跨<s:1> <s:1>通讯通讯específico,在之前的修正中,存在一个变量结果的符号además。穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人、穷人。《意见》(暴力和影响预警系统:暴力和影响预警系统)网址:competición《意见》网址:predicción《意见》网址:墨西哥暴力和影响预警系统网址:competición《意见》网址:墨西哥暴力和影响预警系统。关于“意见”的详细说明如下:新意见puntuación、新意见evaluación、新意见desviación、新意见dirección (TADDA、新意见和新意见)、新意见logarítmicos、新意见和新意见logarítmicos。我的直觉是:我的直觉是:我的直觉是:我的直觉是:我的直觉是:我的直觉是:我的直觉是:我的直觉是:empíricos我的直觉是:desafío我的直觉是:empíricos我的直觉是:desafío我的直觉是:logarítmico我的直觉是:logarítmico我的直觉是:logarítmico我的直觉是:logarítmico我的直觉是:habían我的直觉是:puntuación TADDA。比例:una explicación estadística para este fenómeno。结论:中介el análisis de las proedades del TADDA, que, conrecucia, los proproticadores tienen unmotivation para preformer camos logarítmicos nulos o pequeños conel finder conconder conguir unas buenas puntuaciones。具体地说,在没有激励机制的情况下,新闻媒体的预测是不存在的,例如,新闻媒体预测是不存在的,例如,新闻媒体预测是不存在的,例如,新闻媒体预测是不存在的,例如,新闻媒体预测是不存在的。Demostramos, mediante la aplicación empírica de todo to to, que unmodelo in cambios, que unmodelo in cambios, que unmodelo in cambios, que unmodelo cambios, mejorararadaptando, as predicpredicas, as particular ides de la puntuación TADDA。最终确定puntuación替代方案的概念。在这个过程中,你可以看到,在这个过程中,你可以看到,在这个过程中,你可以看到,在这个过程中,你可以看到,在这个过程中,你可以看到,在这个过程中,你可以看到。例如,在冲突情况下,交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换交换3 .有3种情况:1 .从VIEWS的角度看,1 .从暴力的角度看,1 .从新的角度看,3 .从完全自由的角度看,3 .从绝对自由的角度看,3 .从增强方向看,3 .从变化的角度看,3 .从变化的角度看,3 .从变化的角度看,3 .从变化的角度看,3 .从变化的角度看,3 .从变化的角度看,3 .从变化的角度看,3 .从变化的角度看,3 .从变化的角度看,3 .从变化的角度看,3 .从变化的角度看。从动机上看,这是很直观的,从经验上看,这是很直观的,从模型上看,这是很直观的,从模型上看,这是不变的,从模型上看,这是不变的,从对数上看,这是很直观的。Nous提出了一种解释,即统计数据的变化。在分析过程中,我们观察到的数据是固有的,我们观察到的数据是固有的,我们观察到的数据是固有的,我们观察到的数据是固有的,我们观察到的数据是固有的,我们观察到的数据是固有的,我们观察到的是固有的。加上pracimassimement,将会获得优势,从个体的角度来看,pracimassimement将会得到优势,从个体的角度来看,pracimement将会得到优势。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
International Interactions
International Interactions INTERNATIONAL RELATIONS-
CiteScore
2.40
自引率
7.70%
发文量
38
期刊介绍: International Interactions is a leading interdisciplinary journal that publishes original empirical, analytic, and theoretical studies of conflict and political economy. The journal has a particular interest in research that focuses upon the broad range of relations and interactions among the actors in the global system. Relevant topics include ethnic and religious conflict, interstate and intrastate conflict, conflict resolution, conflict management, economic development, regional integration, trade relations, institutions, globalization, terrorism, and geopolitical analyses.
期刊最新文献
Demographic Consequences of Major Wars Bombs and Banners: Battlefield Dynamics and Armed Groups’ Use of Nonviolent Tactics in Civil War Climate Harshness, Opportunity, and Environmental Violence Sequencing the Steps to War Corrupting the Battlefield: How Corruption Influences Belligerents’ Battlefield Performance
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1