{"title":"Are many sets of eyes better than one? Evaluating multiple databases of armed actors in Colombia","authors":"Javier Osorio","doi":"10.1080/03050629.2023.2180500","DOIUrl":null,"url":null,"abstract":"Abstract In contrast to the pervasive scarcity of disaggregated data affecting sub-national conflict studies, Colombia concentrates a wealth of databases measuring armed actors. How comparable are these databases? What are the implications of their differences for statistical inference? This research compares seven prominent sub-national measures of armed actors in Colombia. Using the Jaccard Similarity Index, the analysis reveals low similarity between measures. At best, results show 28.7% similarity when considering aggregated actor types, but similarity drops to 14.4% when considering specific armed groups. These measures also yield diverging statistical results when used as dependent or independent variables. In addition to their conceptual and methodological differences, pervasive missing data seem to be driving estimate discrepancies. The nuances of these measurement sets make it difficult to categorically determine if this low similarity is an asset or a limitation for empirical research. Yet, the analysis provides clear prescriptions for researchers in data-abundant settings. En contraste con la escasez generalizada de datos desglosados que afecta a los estudios de conflictos subnacionales, Colombia concentra una gran cantidad de bases de datos que cuantifican agentes armados. ¿Qué tan comparables son estas bases de datos? ¿Cuáles son las implicaciones de sus diferencias para la inferencia estadística? Este estudio compara siete prominentes medidas subnacionales de agentes armados en Colombia. Utilizando el índice de similitud de Jaccard, el análisis revela una baja similitud entre estas medidas. En el mejor de los casos, los resultados muestran una similitud del 28.7% cuando se consideran los tipos agregados de actores. Sin embargo, la similitud desciende al 14.4% cuando se consideran grupos armados específicos. Estas medidas también devengan resultados estadísticos divergentes cuando se utilizan como variables dependientes o independientes. Además de las diferencias conceptuales y metodológicas entre ellas, la falta de datos generalizada parece generar las discrepancias en las estimaciones. Los matices de estos conjuntos de medición hacen que sea difícil determinar categóricamente si esta baja similitud es una ventaja o una limitación para la investigación empírica. Aun así, el análisis proporciona recomendaciones claras para los investigadores en entornos en los que existen abundantes datos. Les études sur les conflits sous-nationaux disposent généralement d’un accès très limité aux données, mais la Colombie, elle, possède nombre de bases de données pour mesurer les acteurs armés. Dans quelle mesure sont-elles comparables ? Que signifient leurs différences pour l’inférence statistique ? Ce travail de recherche compare sept mesures sous-nationales importantes des acteurs armés en Colombie. À l’aide de l’indice de similarité de Jaccard, l’analyse révèle un faible niveau de similarités entre les mesures. Au mieux, les résultats révèlent une similarité de 28,7 % pour les agrégations de types d’acteurs, mais elle chute pour atteindre 14,4 % quand on s’intéresse à des groupes armés spécifiques. Ces mesures génèrent aussi des résultats statistiques différents quand elles sont employées comme variables dépendantes ou indépendantes. Outre les différences conceptuelles et méthodologiques, le grand nombre de données encore absentes permettrait d’expliquer les écarts entre les estimations. Cet ensemble de mesures étant nuancé, il est difficile d’établir de façon catégorique si ce faible niveau de similarités représente un atout ou un inconvénient pour la recherche empirique. Néanmoins, l’analyse fournit des recommandations claires pour les chercheurs qui évoluent dans des milieux où les données sont abondantes.","PeriodicalId":51513,"journal":{"name":"International Interactions","volume":"49 1","pages":"268 - 285"},"PeriodicalIF":1.5000,"publicationDate":"2023-03-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"International Interactions","FirstCategoryId":"90","ListUrlMain":"https://doi.org/10.1080/03050629.2023.2180500","RegionNum":3,"RegionCategory":"社会学","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q2","JCRName":"INTERNATIONAL RELATIONS","Score":null,"Total":0}
引用次数: 0
Abstract
Abstract In contrast to the pervasive scarcity of disaggregated data affecting sub-national conflict studies, Colombia concentrates a wealth of databases measuring armed actors. How comparable are these databases? What are the implications of their differences for statistical inference? This research compares seven prominent sub-national measures of armed actors in Colombia. Using the Jaccard Similarity Index, the analysis reveals low similarity between measures. At best, results show 28.7% similarity when considering aggregated actor types, but similarity drops to 14.4% when considering specific armed groups. These measures also yield diverging statistical results when used as dependent or independent variables. In addition to their conceptual and methodological differences, pervasive missing data seem to be driving estimate discrepancies. The nuances of these measurement sets make it difficult to categorically determine if this low similarity is an asset or a limitation for empirical research. Yet, the analysis provides clear prescriptions for researchers in data-abundant settings. En contraste con la escasez generalizada de datos desglosados que afecta a los estudios de conflictos subnacionales, Colombia concentra una gran cantidad de bases de datos que cuantifican agentes armados. ¿Qué tan comparables son estas bases de datos? ¿Cuáles son las implicaciones de sus diferencias para la inferencia estadística? Este estudio compara siete prominentes medidas subnacionales de agentes armados en Colombia. Utilizando el índice de similitud de Jaccard, el análisis revela una baja similitud entre estas medidas. En el mejor de los casos, los resultados muestran una similitud del 28.7% cuando se consideran los tipos agregados de actores. Sin embargo, la similitud desciende al 14.4% cuando se consideran grupos armados específicos. Estas medidas también devengan resultados estadísticos divergentes cuando se utilizan como variables dependientes o independientes. Además de las diferencias conceptuales y metodológicas entre ellas, la falta de datos generalizada parece generar las discrepancias en las estimaciones. Los matices de estos conjuntos de medición hacen que sea difícil determinar categóricamente si esta baja similitud es una ventaja o una limitación para la investigación empírica. Aun así, el análisis proporciona recomendaciones claras para los investigadores en entornos en los que existen abundantes datos. Les études sur les conflits sous-nationaux disposent généralement d’un accès très limité aux données, mais la Colombie, elle, possède nombre de bases de données pour mesurer les acteurs armés. Dans quelle mesure sont-elles comparables ? Que signifient leurs différences pour l’inférence statistique ? Ce travail de recherche compare sept mesures sous-nationales importantes des acteurs armés en Colombie. À l’aide de l’indice de similarité de Jaccard, l’analyse révèle un faible niveau de similarités entre les mesures. Au mieux, les résultats révèlent une similarité de 28,7 % pour les agrégations de types d’acteurs, mais elle chute pour atteindre 14,4 % quand on s’intéresse à des groupes armés spécifiques. Ces mesures génèrent aussi des résultats statistiques différents quand elles sont employées comme variables dépendantes ou indépendantes. Outre les différences conceptuelles et méthodologiques, le grand nombre de données encore absentes permettrait d’expliquer les écarts entre les estimations. Cet ensemble de mesures étant nuancé, il est difficile d’établir de façon catégorique si ce faible niveau de similarités représente un atout ou un inconvénient pour la recherche empirique. Néanmoins, l’analyse fournit des recommandations claires pour les chercheurs qui évoluent dans des milieux où les données sont abondantes.
摘要:与影响次国家冲突研究的分散数据普遍存在的恐惧相反,哥伦比亚集中了大量衡量武装行为者的数据库。这些数据库的可比性如何?它们的差异对统计推理有什么影响?这项研究比较了哥伦比亚武装行为者的七项突出的次国家措施。使用Jaccard相似性指数,分析显示测量值之间的相似性较低。在最佳情况下,当考虑聚合演员类型时,结果显示28.7%的相似性,但当考虑特定武装团体时,相似性下降到14.4%。当用作依赖变量或独立变量时,这些措施也会产生不同的统计结果。除了概念和方法上的差异外,普遍缺失的数据似乎正在推动估计离散度。这些测量集的细微差别使得很难从类别上确定这种低相似度是经验研究的资产还是限制。然而,分析为研究人员在数据丰富的环境中提供了明确的处方。相比之下,哥伦比亚集中了大量的数据基础,如武装部队。它的ESTA数据库有什么可比性?什么是国家推理差异的影响?Este Estudio比较了哥伦比亚Armados Agentes的主要媒体。利用Jaccard的similitud,el análisis revela una baja similitud entre estas medidas。在El mejor de los casos,los resultados muestran una similitud del 28.7%的人认为自己是演员。在禁运的情况下,14.4%的人被视为特别武装部队。Estas medidas también devengan resultados estadísticos diversantes cuando se utilizan como因变量或独立变量。Además de las diferencias conceptuales y metodológicas entre ellas,la falta de datos generalizada parece general las discrepancias en las estimaciones。Los matices de estos conventos de medición hacen que sea difícil决定了类别,如果是下一个相似性,则是一个ventaja o una limitación para la investigación empírica。Aun Así,el análisis proporciona recomendaciones claras para los investigadores en entornos en los que existen abundantes datos。对次国家冲突的研究通常获得的数据非常有限,但哥伦比亚有许多数据库来衡量武装行为者。它们的可比性如何?它们的差异对统计推断意味着什么?这项研究比较了哥伦比亚武装行为者的七项重要次国家措施。使用Jaccard相似性指数,分析显示测量值之间的相似性水平较低。充其量,结果显示,参与者类型的聚合具有28.7%的相似性,但当观察特定武装团体时,相似性降至14.4%。当用作因变量或自变量时,这些测量也会产生不同的统计结果。除了概念和方法上的差异外,仍然缺乏大量数据将有助于解释估计数之间的差异。由于这组测量结果是细微的,因此很难确定这种低水平的相似性是实证研究的优势还是劣势。尽管如此,该分析为在数据丰富的环境中工作的研究人员提供了明确的建议。
期刊介绍:
International Interactions is a leading interdisciplinary journal that publishes original empirical, analytic, and theoretical studies of conflict and political economy. The journal has a particular interest in research that focuses upon the broad range of relations and interactions among the actors in the global system. Relevant topics include ethnic and religious conflict, interstate and intrastate conflict, conflict resolution, conflict management, economic development, regional integration, trade relations, institutions, globalization, terrorism, and geopolitical analyses.