Corrélations écologiques et comportement des individus

William S. Robinson
{"title":"Corrélations écologiques et comportement des individus","authors":"William S. Robinson","doi":"10.52983/crev.vi.101","DOIUrl":null,"url":null,"abstract":"Hanan C. Selvin inventa l’expression d’erreur écologique (ecological fallacy) dans un article de 1958. Il y pointait les erreurs d’interprétation d’Émile Durkheim qui, dans Le suicide, établissait des corrélations entre diverses propriétés sociales et la propension au suicide à partir de données agrégées à l’échelle de territoires (le département pour la France, la région pour la Prusse, etc.). Par exemple, le taux de suicide étant plus important dans les régions de Prusse où les protestants sont plus nombreux, il existerait un lien entre protestantisme et suicide. Or, les suicides recensés pouvaient en réalité concerner tout autant des protestants que des catholiques : les données ne permettant pas de le mesurer au niveau individuel, il est erroné d’en déduire un lien individuel entre religion et suicide. Selvin appuyait sa critique sur un article de William S. Robinson paru huit ans plus tôt, dont Cambouis propose ici une traduction. Robinson établit mathématiquement, pour la première fois, les raisons pour lesquelles une corrélation observée entre des pourcentages ou des taux portant sur une population agrégée à l’échelle de découpages territoriaux s’avère souvent différente d’une corrélation entre des caractéristiques mesurées à l’échelle des individus composant cette population. Ainsi, plus les immigré⋅es sont nombreux dans une région des États-Unis, plus le taux d’illettrisme y est faible ; pourtant, à l’échelle individuelle, les immigré⋅es s’avèrent en moyenne plus souvent illettré⋅es que les autochtones (une explication possible de cet écart est que les immigré⋅es tendent à s’installer dans les régions aux plus faibles taux d’illettrisme). S’il nous paraît utile de remettre en visibilité cette démonstration aujourd’hui, c’est qu’elle n’a pas empêché depuis que nombre d’analyses statistiques succombent (tout en s'en défendant souvent) à la tentation d’inférer des relations « écologiques » mal contrôlées en l’absence de données individuelles – c’est ainsi fréquent en analyse électorale, lorsque par exemple est déduit de la corrélation entre la forte présence d’ouvrier⋅es et l’importance du vote FN/RN à l’échelle des circonscriptions que les ouvrier⋅es seraient passé⋅es du vote PCF au vote FN/RN, alors que les sondages « sorties des urnes », qui offrent des données individuelles, établissent que, pour l’essentiel, ce ne sont pas les mêmes ouvrier⋅es qui votaient PCF (et aujourd’hui tendent à s’abstenir) et qui votent aujourd’hui FN/RN (et qui auparavant tendaient à s’abstenir). Le risque d'erreur écologique est également l'un des facteurs du développement des modèles multiniveaux, par exemple en sciences politiques ou en démographie (voir, respectivement, les travaux d'Andrew Gelman et de Daniel Courgeau).","PeriodicalId":124377,"journal":{"name":"Cambouis, la revue des sciences sociales aux mains sales","volume":"9 12","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-01-21","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Cambouis, la revue des sciences sociales aux mains sales","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.52983/crev.vi.101","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Hanan C. Selvin inventa l’expression d’erreur écologique (ecological fallacy) dans un article de 1958. Il y pointait les erreurs d’interprétation d’Émile Durkheim qui, dans Le suicide, établissait des corrélations entre diverses propriétés sociales et la propension au suicide à partir de données agrégées à l’échelle de territoires (le département pour la France, la région pour la Prusse, etc.). Par exemple, le taux de suicide étant plus important dans les régions de Prusse où les protestants sont plus nombreux, il existerait un lien entre protestantisme et suicide. Or, les suicides recensés pouvaient en réalité concerner tout autant des protestants que des catholiques : les données ne permettant pas de le mesurer au niveau individuel, il est erroné d’en déduire un lien individuel entre religion et suicide. Selvin appuyait sa critique sur un article de William S. Robinson paru huit ans plus tôt, dont Cambouis propose ici une traduction. Robinson établit mathématiquement, pour la première fois, les raisons pour lesquelles une corrélation observée entre des pourcentages ou des taux portant sur une population agrégée à l’échelle de découpages territoriaux s’avère souvent différente d’une corrélation entre des caractéristiques mesurées à l’échelle des individus composant cette population. Ainsi, plus les immigré⋅es sont nombreux dans une région des États-Unis, plus le taux d’illettrisme y est faible ; pourtant, à l’échelle individuelle, les immigré⋅es s’avèrent en moyenne plus souvent illettré⋅es que les autochtones (une explication possible de cet écart est que les immigré⋅es tendent à s’installer dans les régions aux plus faibles taux d’illettrisme). S’il nous paraît utile de remettre en visibilité cette démonstration aujourd’hui, c’est qu’elle n’a pas empêché depuis que nombre d’analyses statistiques succombent (tout en s'en défendant souvent) à la tentation d’inférer des relations « écologiques » mal contrôlées en l’absence de données individuelles – c’est ainsi fréquent en analyse électorale, lorsque par exemple est déduit de la corrélation entre la forte présence d’ouvrier⋅es et l’importance du vote FN/RN à l’échelle des circonscriptions que les ouvrier⋅es seraient passé⋅es du vote PCF au vote FN/RN, alors que les sondages « sorties des urnes », qui offrent des données individuelles, établissent que, pour l’essentiel, ce ne sont pas les mêmes ouvrier⋅es qui votaient PCF (et aujourd’hui tendent à s’abstenir) et qui votent aujourd’hui FN/RN (et qui auparavant tendaient à s’abstenir). Le risque d'erreur écologique est également l'un des facteurs du développement des modèles multiniveaux, par exemple en sciences politiques ou en démographie (voir, respectivement, les travaux d'Andrew Gelman et de Daniel Courgeau).
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
生态相关性和个体行为
Hanan C. Selvin 在 1958 年的一篇文章中创造了生态谬误一词。在这篇文章中,他指出了埃米尔-杜克海姆(Émile Durkheim)的误读,杜克海姆在《自杀》(Le Suicide)一书中,根据地区层面(法国的省,普鲁士的地区等)的汇总数据,确定了各种社会属性与自杀倾向之间的相关性。例如,由于普鲁士地区新教徒较多,自杀率较高,因此新教与自杀之间似乎存在联系。然而,记录在案的自杀事件中可能既有新教徒,也有天主教徒:由于数据无法从个体层面进行衡量,因此推断出宗教与自杀之间的个体联系是错误的。塞尔文的批评基于威廉-罗宾逊(William S. Robinson)八年前发表的一篇文章,坎布瓦在此翻译了这篇文章。罗宾逊首次用数学方法证明了为什么在地区划分层面上观察到的人口百分比或比率之间的相关性往往不同于在人口个体层面上测量到的特征之间的相关性。例如,美国某个地区的移民人数越多,该地区的文盲率就越低;然而,就个人而言,移民的平均文盲率却高于本地人(对这种差异的一种可能解释是,移民往往定居在文盲率最低的地区)。如果我们认为今天重温这一论证是有益的,那是因为它并没有阻止许多统计分析在缺乏个体数据的情况下屈服于推断控制不力的 "生态 "关系的诱惑(尽管常常否认这一点)--这是选举分析中经常出现的情况、例如,根据蓝领工人的大量存在与选区内新生力量/民族阵线选票规模之间的相关性,推断蓝领工人会从投票给保卫刚果阵线转为投票给新生力量/民族阵线,而提供个别数据的 "出口民调 "却证实蓝领工人会从投票给保卫刚果阵线转为投票给新生力量/民族阵线、而提供个人数据的 "出口民调 "则表明,在大多数情况下,现在投票给 FN/RN(以前倾向于弃权)的并不是以前投票给 PCF(现在倾向于弃权)的工人阶级。生态误差的风险也是发展多层次模型的因素之一,例如在政治学或人口学领域(分别参见 Andrew Gelman 和 Daniel Courgeau 的著作)。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
0
期刊最新文献
Corrélations écologiques et comportement des individus La citation comme technique de persuasion et comme preuve Dans les coulisses d’un jury de piano De la création de la possibilité de l’enquête à l’engagement ethnographique Pour une sociologie curieuse, libre et tenace
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1