{"title":"Pièges et mésusages en analyse de données","authors":"Olivier Supplisson , Mircea T. Sofonea","doi":"10.1016/j.anrea.2023.08.002","DOIUrl":null,"url":null,"abstract":"<div><p>L’analyse de données est une des pierres angulaires de la recherche biomédicale et de la médecine fondée sur les preuves. Les conclusions qu’elle produit et le corpus d’applications sanitaires qui en découlent sont cependant fragilisés par une diversité de pièges statistiques, erreurs communes et mauvaises pratiques méthodologiques tolérées. La persistance de ces écueils dans la littérature altère la nature des interprétations et constitue un frein aux découvertes et consensus scientifiques. Dans le contexte de flux massif et croissant de publications et de résultats non expertisés (prépublications, communications sur les réseaux sociaux), la rigueur méthodologique et une solide formation statistique sont plus que jamais les meilleurs remparts à une crise de reproductibilité et de confiance. Dans cet article, nous nous appuyons sur la littérature méthodologique récente pour passer en revue les principaux écueils méthodologiques, qu’ils soient bien connus comme ceux relatifs à la significativité ou à la multiplicité de comparaison, ou moins familiers comme la dichotomisation, la sélection de variable ou les problèmes d’autocorrélation spatiales et temporelles. Cette démarche s’inscrit dans une longue série de mises au point et rappels initiée depuis plusieurs décennies par la communauté méthodologique pour maintenir un niveau de maîtrise et de critique indispensable à la fiabilité de la recherche biomédicale.</p></div><div><p>Data analysis is one of the cornerstones of biomedical research and evidence-based medicine. However, the conclusions it produces and the body of health applications derived from it are undermined by a variety of statistical pitfalls, common errors, and tolerated methodological malpractice. The persistence of these pitfalls in the literature alters the nature of interpretations and acts as a brake on scientific discoveries and consensus. In the context of a massive and growing flow of publications and non-expertised results (pre-publications, communications on social networks), methodological rigor and solid statistical training are more than ever the best bulwarks against a crisis of reproducibility and confidence. In this article, we draw on recent methodological literature to review the main methodological pitfalls, be they well-known ones such as those relating to the significance or the multiplicity of comparisons, or less familiar ones such as dichotomisation, variable selection, or problems of spatial and temporal auto-correlation. This approach is part of a long series of refinements and reminders initiated several decades ago by the methodological community to maintain a level of control and criticism that is essential to the reliability of biomedical research.</p></div>","PeriodicalId":42551,"journal":{"name":"Anesthesie & Reanimation","volume":"9 5","pages":"Pages 440-450"},"PeriodicalIF":0.2000,"publicationDate":"2023-11-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Anesthesie & Reanimation","FirstCategoryId":"1085","ListUrlMain":"https://www.sciencedirect.com/science/article/pii/S2352580023001417","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"ANESTHESIOLOGY","Score":null,"Total":0}
引用次数: 0
Abstract
L’analyse de données est une des pierres angulaires de la recherche biomédicale et de la médecine fondée sur les preuves. Les conclusions qu’elle produit et le corpus d’applications sanitaires qui en découlent sont cependant fragilisés par une diversité de pièges statistiques, erreurs communes et mauvaises pratiques méthodologiques tolérées. La persistance de ces écueils dans la littérature altère la nature des interprétations et constitue un frein aux découvertes et consensus scientifiques. Dans le contexte de flux massif et croissant de publications et de résultats non expertisés (prépublications, communications sur les réseaux sociaux), la rigueur méthodologique et une solide formation statistique sont plus que jamais les meilleurs remparts à une crise de reproductibilité et de confiance. Dans cet article, nous nous appuyons sur la littérature méthodologique récente pour passer en revue les principaux écueils méthodologiques, qu’ils soient bien connus comme ceux relatifs à la significativité ou à la multiplicité de comparaison, ou moins familiers comme la dichotomisation, la sélection de variable ou les problèmes d’autocorrélation spatiales et temporelles. Cette démarche s’inscrit dans une longue série de mises au point et rappels initiée depuis plusieurs décennies par la communauté méthodologique pour maintenir un niveau de maîtrise et de critique indispensable à la fiabilité de la recherche biomédicale.
Data analysis is one of the cornerstones of biomedical research and evidence-based medicine. However, the conclusions it produces and the body of health applications derived from it are undermined by a variety of statistical pitfalls, common errors, and tolerated methodological malpractice. The persistence of these pitfalls in the literature alters the nature of interpretations and acts as a brake on scientific discoveries and consensus. In the context of a massive and growing flow of publications and non-expertised results (pre-publications, communications on social networks), methodological rigor and solid statistical training are more than ever the best bulwarks against a crisis of reproducibility and confidence. In this article, we draw on recent methodological literature to review the main methodological pitfalls, be they well-known ones such as those relating to the significance or the multiplicity of comparisons, or less familiar ones such as dichotomisation, variable selection, or problems of spatial and temporal auto-correlation. This approach is part of a long series of refinements and reminders initiated several decades ago by the methodological community to maintain a level of control and criticism that is essential to the reliability of biomedical research.
数据分析是生物医学研究和循证医学的基石之一。然而,由于各种统计陷阱、常见错误和可容忍的不良方法做法,它得出的结论和由此产生的卫生应用体系受到了削弱。这些缺陷在文献中的持续存在改变了解释的性质,并阻碍了科学发现和共识。在大量和不断增加的未经评估的出版物和结果(出版物前、社交网络上的交流)的背景下,方法的严密性和坚实的统计培训比以往任何时候都更能抵御复制和信任危机。在这篇文章中,我们依靠近代文学方法论来审查主要方法礁石一样,无论是众所周知的那些关于性或多重比较dichotomisation一样,还是那么熟悉,挑选变量或自相关问题的空间和时间。这一方法是方法学界几十年来发起的一系列发展和提醒的一部分,目的是保持对生物医学研究的可靠性至关重要的控制和批评水平。= =地理= =根据美国人口普查局的数据,该县的总面积为,其中土地和(1.)水。然而,各种统计陷阱、常见错误和可容忍的方法不当行为破坏了它所产生的结论和由此产生的人体健康应用。这些陷阱在文献中的持续存在改变了解释的性质,并阻碍了科学发现和共识。在大量和不断增长的出版物和非专家成果流(出版物前、社会网络交流)的背景下,方法严谨性和可靠的统计培训比以往任何时候都更是应对重现性和信心危机的最佳手段。In this篇,we draw on recent方法文学to review the main方法的银行集团,be they格雷森”,such as》这几句话,但是8 the multiplicity退税,比较少的工具familiar such as dichotomisation空间变量的选择、伦敦黄金and temporal auto-correlation。这一方法是方法学界几十年前为维持对生物医学研究的可靠性至关重要的一定程度的控制和批评而发起的一系列改进和提醒的一部分。