通过自动分析医院报告改进免疫介导的炎症性疾病患者的表型特征描述

IF 0.7 4区 医学 Q3 MEDICINE, GENERAL & INTERNAL Revue De Medecine Interne Pub Date : 2024-11-27 DOI:10.1016/j.revmed.2024.10.368
C. Gerardin , A. Remaki , J. Ung , P. Pagès , P. Wajsburt , G. Faure , T. Petit-Jean , X. Tannier
{"title":"通过自动分析医院报告改进免疫介导的炎症性疾病患者的表型特征描述","authors":"C. Gerardin ,&nbsp;A. Remaki ,&nbsp;J. Ung ,&nbsp;P. Pagès ,&nbsp;P. Wajsburt ,&nbsp;G. Faure ,&nbsp;T. Petit-Jean ,&nbsp;X. Tannier","doi":"10.1016/j.revmed.2024.10.368","DOIUrl":null,"url":null,"abstract":"<div><h3>Introduction</h3><div>Dans le contexte de l’utilisation secondaire des données issues du soins rassemblées dans le dossier patient informatisé, les analyses rétrospectives réalisées utilisent essentiellement les données structurées-tels que les codes CIM10, les données de biologies etc. mais ignorent souvent les informations clés consignées dans le texte libre par les cliniciens dans les comptes-rendus hospitaliers qui sont pourtant essentielles pour la caractérisation fine des patients et de l’évolution de leur maladie au cours du temps.</div><div>Cette étude vise à prouver qu’il est possible de mieux caractériser les patients atteints de maladies immuno-inflammatoires à partir de leurs dossiers informatisés en exploitant directement les données présentent dans les comptes-rendus médicaux. En particulier, nous avons cherché à démontrer que l’extraction des résultats de tests de laboratoire et des traitements médicamenteux chez des patients atteints de maladies inflammatoires à médiation immunitaire enrichit les informations structurées, permettant ainsi un profilage plus complet et précis des patients. Les quatre maladies ciblées étaient le lupus érythémateux disséminé, la sclérose systémique, le syndrome des antiphospholipides et l’artérite de Takayasu.</div></div><div><h3>Matériels et méthodes</h3><div>Nous avons collecté les dossiers médicaux de patients hospitalisés entre 2012 et 2021, diagnostiqués avec l’une des quatre maladies étudiées, avec au moins un compte-rendu disponible, à partir de la base de données de l’AP–HP. Les informations sur les tests de laboratoire et les traitements médicamenteux ont été extraites des résumés de sortie en utilisant des algorithmes de traitement automatique du langage naturel proches du modèle GPT. Ces données ont ensuite été standardisées à l’aide des systèmes de codage SNOMED CT pour les tests de laboratoire et ATC pour les médicaments, afin de les intégrer aux données structurées et faciliter leur analyse.</div></div><div><h3>Résultats</h3><div>Les algorithmes ont été testés et validés sur un échantillon de 103 résumés de sortie annotés manuellement. L’extraction d’entités d’intérêt a montré un score F1 de 0,72 IC95 [0,64–0,80] pour les tests de laboratoire et de 0,86 [0,80 ; 0,90] pour les médicaments. Ces algorithmes ont été appliqués à un ensemble de 18 604 dossiers médicaux électroniques, avec une importante augmentation de la détection des marqueurs diagnostiques et des traitements par rapport à l’analyse des données structurées seules. Par exemple, dans la cohorte lupus, la détection de la positivité des anticorps antinucléaires chez les patients a augmenté de 53,6 % (en valeur absolue) et la détection des patients sous hydroxychloroquine a augmenté de 63,4 % ; de même, dans la cohorte syndrome des antiphospholipides, le nombre de patients traités par anti-vitamine K était 41 % plus élevé avec cette méthode. La précision des algorithmes a été vérifiée manuellement sur un échantillon de 240 entités prédites, avec une précision de 0,97 pour les tests de laboratoire et de 1,0 pour les médicaments, confirmant la fiabilité des algorithmes développés. Le code source des algorithmes est disponible en accès libre.</div></div><div><h3>Conclusion</h3><div>Cette étude démontre que l’extraction automatique des informations contenues dans les résumés de sortie hospitalière permet d’enrichir les données structurées des dossiers médicaux électroniques et de mieux caractériser les patients dans les analyses sur données de vie réelle. L’intégration de ces informations ouvre la voie à une meilleure compréhension et prise en charge des patients en améliorant notamment la qualité des analyses cliniques.</div></div>","PeriodicalId":54458,"journal":{"name":"Revue De Medecine Interne","volume":"45 ","pages":"Pages A387-A388"},"PeriodicalIF":0.7000,"publicationDate":"2024-11-27","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Améliorer la caractérisation phénotypique des patients atteints de maladies inflammatoires à médiation immunitaire par l’analyse automatique des comptes-rendus hospitaliers\",\"authors\":\"C. Gerardin ,&nbsp;A. Remaki ,&nbsp;J. Ung ,&nbsp;P. Pagès ,&nbsp;P. Wajsburt ,&nbsp;G. Faure ,&nbsp;T. Petit-Jean ,&nbsp;X. Tannier\",\"doi\":\"10.1016/j.revmed.2024.10.368\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"<div><h3>Introduction</h3><div>Dans le contexte de l’utilisation secondaire des données issues du soins rassemblées dans le dossier patient informatisé, les analyses rétrospectives réalisées utilisent essentiellement les données structurées-tels que les codes CIM10, les données de biologies etc. mais ignorent souvent les informations clés consignées dans le texte libre par les cliniciens dans les comptes-rendus hospitaliers qui sont pourtant essentielles pour la caractérisation fine des patients et de l’évolution de leur maladie au cours du temps.</div><div>Cette étude vise à prouver qu’il est possible de mieux caractériser les patients atteints de maladies immuno-inflammatoires à partir de leurs dossiers informatisés en exploitant directement les données présentent dans les comptes-rendus médicaux. En particulier, nous avons cherché à démontrer que l’extraction des résultats de tests de laboratoire et des traitements médicamenteux chez des patients atteints de maladies inflammatoires à médiation immunitaire enrichit les informations structurées, permettant ainsi un profilage plus complet et précis des patients. Les quatre maladies ciblées étaient le lupus érythémateux disséminé, la sclérose systémique, le syndrome des antiphospholipides et l’artérite de Takayasu.</div></div><div><h3>Matériels et méthodes</h3><div>Nous avons collecté les dossiers médicaux de patients hospitalisés entre 2012 et 2021, diagnostiqués avec l’une des quatre maladies étudiées, avec au moins un compte-rendu disponible, à partir de la base de données de l’AP–HP. Les informations sur les tests de laboratoire et les traitements médicamenteux ont été extraites des résumés de sortie en utilisant des algorithmes de traitement automatique du langage naturel proches du modèle GPT. Ces données ont ensuite été standardisées à l’aide des systèmes de codage SNOMED CT pour les tests de laboratoire et ATC pour les médicaments, afin de les intégrer aux données structurées et faciliter leur analyse.</div></div><div><h3>Résultats</h3><div>Les algorithmes ont été testés et validés sur un échantillon de 103 résumés de sortie annotés manuellement. L’extraction d’entités d’intérêt a montré un score F1 de 0,72 IC95 [0,64–0,80] pour les tests de laboratoire et de 0,86 [0,80 ; 0,90] pour les médicaments. Ces algorithmes ont été appliqués à un ensemble de 18 604 dossiers médicaux électroniques, avec une importante augmentation de la détection des marqueurs diagnostiques et des traitements par rapport à l’analyse des données structurées seules. Par exemple, dans la cohorte lupus, la détection de la positivité des anticorps antinucléaires chez les patients a augmenté de 53,6 % (en valeur absolue) et la détection des patients sous hydroxychloroquine a augmenté de 63,4 % ; de même, dans la cohorte syndrome des antiphospholipides, le nombre de patients traités par anti-vitamine K était 41 % plus élevé avec cette méthode. La précision des algorithmes a été vérifiée manuellement sur un échantillon de 240 entités prédites, avec une précision de 0,97 pour les tests de laboratoire et de 1,0 pour les médicaments, confirmant la fiabilité des algorithmes développés. Le code source des algorithmes est disponible en accès libre.</div></div><div><h3>Conclusion</h3><div>Cette étude démontre que l’extraction automatique des informations contenues dans les résumés de sortie hospitalière permet d’enrichir les données structurées des dossiers médicaux électroniques et de mieux caractériser les patients dans les analyses sur données de vie réelle. L’intégration de ces informations ouvre la voie à une meilleure compréhension et prise en charge des patients en améliorant notamment la qualité des analyses cliniques.</div></div>\",\"PeriodicalId\":54458,\"journal\":{\"name\":\"Revue De Medecine Interne\",\"volume\":\"45 \",\"pages\":\"Pages A387-A388\"},\"PeriodicalIF\":0.7000,\"publicationDate\":\"2024-11-27\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Revue De Medecine Interne\",\"FirstCategoryId\":\"3\",\"ListUrlMain\":\"https://www.sciencedirect.com/science/article/pii/S0248866324011676\",\"RegionNum\":4,\"RegionCategory\":\"医学\",\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"Q3\",\"JCRName\":\"MEDICINE, GENERAL & INTERNAL\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revue De Medecine Interne","FirstCategoryId":"3","ListUrlMain":"https://www.sciencedirect.com/science/article/pii/S0248866324011676","RegionNum":4,"RegionCategory":"医学","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q3","JCRName":"MEDICINE, GENERAL & INTERNAL","Score":null,"Total":0}
引用次数: 0

摘要

引言 在对计算机化病历中收集的医疗数据进行二次利用时,回顾性分析主要使用结构化数据(如 ICD10 编码、生物学数据等),但往往忽略了临床医生在医院报告中以自由文本记录的关键信息,而这些信息对于详细描述患者的特征及其疾病随时间的发展至关重要。本研究的目的是证明,通过直接利用医疗报告中的数据,可以从计算机记录中更好地描述免疫炎症性疾病患者的特征。特别是,我们试图证明,提取免疫介导的炎症性疾病患者的实验室检查和药物治疗结果可以丰富结构化信息,从而更全面、准确地描述患者的特征。我们从 AP-HP 数据库中收集了 2012 年至 2021 年期间住院患者的医疗记录,这些患者被诊断患有所研究的四种疾病中的一种,并且至少有一份报告。我们使用接近 GPT 模型的自动自然语言处理算法从出院摘要中提取了有关实验室检查和药物治疗的信息。然后使用 SNOMED CT 编码系统和 ATC 编码系统对这些数据进行了标准化处理,以便将其整合到结构化数据中,方便对其进行分析。在提取感兴趣的实体方面,实验室检查的 F1 得分为 0.72 IC95 [0.64-0.80],药物的 F1 得分为 0.86 [0.80; 0.90]。这些算法被应用于一组 18604 份电子病历,与单独分析结构化数据相比,诊断标记和治疗方法的检测率显著提高。例如,在狼疮队列中,检测到抗核抗体阳性的患者增加了 53.6%(绝对值),检测到使用羟氯喹的患者增加了 63.4%;同样,在抗磷脂综合征队列中,使用这种方法治疗抗维生素 K 的患者人数增加了 41%。算法的准确性在 240 个预测实体样本上进行了人工验证,实验室检查的准确性为 0.97,药物的准确性为 1.0,证实了所开发算法的可靠性。结论这项研究表明,自动提取出院摘要中包含的信息可用于丰富电子病历中的结构化数据,并在基于真实生活数据的分析中更好地描述患者的特征。这些信息的整合为更好地了解和管理病人铺平了道路,特别是通过提高临床分析的质量。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
Améliorer la caractérisation phénotypique des patients atteints de maladies inflammatoires à médiation immunitaire par l’analyse automatique des comptes-rendus hospitaliers

Introduction

Dans le contexte de l’utilisation secondaire des données issues du soins rassemblées dans le dossier patient informatisé, les analyses rétrospectives réalisées utilisent essentiellement les données structurées-tels que les codes CIM10, les données de biologies etc. mais ignorent souvent les informations clés consignées dans le texte libre par les cliniciens dans les comptes-rendus hospitaliers qui sont pourtant essentielles pour la caractérisation fine des patients et de l’évolution de leur maladie au cours du temps.
Cette étude vise à prouver qu’il est possible de mieux caractériser les patients atteints de maladies immuno-inflammatoires à partir de leurs dossiers informatisés en exploitant directement les données présentent dans les comptes-rendus médicaux. En particulier, nous avons cherché à démontrer que l’extraction des résultats de tests de laboratoire et des traitements médicamenteux chez des patients atteints de maladies inflammatoires à médiation immunitaire enrichit les informations structurées, permettant ainsi un profilage plus complet et précis des patients. Les quatre maladies ciblées étaient le lupus érythémateux disséminé, la sclérose systémique, le syndrome des antiphospholipides et l’artérite de Takayasu.

Matériels et méthodes

Nous avons collecté les dossiers médicaux de patients hospitalisés entre 2012 et 2021, diagnostiqués avec l’une des quatre maladies étudiées, avec au moins un compte-rendu disponible, à partir de la base de données de l’AP–HP. Les informations sur les tests de laboratoire et les traitements médicamenteux ont été extraites des résumés de sortie en utilisant des algorithmes de traitement automatique du langage naturel proches du modèle GPT. Ces données ont ensuite été standardisées à l’aide des systèmes de codage SNOMED CT pour les tests de laboratoire et ATC pour les médicaments, afin de les intégrer aux données structurées et faciliter leur analyse.

Résultats

Les algorithmes ont été testés et validés sur un échantillon de 103 résumés de sortie annotés manuellement. L’extraction d’entités d’intérêt a montré un score F1 de 0,72 IC95 [0,64–0,80] pour les tests de laboratoire et de 0,86 [0,80 ; 0,90] pour les médicaments. Ces algorithmes ont été appliqués à un ensemble de 18 604 dossiers médicaux électroniques, avec une importante augmentation de la détection des marqueurs diagnostiques et des traitements par rapport à l’analyse des données structurées seules. Par exemple, dans la cohorte lupus, la détection de la positivité des anticorps antinucléaires chez les patients a augmenté de 53,6 % (en valeur absolue) et la détection des patients sous hydroxychloroquine a augmenté de 63,4 % ; de même, dans la cohorte syndrome des antiphospholipides, le nombre de patients traités par anti-vitamine K était 41 % plus élevé avec cette méthode. La précision des algorithmes a été vérifiée manuellement sur un échantillon de 240 entités prédites, avec une précision de 0,97 pour les tests de laboratoire et de 1,0 pour les médicaments, confirmant la fiabilité des algorithmes développés. Le code source des algorithmes est disponible en accès libre.

Conclusion

Cette étude démontre que l’extraction automatique des informations contenues dans les résumés de sortie hospitalière permet d’enrichir les données structurées des dossiers médicaux électroniques et de mieux caractériser les patients dans les analyses sur données de vie réelle. L’intégration de ces informations ouvre la voie à une meilleure compréhension et prise en charge des patients en améliorant notamment la qualité des analyses cliniques.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
Revue De Medecine Interne
Revue De Medecine Interne 医学-医学:内科
CiteScore
0.70
自引率
11.10%
发文量
526
审稿时长
37 days
期刊介绍: Official journal of the SNFMI, La revue de medecine interne is indexed in the most prestigious databases. It is the most efficient French language journal available for internal medicine specialists who want to expand their knowledge and skills beyond their own discipline. It is also the main French language international medium for French research works. The journal publishes each month editorials, original articles, review articles, short communications, etc. These articles address the fundamental and innumerable facets of internal medicine, spanning all medical specialties. Manuscripts may be submitted in French or in English. La revue de medecine interne also includes additional issues publishing the proceedings of the two annual French meetings of internal medicine (June and December), as well as thematic issues.
期刊最新文献
Editorial board Étude comparative des cytopénies auto-immunes isolées ou dans le cadre d’un syndrome d’Evans au cours du lupus : à propos de 95 observations Caractéristiques et réponse thérapeutique de la maladie d’Erdheim-Chester associée à une néoplasie myéloïde, une étude observationnelle multicentrique Histiocytose langerhansienne extra pulmonaire de l’adulte associée à une leucémie myélomonocytaire chronique : étude descriptive et comparative Diagnostic d’haploinsuffisance en A20 chez des patients avec un diagnostic de lupus : revue systématique de la littérature
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1