{"title":"Approaches for text mining of mHealth literature.","authors":"Bunyamin Ozaydin, Ferhat Zengul, Nurettin Oner, Dursun Delen","doi":"10.21037/mhealth-22-1","DOIUrl":null,"url":null,"abstract":"","PeriodicalId":74181,"journal":{"name":"mHealth","volume":"8 1","pages":"11"},"PeriodicalIF":2.2000,"publicationDate":"2022-04-20","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9014235/pdf/","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"mHealth","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.21037/mhealth-22-1","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"2022/1/1 0:00:00","PubModel":"eCollection","JCR":"Q2","JCRName":"HEALTH CARE SCIENCES & SERVICES","Score":null,"Total":0}
引用次数: 0
移动医疗文献的文本挖掘方法。
mHealth©。版权所有。随着科学文献搜索变得越来越难以手动执行,就像他们在其他科学发现和改进领域所做的那样,计算机也在帮助我们自动化这项任务。移动健康是一个相对年轻的研究领域,科学文献生产率加快,特别是自2010年代中期以来(1)。2017年,我们利用文本挖掘技术捕获了术语、移动健康文献集群的时间依赖性,以及它们的趋势分析(2)。2019年,Hyejin Park和Min Sook Park发表了一篇论文,该论文使用文本挖掘技术专门研究医疗条件、干预措施、并研究人群和医疗状况与干预措施类别和研究人群的关系(3)。在本文中,我们讨论了这两项研究的方法和结果,以及未来的工作如何根据我们的经验、其他使用文本挖掘来调查文献的文献、以及用于文献综述的文本挖掘方法的演变,来改进文本挖掘的使用,以捕捉移动健康研究的趋势。文献文本挖掘的最初步骤之一是搜索数据库,以识别尽可能多的相关出版物(建立语料库)。这是任何文献调查研究的重要步骤;然而,对于文本挖掘研究来说尤其重要的是,与手工查阅文献相比,因为当有更大的数据时,文本挖掘方法更准确。当这项工作是针对一个相对较年轻的领域进行的,在这个领域中,研究传播的时间较少,并且该领域并不严格局限于一个学科,那么在解释结果时,搜索更多数据库的影响更为显著。移动医疗是一个相对年轻的研究领域,也是一个跨学科的研究领域。此外,科学文献数据库可能会明确或隐含地偏向于某一学科,而不是另一学科,它们对期刊的覆盖也并非包罗万象(4)。因此,尽管Web of Science和Scopus等数据库被认为比PubMed和IEEE Xplore等数据库更具跨学科性,但与使用单一跨学科数据库相比,合并来自多个数据库的文章会显著影响结果的解释(5,6)。当然,包含来自多个数据库的文章引入了检索重复引用的问题;然而,大多数引文管理工具相对容易地帮助处理重复记录问题。在这些工具的功能不够的情况下,我们在早期的工作中描述了手动删除重复的方法(2)。在数据库搜索方面,搜索词的使用和出版物类型的包含是其他重要的考虑因素。我们认为,在文本挖掘出版物中提供确定搜索词的详细信息,对于作者建立最终搜索字符串的过程的再现性和清晰度非常重要。例如,在移动健康文献调查中应该考虑包括一些会议出版物,因为与移动健康研究相关的计算机科学等学科与其他学科相比,会议出版物的价值相对更高。与详细解释建立语料库的搜索过程类似,详细解释通过标记、措辞和术语来管理术语列表的过程对于再现性的目的也很重要。最后,发布文章列表和用于分析的最终语料库,以配合手稿将改进编辑
本文章由计算机程序翻译,如有差异,请以英文原文为准。