Text Mining Method in the Field of Health

IF 0.3 Q3 MEDICINE, GENERAL & INTERNAL Konuralp Tip Dergisi Pub Date : 2020-06-04 DOI:10.18521/ktd.700789
S. Toplu, Ş. Cangür
{"title":"Text Mining Method in the Field of Health","authors":"S. Toplu, Ş. Cangür","doi":"10.18521/ktd.700789","DOIUrl":null,"url":null,"abstract":"Amac: Metinsel verileri sayisal hale getirerek veri madenciligi algoritmalarina uygulanmasini saglayan metin madenciligi, gunumuz dunyasinda onemli bir yere sahiptir. Bu calismanin amaci, metin madenciligi yontemini tanitmak ve saglik alaninda belirlenen bir konuda uygulamasini gostermektir. Gerec ve Yontem: Calismanin uygulama asamasinda; insan-ve-kanser” ve fare- ve-kanser” seklinde belirlenen iki farkli konu basligi altinda en sik kullanilan Pubmed veritabanindan ayri ayri elde edilen dokumanlara ve daha sonra birlestirilmis dokumanlara Knime programi araciligiyla metin madenciligi yontemi uygulanmis ve K nearest neighbor (K-NN) algoritmasi kullanilarak dokuman siniflamasi yapilmistir. Bulgular: Etiket bulut grafiklerinde one cikan kelimeler “cell” (hucre) ve “cancer” (kanser) kelimeleridir. Her iki dokumanda frekans degeri yuksek cikan “cell”, “cancer”, “tumor”, “patient” gibi kelimelerin veriler birlestirildikten sonra yapilan analizde de yuksek oranla ciktigi gozlenmistir. 600 adet test dokumaninin 255 tanesi insan-ve-kanser sinifina, geri kalaninin ise fare-ve-kanser sinifina ait olduklari; F olcutune gore insan-ve-kanser dokumanlari icin %56,6’lik, fare-ve-kanser dokumanlari icin ise %62,6’lik dogru siniflandirilma yuzdesi tespit edilmistir. K-NN algoritmasi ile %59,8 oraninda kismen basarili bir dokuman siniflama tahmini yapildigi ancak Cohen kappa degerinin %19,7 oldugu ve bu uyumun zayif duzeyde oldugu belirlenmistir. Sonuc: Dijital ve basili dokumanlarin sayisinin oldukca fazla oldugu saglik alaninda hizli ve guvenilir bir sekilde bilgi elde edebilmek icin metin madenciligi yonteminden yararlanilmasi ve kullaniminin yayginlastirilmasi onerilmektedir.","PeriodicalId":17884,"journal":{"name":"Konuralp Tip Dergisi","volume":"12 1","pages":"236-246"},"PeriodicalIF":0.3000,"publicationDate":"2020-06-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Konuralp Tip Dergisi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.18521/ktd.700789","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q3","JCRName":"MEDICINE, GENERAL & INTERNAL","Score":null,"Total":0}
引用次数: 1

Abstract

Amac: Metinsel verileri sayisal hale getirerek veri madenciligi algoritmalarina uygulanmasini saglayan metin madenciligi, gunumuz dunyasinda onemli bir yere sahiptir. Bu calismanin amaci, metin madenciligi yontemini tanitmak ve saglik alaninda belirlenen bir konuda uygulamasini gostermektir. Gerec ve Yontem: Calismanin uygulama asamasinda; insan-ve-kanser” ve fare- ve-kanser” seklinde belirlenen iki farkli konu basligi altinda en sik kullanilan Pubmed veritabanindan ayri ayri elde edilen dokumanlara ve daha sonra birlestirilmis dokumanlara Knime programi araciligiyla metin madenciligi yontemi uygulanmis ve K nearest neighbor (K-NN) algoritmasi kullanilarak dokuman siniflamasi yapilmistir. Bulgular: Etiket bulut grafiklerinde one cikan kelimeler “cell” (hucre) ve “cancer” (kanser) kelimeleridir. Her iki dokumanda frekans degeri yuksek cikan “cell”, “cancer”, “tumor”, “patient” gibi kelimelerin veriler birlestirildikten sonra yapilan analizde de yuksek oranla ciktigi gozlenmistir. 600 adet test dokumaninin 255 tanesi insan-ve-kanser sinifina, geri kalaninin ise fare-ve-kanser sinifina ait olduklari; F olcutune gore insan-ve-kanser dokumanlari icin %56,6’lik, fare-ve-kanser dokumanlari icin ise %62,6’lik dogru siniflandirilma yuzdesi tespit edilmistir. K-NN algoritmasi ile %59,8 oraninda kismen basarili bir dokuman siniflama tahmini yapildigi ancak Cohen kappa degerinin %19,7 oldugu ve bu uyumun zayif duzeyde oldugu belirlenmistir. Sonuc: Dijital ve basili dokumanlarin sayisinin oldukca fazla oldugu saglik alaninda hizli ve guvenilir bir sekilde bilgi elde edebilmek icin metin madenciligi yonteminden yararlanilmasi ve kullaniminin yayginlastirilmasi onerilmektedir.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
健康领域的文本挖掘方法
Amac:在我国,阻止数据挖掘算法应用计算纺织品数据的文本挖掘包含一个小数位。这种钙的用途决定了文本的完整性和在健康领域的应用。Gerec和Yontem:在Calisman的主要应用中;在“ve fare-ve kanser”seklinde belirlenen iki farkli konu basligi altinda en sik kullanilan Pubmed veritabanin和ayri ayri elde edilen dokumanlara ve daha sonra birlestirilmis dokumanara Knime programi araciligiyla metin madenciligi yontemi vigulanmis ve K最近邻(K-NN)算法的基础上。项目符号:在云图形中,一个小单词是“细胞”(hucre)和“癌症”(癌症)。在这两份文件中,高血细胞、癌症、肿瘤、患者的频率下降,以及在收集数据后产生的高血液率分析。600份检测文件有255个人类和癌症分类,其余属于小鼠和癌症分类;在F中,检测到56.6%的人类和癌症文件,同时检测到62.6%的正确同步率。K-NN算法预测的负面文档类别为59.8%,但Cohen是Kappa退化的19.7%,这被发现是弱的。因此,数字和基础文档在卫生领域的数量要高效和可靠得多,可以获得有关文本挖掘内容的信息并得到广泛使用。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
Konuralp Tip Dergisi
Konuralp Tip Dergisi MEDICINE, GENERAL & INTERNAL-
自引率
0.00%
发文量
62
期刊最新文献
Obstrüktif Uyku Apnede (OUA) Ortalama Trombosit Hacmi (OTH) ve OUA'da Sürekli Pozitif Hava Yolu Basıncı (CPAP) Tedavisinin OTH Üzerine Etkisi A Quasi-Experimental Controlled Educational Intervention for Mothers To Reduce Unnecessary Emergency Department Admissions in Children with Respiratory Tract Infection Symptoms Evaluation of Serum Annexin A1 Values in Patients with Inflammatory Bowel Diseases Turkish Adaptation and Psychometric Properties of Nıjmegen Gender Awareness in Medicine Scale: Assessment of Validity and Relıability Prematür Ejakülasyon Tanılı Bireylerde Karar Verme ve Dürtüselliğin Değerlendirilmesi
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1