Using Fuzzy Logic to Solve Bioinformatics Tasks

Madara Gasparovica, N. Novoselova, L. Aleksejeva
{"title":"Using Fuzzy Logic to Solve Bioinformatics Tasks","authors":"Madara Gasparovica, N. Novoselova, L. Aleksejeva","doi":"10.2478/v10143-010-0049-z","DOIUrl":null,"url":null,"abstract":"Using Fuzzy Logic to Solve Bioinformatics Tasks The goal of this research is to investigate, collect and identify published methods that use fuzzy techniques in bioinformatics tasks. Special attention is paid to studying how the advantages of fuzzy techniques are used in various stages like preprocessing, optimization and building a classifier of classification task as difficult as processing microarray data. This article also inspects the most popular databases used in bioinformatics. The most perspective methods are given more detailed descriptions. Conclusions are made about working abilities of the algorithms and their use in further research. Izplūdušās logikas pielietošana bioinformātikas uzdevumu risināšanā Šajā darbā tika apskatītas dažādas izplūdušās logikas pielietošanas iespējas bioinformātikas jomā, apkopojot un pētot publicētās metodes. Tika uzskaitītas katras metodes priekšrocības un galvenie sasniegumi, kā arī izvirzīti kritēriji, pēc kuriem vērtēt visas metodes - minimāls izmantoto gēnu skaits, minimāls iegūto likumu skaits un tai pat laikā maksimāla klasifikācijas precizitāte. Aplūkotās metodes nosacīti iespējams iedalīt trīs grupās: 1) metodes, kas izplūdumu lieto datu pirmapstrādes posmā, bet pēc tam pielieto citu klasifikācijas algoritmu; 2) metodes, kas meklē attiecības starp gēniem; 3) metodes, kas izmanto izplūdušo logiku klasifikācijas posmā. Iegūti rezultāti apkopoti tabulā, no kuras iespējams secināt, ka tieši pēdējās grupasmetodes - izplūdušās logikas pielietošana klasifikācijas posmā - uzrāda vislabākos rezultātus. Tāpat tika apkopotas biežāk izmantojamās bioinformātikas datu kopas, kas izmantotas dažādu klasifikācijas metožu un algoritmu pārbaudei, tādējādi noskaidrojot piecas populārākās, ko būtu vērts izmantot jebkuros pētījumos. Literatūrā jau atrodami dažādi rezultāti ar šīm kopām, un tādējādi vieglāk pamatot algoritma iespējas un rezultāta uzlabojumus, neieslīgstot sīkā datu kopu aprakstā. Pētījuma rezultātā apkopotas izplūdušo tehniku priekšrocības un galvenais pluss-intuitīvi viegli uztverams klasificēšanas process, ko viegli uztvert katram cilvēkam jo tas darbojas ar \"Ja - Tad\" izplūdušajiem likumiem, kas ir tuvāki reālajai, ikdienā lietojamai valodai. Kā arī biologiem, kam ar šiem datiem tālāk jāstrādā, tos ir ērti interpretēt, viņi var uztvert visu klasifikācijas procesu un izsekot likumsakarībām un tās salīdzināt ar notiekošo šūnās. Šajā darbā pierādītas izplūdušometožu balstītās pieejas izmantošanas priekšrocības un perspektīvas lietot totālākos pētījumos. Doti arī tālākie iespējamie pētījuma attīstības virzieni. Применение нечёткой логики для решения задач биоинформатики В данной работе рассматриваются различные возможности применения нечёткой логики в области биоинформатики, обобщая и изучая уже опубликованные методы. Учитываются основные достижения и преимущества каждого метода, а также выдвигаются критерии для оценки всех методов - минимальное число используемых генов, минимальное число полученных правил и, в то же время, максимальная точность классификации. Рассмотренные методы можно условно разделить на три группы 1) методы, которые используют нечёткость на этапе предобработки, но потом используют другой алгоритм классификации; 2) методы, которые ищут соотношения между генами; 3) методы, которые используют нечёткую логику на этапе классификации. Полученные результаты сведены в таблицу, на основе которой можно сделать вывод, что только последние методы - использование нечёткой логики на этапе классификации - показывают наилучшие результаты. Также приводится информация о наиболее популярных базах данных в области биоинформатики, которые используются для проверки работы разных классификационных методов и алгоритмов. В результате поясняется выбор пяти самых популярных баз, которые целесообразно использовать в любых исследованиях. В имеющихся публикациях уже доступны разные результаты с использованием этих баз, и потому проще показать возможности алгоритма и улучшение результатов, не углубляясь в подробное описание базы данных. В заключение приводятся преимущества нечётких подходов и основное достоинство - процесс принятия решений. Каждый человек может легко интуитивно произвести процесс классификации, так как там работают правила -если - то -, которые приближены к реальному разговорному языку. Биологам, которым в дальнейшем придется работать с этими данными, также легко их интерпретировать. Они могут произвести весь процесс классификации, проследить за взаимосвязями и сравнить их с тем, что происходит в клетках. В данной работе показаны преимущества использования подхода, основанного на нечётких правилах, и перспективы его применения в дальнейших исследованиях. Приводятся также дальнейшие возможные направления развития исследований.","PeriodicalId":211660,"journal":{"name":"Sci. J. Riga Tech. Univ. Ser. Comput. Sci.","volume":"79 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"1900-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"3","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Sci. J. Riga Tech. Univ. Ser. Comput. Sci.","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.2478/v10143-010-0049-z","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 3

Abstract

Using Fuzzy Logic to Solve Bioinformatics Tasks The goal of this research is to investigate, collect and identify published methods that use fuzzy techniques in bioinformatics tasks. Special attention is paid to studying how the advantages of fuzzy techniques are used in various stages like preprocessing, optimization and building a classifier of classification task as difficult as processing microarray data. This article also inspects the most popular databases used in bioinformatics. The most perspective methods are given more detailed descriptions. Conclusions are made about working abilities of the algorithms and their use in further research. Izplūdušās logikas pielietošana bioinformātikas uzdevumu risināšanā Šajā darbā tika apskatītas dažādas izplūdušās logikas pielietošanas iespējas bioinformātikas jomā, apkopojot un pētot publicētās metodes. Tika uzskaitītas katras metodes priekšrocības un galvenie sasniegumi, kā arī izvirzīti kritēriji, pēc kuriem vērtēt visas metodes - minimāls izmantoto gēnu skaits, minimāls iegūto likumu skaits un tai pat laikā maksimāla klasifikācijas precizitāte. Aplūkotās metodes nosacīti iespējams iedalīt trīs grupās: 1) metodes, kas izplūdumu lieto datu pirmapstrādes posmā, bet pēc tam pielieto citu klasifikācijas algoritmu; 2) metodes, kas meklē attiecības starp gēniem; 3) metodes, kas izmanto izplūdušo logiku klasifikācijas posmā. Iegūti rezultāti apkopoti tabulā, no kuras iespējams secināt, ka tieši pēdējās grupasmetodes - izplūdušās logikas pielietošana klasifikācijas posmā - uzrāda vislabākos rezultātus. Tāpat tika apkopotas biežāk izmantojamās bioinformātikas datu kopas, kas izmantotas dažādu klasifikācijas metožu un algoritmu pārbaudei, tādējādi noskaidrojot piecas populārākās, ko būtu vērts izmantot jebkuros pētījumos. Literatūrā jau atrodami dažādi rezultāti ar šīm kopām, un tādējādi vieglāk pamatot algoritma iespējas un rezultāta uzlabojumus, neieslīgstot sīkā datu kopu aprakstā. Pētījuma rezultātā apkopotas izplūdušo tehniku priekšrocības un galvenais pluss-intuitīvi viegli uztverams klasificēšanas process, ko viegli uztvert katram cilvēkam jo tas darbojas ar "Ja - Tad" izplūdušajiem likumiem, kas ir tuvāki reālajai, ikdienā lietojamai valodai. Kā arī biologiem, kam ar šiem datiem tālāk jāstrādā, tos ir ērti interpretēt, viņi var uztvert visu klasifikācijas procesu un izsekot likumsakarībām un tās salīdzināt ar notiekošo šūnās. Šajā darbā pierādītas izplūdušometožu balstītās pieejas izmantošanas priekšrocības un perspektīvas lietot totālākos pētījumos. Doti arī tālākie iespējamie pētījuma attīstības virzieni. Применение нечёткой логики для решения задач биоинформатики В данной работе рассматриваются различные возможности применения нечёткой логики в области биоинформатики, обобщая и изучая уже опубликованные методы. Учитываются основные достижения и преимущества каждого метода, а также выдвигаются критерии для оценки всех методов - минимальное число используемых генов, минимальное число полученных правил и, в то же время, максимальная точность классификации. Рассмотренные методы можно условно разделить на три группы 1) методы, которые используют нечёткость на этапе предобработки, но потом используют другой алгоритм классификации; 2) методы, которые ищут соотношения между генами; 3) методы, которые используют нечёткую логику на этапе классификации. Полученные результаты сведены в таблицу, на основе которой можно сделать вывод, что только последние методы - использование нечёткой логики на этапе классификации - показывают наилучшие результаты. Также приводится информация о наиболее популярных базах данных в области биоинформатики, которые используются для проверки работы разных классификационных методов и алгоритмов. В результате поясняется выбор пяти самых популярных баз, которые целесообразно использовать в любых исследованиях. В имеющихся публикациях уже доступны разные результаты с использованием этих баз, и потому проще показать возможности алгоритма и улучшение результатов, не углубляясь в подробное описание базы данных. В заключение приводятся преимущества нечётких подходов и основное достоинство - процесс принятия решений. Каждый человек может легко интуитивно произвести процесс классификации, так как там работают правила -если - то -, которые приближены к реальному разговорному языку. Биологам, которым в дальнейшем придется работать с этими данными, также легко их интерпретировать. Они могут произвести весь процесс классификации, проследить за взаимосвязями и сравнить их с тем, что происходит в клетках. В данной работе показаны преимущества использования подхода, основанного на нечётких правилах, и перспективы его применения в дальнейших исследованиях. Приводятся также дальнейшие возможные направления развития исследований.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
用模糊逻辑解决生物信息学任务
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
0
期刊最新文献
Inventory Management in Multi Echelon Supply Chain using Sample Average Approximation Hybridisation of Evolutionary Algorithms for Solving Multi-Objective Simulation Optimisation Problems Simulation-Based Analysis of Fitness Landscape in Optimisation Multi-Agent Geosimulation of Urban Dynamics within the V-Devs Framework The Baseline Configuration of Project Management Information System
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1