Using Fuzzy Logic to Solve Bioinformatics Tasks

Sci. J. Riga Tech. Univ. Ser. Comput. Sci. Pub Date : 1900-01-01 DOI:10.2478/v10143-010-0049-z

Madara Gasparovica, N. Novoselova, L. Aleksejeva

{"title":"Using Fuzzy Logic to Solve Bioinformatics Tasks","authors":"Madara Gasparovica, N. Novoselova, L. Aleksejeva","doi":"10.2478/v10143-010-0049-z","DOIUrl":null,"url":null,"abstract":"Using Fuzzy Logic to Solve Bioinformatics Tasks The goal of this research is to investigate, collect and identify published methods that use fuzzy techniques in bioinformatics tasks. Special attention is paid to studying how the advantages of fuzzy techniques are used in various stages like preprocessing, optimization and building a classifier of classification task as difficult as processing microarray data. This article also inspects the most popular databases used in bioinformatics. The most perspective methods are given more detailed descriptions. Conclusions are made about working abilities of the algorithms and their use in further research. Izplūdušās logikas pielietošana bioinformātikas uzdevumu risināšanā Šajā darbā tika apskatītas dažādas izplūdušās logikas pielietošanas iespējas bioinformātikas jomā, apkopojot un pētot publicētās metodes. Tika uzskaitītas katras metodes priekšrocības un galvenie sasniegumi, kā arī izvirzīti kritēriji, pēc kuriem vērtēt visas metodes - minimāls izmantoto gēnu skaits, minimāls iegūto likumu skaits un tai pat laikā maksimāla klasifikācijas precizitāte. Aplūkotās metodes nosacīti iespējams iedalīt trīs grupās: 1) metodes, kas izplūdumu lieto datu pirmapstrādes posmā, bet pēc tam pielieto citu klasifikācijas algoritmu; 2) metodes, kas meklē attiecības starp gēniem; 3) metodes, kas izmanto izplūdušo logiku klasifikācijas posmā. Iegūti rezultāti apkopoti tabulā, no kuras iespējams secināt, ka tieši pēdējās grupasmetodes - izplūdušās logikas pielietošana klasifikācijas posmā - uzrāda vislabākos rezultātus. Tāpat tika apkopotas biežāk izmantojamās bioinformātikas datu kopas, kas izmantotas dažādu klasifikācijas metožu un algoritmu pārbaudei, tādējādi noskaidrojot piecas populārākās, ko būtu vērts izmantot jebkuros pētījumos. Literatūrā jau atrodami dažādi rezultāti ar šīm kopām, un tādējādi vieglāk pamatot algoritma iespējas un rezultāta uzlabojumus, neieslīgstot sīkā datu kopu aprakstā. Pētījuma rezultātā apkopotas izplūdušo tehniku priekšrocības un galvenais pluss-intuitīvi viegli uztverams klasificēšanas process, ko viegli uztvert katram cilvēkam jo tas darbojas ar \"Ja - Tad\" izplūdušajiem likumiem, kas ir tuvāki reālajai, ikdienā lietojamai valodai. Kā arī biologiem, kam ar šiem datiem tālāk jāstrādā, tos ir ērti interpretēt, viņi var uztvert visu klasifikācijas procesu un izsekot likumsakarībām un tās salīdzināt ar notiekošo šūnās. Šajā darbā pierādītas izplūdušometožu balstītās pieejas izmantošanas priekšrocības un perspektīvas lietot totālākos pētījumos. Doti arī tālākie iespējamie pētījuma attīstības virzieni. Применение нечёткой логики для решения задач биоинформатики В данной работе рассматриваются различные возможности применения нечёткой логики в области биоинформатики, обобщая и изучая уже опубликованные методы. Учитываются основные достижения и преимущества каждого метода, а также выдвигаются критерии для оценки всех методов - минимальное число используемых генов, минимальное число полученных правил и, в то же время, максимальная точность классификации. Рассмотренные методы можно условно разделить на три группы 1) методы, которые используют нечёткость на этапе предобработки, но потом используют другой алгоритм классификации; 2) методы, которые ищут соотношения между генами; 3) методы, которые используют нечёткую логику на этапе классификации. Полученные результаты сведены в таблицу, на основе которой можно сделать вывод, что только последние методы - использование нечёткой логики на этапе классификации - показывают наилучшие результаты. Также приводится информация о наиболее популярных базах данных в области биоинформатики, которые используются для проверки работы разных классификационных методов и алгоритмов. В результате поясняется выбор пяти самых популярных баз, которые целесообразно использовать в любых исследованиях. В имеющихся публикациях уже доступны разные результаты с использованием этих баз, и потому проще показать возможности алгоритма и улучшение результатов, не углубляясь в подробное описание базы данных. В заключение приводятся преимущества нечётких подходов и основное достоинство - процесс принятия решений. Каждый человек может легко интуитивно произвести процесс классификации, так как там работают правила -если - то -, которые приближены к реальному разговорному языку. Биологам, которым в дальнейшем придется работать с этими данными, также легко их интерпретировать. Они могут произвести весь процесс классификации, проследить за взаимосвязями и сравнить их с тем, что происходит в клетках. В данной работе показаны преимущества использования подхода, основанного на нечётких правилах, и перспективы его применения в дальнейших исследованиях. Приводятся также дальнейшие возможные направления развития исследований.","PeriodicalId":211660,"journal":{"name":"Sci. J. Riga Tech. Univ. Ser. Comput. Sci.","volume":"79 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"1900-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"3","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Sci. J. Riga Tech. Univ. Ser. Comput. Sci.","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.2478/v10143-010-0049-z","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 3

Abstract

Using Fuzzy Logic to Solve Bioinformatics Tasks The goal of this research is to investigate, collect and identify published methods that use fuzzy techniques in bioinformatics tasks. Special attention is paid to studying how the advantages of fuzzy techniques are used in various stages like preprocessing, optimization and building a classifier of classification task as difficult as processing microarray data. This article also inspects the most popular databases used in bioinformatics. The most perspective methods are given more detailed descriptions. Conclusions are made about working abilities of the algorithms and their use in further research. Izplūdušās logikas pielietošana bioinformātikas uzdevumu risināšanā Šajā darbā tika apskatītas dažādas izplūdušās logikas pielietošanas iespējas bioinformātikas jomā, apkopojot un pētot publicētās metodes. Tika uzskaitītas katras metodes priekšrocības un galvenie sasniegumi, kā arī izvirzīti kritēriji, pēc kuriem vērtēt visas metodes - minimāls izmantoto gēnu skaits, minimāls iegūto likumu skaits un tai pat laikā maksimāla klasifikācijas precizitāte. Aplūkotās metodes nosacīti iespējams iedalīt trīs grupās: 1) metodes, kas izplūdumu lieto datu pirmapstrādes posmā, bet pēc tam pielieto citu klasifikācijas algoritmu; 2) metodes, kas meklē attiecības starp gēniem; 3) metodes, kas izmanto izplūdušo logiku klasifikācijas posmā. Iegūti rezultāti apkopoti tabulā, no kuras iespējams secināt, ka tieši pēdējās grupasmetodes - izplūdušās logikas pielietošana klasifikācijas posmā - uzrāda vislabākos rezultātus. Tāpat tika apkopotas biežāk izmantojamās bioinformātikas datu kopas, kas izmantotas dažādu klasifikācijas metožu un algoritmu pārbaudei, tādējādi noskaidrojot piecas populārākās, ko būtu vērts izmantot jebkuros pētījumos. Literatūrā jau atrodami dažādi rezultāti ar šīm kopām, un tādējādi vieglāk pamatot algoritma iespējas un rezultāta uzlabojumus, neieslīgstot sīkā datu kopu aprakstā. Pētījuma rezultātā apkopotas izplūdušo tehniku priekšrocības un galvenais pluss-intuitīvi viegli uztverams klasificēšanas process, ko viegli uztvert katram cilvēkam jo tas darbojas ar "Ja - Tad" izplūdušajiem likumiem, kas ir tuvāki reālajai, ikdienā lietojamai valodai. Kā arī biologiem, kam ar šiem datiem tālāk jāstrādā, tos ir ērti interpretēt, viņi var uztvert visu klasifikācijas procesu un izsekot likumsakarībām un tās salīdzināt ar notiekošo šūnās. Šajā darbā pierādītas izplūdušometožu balstītās pieejas izmantošanas priekšrocības un perspektīvas lietot totālākos pētījumos. Doti arī tālākie iespējamie pētījuma attīstības virzieni. Применение нечёткой логики для решения задач биоинформатики В данной работе рассматриваются различные возможности применения нечёткой логики в области биоинформатики, обобщая и изучая уже опубликованные методы. Учитываются основные достижения и преимущества каждого метода, а также выдвигаются критерии для оценки всех методов - минимальное число используемых генов, минимальное число полученных правил и, в то же время, максимальная точность классификации. Рассмотренные методы можно условно разделить на три группы 1) методы, которые используют нечёткость на этапе предобработки, но потом используют другой алгоритм классификации; 2) методы, которые ищут соотношения между генами; 3) методы, которые используют нечёткую логику на этапе классификации. Полученные результаты сведены в таблицу, на основе которой можно сделать вывод, что только последние методы - использование нечёткой логики на этапе классификации - показывают наилучшие результаты. Также приводится информация о наиболее популярных базах данных в области биоинформатики, которые используются для проверки работы разных классификационных методов и алгоритмов. В результате поясняется выбор пяти самых популярных баз, которые целесообразно использовать в любых исследованиях. В имеющихся публикациях уже доступны разные результаты с использованием этих баз, и потому проще показать возможности алгоритма и улучшение результатов, не углубляясь в подробное описание базы данных. В заключение приводятся преимущества нечётких подходов и основное достоинство - процесс принятия решений. Каждый человек может легко интуитивно произвести процесс классификации, так как там работают правила -если - то -, которые приближены к реальному разговорному языку. Биологам, которым в дальнейшем придется работать с этими данными, также легко их интерпретировать. Они могут произвести весь процесс классификации, проследить за взаимосвязями и сравнить их с тем, что происходит в клетках. В данной работе показаны преимущества использования подхода, основанного на нечётких правилах, и перспективы его применения в дальнейших исследованиях. Приводятся также дальнейшие возможные направления развития исследований.

查看原文