{"title":"Inverse QSAR Study Using Evolutionary Algorithm","authors":"K. Hasegawa, Toshiro Kimura, K. Funatsu","doi":"10.2751/JCAC.10.10","DOIUrl":null,"url":null,"abstract":"定量的構造―活性相関 (Quantitative Structure-Activity Relationship: QSAR) は、古くから行われており、成功例も多い。しかしながら、予測精度の高いモデルを構築すると、逆にモデルの解釈が難しくなり、設計が困難な場合が多い。そこで、任意の構造をコンピュータで発生させて、モデルの予測値が高い構造だけを自動発生するQSAR逆設計のシステムを構築した。システムのコアとなる構造発生部分については、EA-Inventor (Evolutionary Algorithm-Inventor) を利用した。 SMILEで表記した初期構造を入力すると、交差、変異などの操作で新たな構造を生成する。発生した構造をQSARモデルで予測して、予測値をスコアとして返す。スコアが高い構造は残して、さらに、新たな構造を生成する。このような操作を複数回繰り返して、高いスコアを持つ構造が十分そろったら終了する。EA-Inventorを文献のトリプシン阻害剤データに適用した。スコアに利用するQSARモデルとして、CoMFA (comparative molecular field analysis) を採用した。学習セットと大きく異なる構造が発生した場合には、高いペナルティー値を加え、発生構造が学習セットから大きく逸脱しないように工夫をした。出力された構造は、トリプシンの構造と高い相補性を持っており、高い阻害活性が期待できる。今回は、阻害活性のQSARモデルの応用であるが、これに、ADME (absorption, distribution, metabolism, excretion) モデルや合成の難易度を加えることもできるので、より実用的な薬物設計が可能である。","PeriodicalId":41457,"journal":{"name":"Journal of Computer Aided Chemistry","volume":"71 1","pages":"10-15"},"PeriodicalIF":0.0000,"publicationDate":"2009-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"4","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Journal of Computer Aided Chemistry","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.2751/JCAC.10.10","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 4
基于进化算法的QSAR逆研究
定量结构-活性相关(Quantitative Structure-Activity Relationship, QSAR)自古以来就很流行,成功的例子也很多。但是,如果构建了预测精度高的模型,反而很难解释模型,很多情况下设计也很困难。因此,我们构建了QSAR逆设计系统,即让计算机产生任意结构,只自动产生模型预测值高的结构。作为系统核心的构造发生部分,利用了EA-Inventor (Evolutionary Algorithm-Inventor)。输入用SMILE标记的初始结构后,通过交叉、变异等操作生成新的结构。用QSAR模型预测发生的结构,将预测值作为得分返回。留下得分高的结构,进而生成新的结构。重复多次这样的操作,当具备足够多的高分数结构时就结束了。将EA-Inventor应用于文献中的胰蛋白酶抑制剂数据。作为用于得分的QSAR模型,采用了CoMFA (comparative molecular field analysis)。当发生与学习集有很大差异的结构时,施加较高的惩罚值,并设法避免发生结构大幅偏离学习集。输出的结构与胰蛋白酶的结构具有高度的互补性,具有很高的抑制活性。这次是抑制活性的QSAR模型的应用,其中包括ADME (absorption, distribution, metabolism,excretion)模型和合成的难易度也可以加入,因此更实用的药物设计是可能的。
本文章由计算机程序翻译,如有差异,请以英文原文为准。