薬剤とたんぱく質の相互作用を深層学習で予測―新たな手法で高速・高精度の予測、相互作用部位を可視化:産業技術総合研究所ほか
(2018年8月29日発表)
(国)産業技術総合研究所の共同研究グループは、2種類の深層ニューラルネットを組み合わせて薬剤とたんぱく質の相互作用を高速で高精度に予測する手法を開発したことを、8月29日に発表した。この技術により新薬剤開発の加速が期待され、革新的な新薬の開発も期待される。
近年、大きな成功を収めている深層学習を化学・生物学分野へ応用することが期待されている。例えば、薬剤とたんぱく質の相互作用が深層学習によって高速で高精度に予測できれば、新薬開発に役立つだけではなく、人の知識や経験だけでは到達できない革新的な薬剤の開発が期待される。しかし薬剤とたんぱく質は、それぞれ異なるタイプの構造であるため、深層学習でどのように統一的に扱うかが課題であった。
薬剤は原子と結合の情報を含んだグラフ構造データとして表現でき、たんぱく質は一列に並んだアミノ酸の配列情報から配列構造データとして表現できる。今回開発した手法では、これらの異なる2種類のデータを共通して取り扱うために、薬剤のデータに適した深層学習手法と、たんぱく質のデータに適した深層学習手法をそれぞれに適用して、薬剤とたんぱく質の性質を適切に捉える特徴ベクトル(データの特徴や性質を一連の数値列で表したもの)を計算した。
すると、薬剤とたんぱく質の大規模なデータを用いてこの特徴ベクトルを学習し、3万5千以上の薬剤とたんぱく質の相互作用のデータを用いた実証評価実験により、相互作用の有無を高速で適切に予測することが高い精度で実現できた。
今回の手法は、立体構造がまだ分かっていないたんぱく質についても適用可能である。
こうした2つの特徴ベクトルを用いて、薬剤が相互作用し易いたんぱく質の部位の予測も行い、その結果を可視化し、化学・生物学の知識と照らし合わせての検証を容易にした。これにより予測結果の解釈が可能になり、応用し易くなることが期待される。
今後は、薬剤やたんぱく質の三次元立体構造をより詳細に考慮した手法を開発し、さまざまな薬剤とたんぱく質を用いて、予測結果の信頼性を高めていき、創薬分野への貢献を目指す。