ゲノム配列推定(遺伝子型インピュテーション)にAIを応用

ToMMoではゲノム解析を推進するとともに、解析結果を利用したさまざまな応用研究を行っています。その中の一つが「遺伝子型インピュテーション」です。これは、50万~250万箇所程度の限られたゲノム解析結果から、約30億塩基の全ゲノム配列を推定するもので、いまだ高コストの全ゲノム解析に代わるものとして、数万人単位の解析結果を必要とするゲノムワイド関連解析や遺伝的な疾患発症リスクの予測等に利用されています。

遺伝子型インピュテーションを実施するには、全ゲノム解析情報の集合である参照パネルが必要となりますが、これは個人情報保護の観点から研究機関の間での共有が困難なため、参照パネルを持つ研究機関でしか全ゲノム推定情報は得られませんでした。
そこでToMMoの研究グループは参照パネルを使わず、個人識別が困難な数値パラメータ情報を用いた新たな遺伝子型インピュテーション手法RNN-IMP(Recurrent Neural Network – IMPutation)法を開発しました。

この数値パラメータを作成するにあたり人工知能(AI)技術、その中でも現在の中心技術である深層学習を活用しました。実はこれまでも古典的なAI技術による数値パラメータを用いた手法は提案されていたものの、参照パネルを用いた遺伝子型インピュテーションと比較して精度が大きく低下するという問題がありました。今回研究グループが、深層学習の中でも特に自然言語処理や音声認識、動画像解析で用いられている手法を用いて数値パラメータを作成したところ、参照パネルを用いた遺伝子型インピュテーションと同等の精度が得られることが分かりました。

RNN-IMP法により、多くの研究機関で高精度な遺伝子型インピュテーションが可能になると期待されます。
今後もToMMoは最新の手法を取り入れながら、さまざまなゲノム解析の開発に取り組んでいきます。

関連リンク

個人情報保護を尊重した高精度なゲノム配列推定法を実現! 深層学習を応用したこれまでにない手法【プレスリリース】

(2021年3月29日)