日本人のゲノムで最も精度の高いデータベースへ ~全ゲノム解析情報を8.3千人分に拡充(8.3KJPN)~

ToMMoは公開データベース、日本人多層オミックス参照パネル(jMorp:Japanese Multi Omics Reference Panel)の収載データを2020年8月に大幅に拡充しました。今回収載されたデータのうち、全ゲノム解析情報ではこれまでの4.7千人分から8.3千人分にまで拡充され、全ゲノムリファレンスパネル8.3KJPNを構築、公開しています。これによりToMMo発足当初より目標としてきた8千人分の全ゲノム解析を完了したことになります。

今回拡充された全ゲノムリファレンスパネルとは数千人規模の全ゲノム解析を行い、一塩基バリアント(Single Nucleotide Variant:SNV)、INDEL(挿入(insertion, IN)・欠失(deletion, DEL))の頻度情報、アレル頻度情報などをまとめたものを指します。例えば、特定の疾患の要因を探るために遺伝子解析を行う場合に、その疾患の患者さんから得られた検体の全エクソン解析(WES:Whole exome sequence、ゲノムのうち、タンパク質をコードしている部分のほぼ全部を解析すること)などを行うことがあります。その解析で得られるSNVは数万~十万以上におよび、その膨大な数が疾患原因と関連する候補となります。しかしながら、実際には数万~十万以上の候補のほとんど(あるいはすべて)が、対象の疾患と直接関係がないバリアントであろうことが想定されます。そのような場合に、全ゲノムリファレンスパネル8.3KJPNのような一般住民を対象とした大規模データベースを利用することで、候補の絞り込みができるのです。
実際に未診断疾患イニシアチブ(IRUD)の取り組みなどで活用されています。一般人集団である程度以上の頻度でみられるバリアントは稀な病気と関連する可能性は低いと推定されます。全ゲノムリファレンスパネルを利用することで、特定の疾患における数万の原因バリアント候補のうち、例えば頻度1%以上など集団である程度見られるバリアントを候補から外すことが可能になり、その結果、希少疾患のような今まで原因の解明が困難だった疾患の解決の糸口となりうるのです。

図:8.3KJPNを利用したバリアントの絞り込み例

今回公開された8.3KJPNは、8千人以上に大幅に拡充され、また外部のコホ ート研究との連携により東日本・西日本両方からの協力者が含まれるため、日本人として代表性の高いゲノム情報となっています。本公開により日本人が持つアレル頻度0.01%以上のSNVをほぼ網羅することができ、8.3KJPNは日本人のゲノムデータを有するデータベースとして一番網羅性の高いゲノム情報となりました。より高精度での解析が可能となったことで、今後より一層の利活用が期待されます。

詳しくはプレスリリースをご覧ください。

関連リンク

(2020年12月21日)