お知らせ
疾病原因探索の基盤となる 1000 人分の 全ゲノム配列の高精度解読を完了 ~1500 万個におよぶ新たな遺伝子多型を収集~【プレスリリース】
<成果のポイント>
東北大学東北メディカル・メガバンク機構(機構長:山本雅之、以下ToMMo)は、東北メディカル・メガバンク計画のコホート調査事業に参加した健常な日本人1000人分の全ゲノムを解読しました。遺伝的に均質性の高い集団から得られた1000人規模の高品質(1人あたりシークエンシング30回分の解読量。平均900億塩基)な全ゲノム解読を均質な精度(単独の施設・設備、単一の方式)で解読した世界初の成果です。さらに本解読の結果から、約1300万個の既知の遺伝子多型に加え、それを超える1500万個におよぶ新規の遺伝子多型を収集することに成功しました。
今後、ToMMoは、1000人分の全ゲノム解読結果の検証解析等を行い、幅広い医科学研究の基盤として活用されるよう、頻度情報や機能的意義の情報を検索しやすいデータベース(ToMMo全ゲノムリファレンスパネル)を構築します。
【背景】
国際コンソーシアム等が 2003 年にヒトゲノム解読を完了した後、ゲノム解読技術は長足の進歩を遂げ、個人の全ゲノム解読が実現可能な時代になりました。しかし、これまでに報告されている集団を対象とした全ゲノム解読は、十一カ国から複数の人種を集めてゲノムを解読し情報を統合したものなどでした。また、これまでに発表された日本人のゲノム解読の結果は、個人の全ゲノム解読や、集団が対象であっても、ゲノムの部分的な(タンパク質を作る部分のみを対象とした)解読であり、日本人集団の標準となりうる大規模な集団の全ゲノムの配列解読はなされていませんでした。
【今回の成果】
■1000人分の全ゲノム解読が完了
今回、ToMMo は、東北メディカル・メガバンク計画のコホート調査事業に参加した健常人 1000 人分の全ゲノムを解読しました。東北メディカル・メガバンク計画は、東日本大震災からの復興事業として実施され、東北在住の健常な日本人を対象とした大規模なコホート調査*3 とそれに基づくバイオバンク*4 構築を進めるとともに、ご提供頂いた一部の試料から健常な日本人の全ゲノム解読を進めてきました。本事業における全ゲノム解読は、均質な精度(単独の施設・設備を用いて、単一の方式によって実施)、高品質(一人あたりシークエンシング 30 回分の解読量。平均 900 億塩基)で解読しており、この様な品質での 1000 人分の全ゲノム解読完了は世界初の取組です。
■1500万個におよぶ新たな遺伝子多型を収集
今回、日本人全ゲノム配列にある一塩基多型を2800万個(既知の多型約1300万個、これまでの国際的なデータベース(dbSNP)に存在しない新規の多型約 1500 万個)検出しました。本解読では、1000 人の集団を高品質(1人当たりシークエンシング 30 回分)で解読したことから、新規に発見した 1500 万個の多型のうち 99%以上は比較的稀な頻度(頻度 5%以下)のものであることが特徴です。
【今後の展開】~精度の高い ToMMo 全ゲノムリファレスパネル*5 の作成へ
1000 人の全ゲノム解読終了を踏まえ、本解読結果の検証解析を進める一方、頻度情報や機能的意義の情報を充実させ、ToMMo 全ゲノムリファレンスパネルのドラフト版を今年度中に構築する予定です。また、広く医学・生命科学系研究者にご利用いただけるよう検索しやすいデータベースとしての準備が整い次第公開します。さらに日本人集団の年齢別人口構成などを意識して対象集団を選択して全ゲノム解読を進め、データベースの精度を高めていきます。
ToMMo全ゲノムリファレンスパネルは、疾患を持った日本人の遺伝子変異を解析(クリニカルシークエンス解析)する際に標準となる参照ゲノムとして、日本人特有の疾患の原因探索に必須の基盤となることが期待されます。
また、今回新規に収集された 1500 万個におよぶ多型には、疾病の原因となる変異が一定の割合で存在することが想定されます。ToMMo では、日本人に最適化した高精度カスタムアレイを開発し、疾患感受性と関連する多型(疾患原因)の探索を進め、個別化予防・個別化医療の実現を目指します。
【用語解説】
*1 コホート調査:ある特定の人々の集団を一定期間にわたって追跡し、生活習慣などの環境要因・遺伝的要因などと疾病の関係を解明するための調査のこと。
*2 全ゲノム解読:およそ 30 億塩基対からなるヒトのゲノムの DNA 配列をすべて解読すること。30 億塩基対のうち、タンパク質をつくるためなどに使われる遺伝子の領域は、およそ 1%程度で、その領域のみを解析するエクソーム解析も行われている。近年、遺伝子以外の領域も調節などの役割を持つことが示され、全ゲノム解読の必要性が認識されるようになった。
*3 多型:遺伝子や DNA 配列等の個体差で、その頻度が集団全体の 1%以上の場合を多型といい、それより少ない場合を変異という。
*4 バイオバンク:生体試料を収集・保管し、研究利用のために提供を行う。東北メディカル・メガバンク計画のバイオバンクは、コホート調査の参加者から血液・尿などの生体試料を集める。
*5 全ゲノムリファレンスパネル:大規模な人数の全ゲノム解読を行った結果を総合し、DNA 配列の多型などの頻度情報をまとめることで、今後のゲノム研究の参照情報となるよう、東北大学東北メディカル・メガバンク機構が構築を目指しているもの。1000 人規模の全ゲノムレファレンスパネルを活用し、頻度 0.5%程度の稀少変異のものまで同定が可能となる。また、今後は、診療情報や生活習慣情報、血液・尿解析のデータなどと統合されて、我が国における次世代医療を目指す研究に幅広く活用可能なデータベースとして構築することを目指している。