お知らせ
長鎖リードシークエンサーによるゲノム構造多型の解析・公開 長い情報を読んで初めてわかるゲノムの正体【プレスリリース】
発表のポイント
• 日本で初めて一般住民の集団を対象としたゲノム構造多型の同定を実施。同定された多型が親子間で継承されていることを指標に、ゲノム構造多型を高い精度で検出できていることを確認した。
• 東北メディカル・メガバンク機構(ToMMo)が樹立・保管している細胞試料と最新型長鎖リードシークエンサーを活用することで、精度の高いゲノム構造多型の解析が実現した。
• 解析した構造多型の頻度情報を公開することで広く利活用可能とした。ゲノム構造多型が関連する疾患研究において、日本人の貴重な比較参照データとして役に立つことが期待される。
概要
ヒトゲノムには小さなものから大きなものまで、様々なバリアントが存在します。これまでToMMoでは、約5万人のゲノム解析を通して、比較的小さなサイズのバリアントの位置や頻度を収載したデータベースを構築・公開してきました。今回の研究では、最新型の長鎖リードシークエンサーを用いて333人の全ゲノム解析を行うことで、50塩基対を超える大きな挿入・欠失(構造多型)を詳細に解析しました。特に、ToMMoが樹立・保管している細胞試料を活用することで、安定した品質の長鎖リードシークエンス解析を可能にしました。また、今回の333人はトリオ(成人とその両親からなる3人組)の組み合わせで構成されており、親子間の解析結果をもとに「答え合わせ」をすることで精度検証も行い、高い精度でゲノム構造多型を検出できていることを確認しました。本論文の成果は日本人構造多型参照パネルJSV1として、公開データベースjMorpで公開されています。今回の解析結果は、小さなサイズのバリアント情報だけでは分からなかった疾患の原因探索やがんゲノム解析への応用に有効であると期待されます。
このゲノム構造多型解析結果「JSV1」の構築についての論文が2022年9月20日付でCommunication Biology誌に掲載されました。
書誌情報
タイトル:Construction of a trio-based structural variation panel utilizing activated T lymphocytes and long-read sequencing technology
著者:Akihito Otsuki, Yasunobu Okamura, Noriko Ishida, Shu Tadaka, Jun Takayama, Kazuki Kumada, Junko Kawashima, Keiko Taguchi, Naoko Minegishi, Shinichi Kuriyama, Gen Tamiya, Kengo Kinoshita, Fumiki Katsuoka, Masayuki Yamamoto
掲載誌:Communications Biology
掲載日:2022年9月20日
DOI:10.1038/s42003-022-03953-1
用語解説
ゲノム構造多型:
ゲノム配列において、SNV(後述)や短鎖リードシークエンサーで検出できるようなINDEL(後述)などの短い長さのバリアントではなく、数十から数千、あるいはそれ以上の塩基が個人間で異なる多様性のこと。
長鎖リードシークエンサー:
大量のゲノム情報を同時並列で高速に解析可能な装置。ゲノムDNA断片を数百塩基単位で解析するのが短鎖リードシークエンサー、数千から万単位の塩基を解析可能なのが長鎖リードシークエンサーである。短鎖リードシークエンサーは、リードあたりの解析精度やコスト面の優位性を活かして小さなバリアントの解析に適している。長鎖リードシークエンサーは、その長いリードで大きなバリアントを覆うことができるため、構造多型の解析に適している。
バリアント:
それぞれ個人間で異なるゲノム領域。このうち、一塩基のみの置換を一塩基バリアント(SNV)、比較的少数の塩基の挿入や欠失をINDEL、50塩基対以上の様々なバリアントを構造多型(SV)とよぶ。本論文では、構造多型のうち、挿入・欠失を解析対象とした。
関連リンク
ゲノムリファレンスパネルとゲノム解析情報を拡充~日本人全ゲノムリファレンスパネルが14KJPNに 構造多型データベースなど公開~【プレスリリース】