ようこそゲノムの世界へ|ゲノムに関する様々な情報を発信していきます。 - Part 2

Into the genome era
ゲノムの時代へ
膨大な情報を、
わたしたちは自在にあやつって、
新しい時代を拓くことができるのか、
やがてくる明日への羅針盤に

公衆衛生対策を後押しするゲノム情報 -新型コロナウイルス感染症クラスター対策の視点から-

現在、世界中で流行が拡大している新型コロナウイルス感染症(Novel Coronavirus disease 2019: COVID-19)。その原因となるのが新型コロナウイルス (SARS-CoV-2) です。SARS-CoV-2を含むコロナウイルスは、外側を膜(エンベロープ)で覆っているエンベロープウイルスです。ウイルスのゲノムはRNAで、約3万塩基とRNAのゲノムを持つウイルスの中でも最長です。ウイルス粒子は直径 約100-200 nmで、S (スパイク)、M (マトリックス)、E (エンベロープ)という3つのタンパク質で構成されています。ウイルスは、相手に感染しようとするとき、その相手の細胞のとっかかりのようなもの(受容体)を見つけて、結合してから細胞に入り込みます。ウイルスの側で、その受容体と結合するのはSタンパク質です。Sタンパク質が鍵ならば、細胞の受容体が鍵穴になります*1。ヒトに感染するコロナウイルスとしては、風邪の原因ウイルスとしてヒトコロナウイルス229E、OC43、NL63、HKU-1の4種類、そして、重篤な肺炎を引き起こす2002年に発生した重症急性呼吸器症候群 (SARS)コロナウイルスと2012年に発生した中東呼吸器症候群 (MERS)コロナウイルスの2種類が知られています*2。SARS-CoV-2は、相同性約80%とSARSコロナウイルスに近く、SARSコロナウイルスと同じ受容体 (ACE2)を使ってヒトの細胞に吸着・侵入することが最近の研究で報告されています*1

日本においては、2019年末の中国・武漢を発端とするSARS-CoV-2が2020年1⽉から2⽉にかけて国内に流入し、地域的な感染クラスター(集団)を発⽣させました。クラスターが発⽣した場所では「積極的疫学調査」(感染症などの色々な病気について、発生した集団感染の全体像や病気の特徴などを調べることで、今後の感染拡大防止対策に用いることを目的として行われる調査)が実施され、発⽣源と濃厚接触者を特定することで、さらなる感染拡⼤を封じ込める対策が展開されてきました。一時的に⼀定の成果を得た地域もありますが、後に各地で感染拡⼤が進⾏し、2020年4月28日現在で全国規模の緊急事態宣⾔に⾄っています。

感染拡大の状況を把握し、今後の対策を立てる上で積極的疫学調査は重要ですが、それを裏付け科学的に支援するのがゲノム情報です。世界各地の研究所においてSARS-CoV-2のゲノム配列が解読されており、4月16日現在で4,511人から採取した検体のSARS-CoV-2ゲノム配列がGlobal lnitiative on Sharing All Influenza Data:GISAIDのデータベースに登録されています。日本国内でもSARS-CoV-2のゲノム解読は進められています。4月27日、国立感染症研究所からSARS-CoV-2に関する分子疫学調査の結果が発表*3されました。日本国内で各地の協力施設から収集された陽性者の検体を用いて562患者でのゲノム解読が行われ、世界のデータと統合した塩基変異抽出、ウイルス株の親子関係を示すハプロタイプネットワーク図が作成され、その分析結果が解説されています。SARS-CoV-2の変異速度は現在のところ25.9塩基変異/ゲノム/年(つまり、1年間で25.9箇所の変異が⾒込まれる)と推定*4されています。2019年末の発⽣から4ヶ⽉ほどの期間を経て、ゲノム全域に少なくとも9塩基ほどの変異がランダムに発⽣していると⽰唆されています。

図を拡大

図:世界と⽇本のSARS-CoV-2ゲノム情報の塩基変異を⽤いたハプロタイプネットワーク図(参考文献3より)

日本では、中国発の第1波においては “中国、湖北省、武漢” をキーワードに感染者を特定し、濃厚接触者をいち早く探知して抑え込むことができていました。しかし、緻密な疫学調査により収束へと導くことができるかと思われた矢先に、3⽉中旬から全国各地で “感染経路(リンク)不明” の孤発例が検出されはじめています。渡航⾃粛が始まる3⽉中旬までに海外からの帰国者経由で “第2波” の流⼊を許し、数週間のうちに全国各地へ伝播して “渡航歴なし・リンク不明” の患者・無症状病原体保有者が増加したこと、3⽉中旬以降、国内移動や外出自粛などの⾏動制限の徹底がなかなか出来なかったことで、SARS-CoV-2が国内に徐々に広まり、現在の感染拡⼤へ繋がったと推測されています。今後、第3波、第4波が来ることは十分に考えられます。ゲノム情報と疫学調査情報の迅速な共有、公開が効果的な感染症対策の鍵と言えるでしょう。

参考文献

1. 日本ウイルス学会「新型コロナウイルス感染症について
2. Cui, J., Li, F., Shi, Z.L. Origin and evolution of pathogenic coronaviruses. Nat. Rev. Microbiol. 2019. 17181-192
3. 国立感染症研究所病原体ゲノム解析研究センター. 「新型コロナウイルスSARS-CoV-2のゲノム分子疫学調査
4. 変異速度の推定値は、最新の成果をもとに随時更新されています。最新のデータは、Nextstrain等をご参照下さい。

2020.04.28|土屋菜歩

“スティグマ”を避けるには~感染症の流行で、そしてゲノム研究でも

「スティグマを避けよう」という言葉、聞いたことがありますか?
新型コロナウイルスの感染拡大を受けて、スティグマを避けよう、という声が上がっています。“スティグマ”、日常ではあまり聞きなれない言葉ですが、英単語の直訳では、汚名・烙印といった意味になります。もともとは奴隷や家畜に押された焼印に由来し、キリストが十字架で受けた傷あとなども指す言葉とされます。

さて、現在、問題にされているのは社会的スティグマです。社会において、何らかの属性を持つことから差別や偏見の対象として扱われてしまうようになることを指します。属性は、民族や外見、障害などであることもあり、あるいは、何らかの疾患の罹患ということもあります。
本稿執筆現在(2020年4月23日)、新型コロナウイルスの感染拡大の局面で、問題になっているのは、ウイルス感染や、それに少しでも関係することが、そのスティグマの対象となっている事態が懸念されていることです。実際、感染者を出した機関の職員等が、各種サービスの利用を拒絶されたりする、といった事態が発生しているという報道があります。保育園利用や入店を断るといった対応は、相手を根拠なしに接触するべきでないとするというスティグマ=烙印を押していることになります。こうした差別的な扱いがあってはなりません。
また、スティグマを避けることは、差別があってはならないということに加えて、寧ろ感染拡大を防ぐためにも重要になります。不必要に感染者を叩くようなことは、人々が感染について明らかにしづらくなったり、感染経路について秘匿するようになったりといったことに繋がります。

実はゲノム研究においても、スティグマを避けることは大きなテーマであり続けています。特定の家系から特定の疾患が多くあらわれる、特定の地域で遺伝性の疾患が多い傾向がある、といったことは、科学的事実であっても、そうしたスティグマに結びつきやすいものです。研究に際して、また、発表に際して、さまざまな配慮を行って、科学的な解明と、社会的な行動等との負の結びつきを断っていこうという努力がなされています。
今回の事態においても、それぞれの立場で、スティグマを避けていく努力が必要です。私たちは常に、感染拡大を防ぐ、という名目のもとに、何かの属性をもった人たちを苦しめることになっていないか、留意していく必要があります。

2020.04.24|長神風二

稀少疾患の原因探索に使われる日本人全ゲノムのバリアント頻度パネル

図を拡大
ヒトはおよそ30億塩基対の配列をもっています。そのうち、たとえば一個人を見ると、常染色体で平均約420万箇所の塩基が、国際的な参照用配列に比べて異なります。その異なる部分をバリアントと呼び、集団が異なると、バリアントの組み合わせも異なることが分かっています。このバリアントの頻度について、世界的にいくつかの民族集団で調査が行われており、民族集団毎(例えばアフリカ系、東アジア系など)にまとめたデータベースが存在します。gnomADデータベースはその代表的なものの一つで、全ゲノムでは約1.5万人、遺伝子領域に絞ったもの(エクソーム)では約12.6万人を対象とした大規模データベースとなっています。

一方、原因のよくわかっていない、稀な病気の要因を探るための遺伝子解析をする機会が現在増えつつあります。例えば、とある症状の方の遺伝子解析を行った結果、遺伝子領域で数万箇所のバリアントが検出されたとします。さて、この中から病気の原因になるバリアントはあるでしょうか、というのが解析目的のひとつです。原因バリアントがわかると、そのバリアントが属する遺伝子の機能や、バリアントに起因するタンパク質の機能変化などから病気の遺伝的背景が明らかになり、効果的な治療法を選択する足がかりになるからです。実際に、診断の難しい患者さんに対して、家族性も考慮して遺伝的要因を探る試みが日本で行われています (未診断疾患イニシアチブ IRUD)。

では、この病気の要因を探る遺伝子解析で、実際には数万の候補のほとんど(あるいはすべて)が、対象の病気と直接関係がないバリアントであろうことが想定される中、どのように原因バリアントを探すのでしょうか。最終候補へと絞り込んでいくその際に利用されるのが、バリアントを集めた大規模データベースなのです。特に稀な病気の場合は、集団である程度の頻度でみられるバリアントは、特定の病気と関連づけられないと推定されます。このことから、数万の病気の原因バリアント候補のうち、集団である程度(例えば1%以上)の頻度で見られるバリアントをふるいおとせるのです。

ただ人類の歴史的な背景から、民族集団によってバリアント頻度は異なり、特定の民族集団でのみ多くみられるバリアントは多々あるのです。したがって、解析対象の方が日本人であれば、日本人集団の頻度データを用いることで、より絞り込みの精度が上がることが考えられます。しかしながら、世界最大規模のデータベースgnomADにおいて、日本人由来の数は約80人程度と少ない状況です。東北大学東北メディカル・メガバンク機構(ToMMo)では日本人を対象としたバリアントデータベースを公開しており、2019年には対象を約4,700人に増やした全ゲノムのバリアント頻度パネル(4.7KJPN)を公開しました。ToMMoのバリアント頻度パネルは、これまで国内の各種の疾患研究において原因バリアントの絞り込みに活用されてきています。このように、病気の原因バリアントの同定に、住民コホートから得られたバリアント頻度パネルは重要な役割を果たすことができるのです。

【関連リンク】

iMorpBanner

2020.03.13|元池育子

各国ですすむ基準ゲノム構築プロジェクト

2019年2月、日本人基準ゲノム配列の初版JG1が公開されました。これは、1980年代に開始され2001年にドラフト配列決定に至った国際ヒトゲノム計画を、日本人検体を用いて再度実行したことに相当します。国際ヒトゲノム計画で構築された国際基準ゲノム配列(参照配列とも呼ばれる)は現代のゲノム解析に欠かせないものです。しかし国際基準ゲノム配列はもっぱらヨーロッパ系とアフリカ系に由来する検体から構築されたために、異なる民族集団に属する検体のゲノム解析には必ずしも適していませんでした。ゲノムのバリアントの検出は、解析対象のゲノム配列と基準ゲノム配列との比較により行われるのですが、解析対象の検体のゲノムを他の民族からの基準ゲノムと比較した場合、バリアントの見落としや誤検出が生じうることが分かっています。日本人検体から構築されたJG1を使用すると、日本人を対象としたゲノム解析において、これまで民族集団の違いに起因する見落としや誤検出を減らすことができるので、これまで未特定だった遺伝性疾患の原因究明や、がんを引き起こす遺伝子の同定などが期待されます。

JG1のように民族集団固有の基準ゲノム配列を構築する試みは各国で行われはじめています。しかしJG1は3人のゲノムを統合することでレアな配列バリエーションを可能な限り除外した点、および、遺伝地図等の情報を用いて解読した配列と染色体との対応づけも行った点が特筆に値します。例えば韓国ではAK1、中国ではHX1、またスウェーデンではSwe1, Swe2という高品質のゲノム配列が構築され報告されています。しかしこれらはいずれも1人のゲノム配列を決定したものであり、その個人がたまたま持っていたレアバリアントが基準ゲノム内に残ってしまっています。また手間のかかる染色体との対応づけは行わずに、数千本の配列の集まりとして公開されています。韓国からはKOREFという基準ゲノム配列も公開されていますが、こちらは染色体との対応づけの際に国際基準ゲノム配列の情報を利用しています。JG1は3人のゲノムを統合する前のどれか一つを見ても、各国のアセンブリよりも高い配列連続性を示していましたので、JG1は民族集団固有の基準ゲノム配列として群を抜いて高品質なものであると言えます。

2019年1月に米国では、350人の高品質ゲノム配列を構築するための研究の公募が発表されました。今後様々な民族集団の基準ゲノム配列が構築されること、さらにそれらの多様性を包括的に表現する方法の研究が進むと予想されます。そうすると民族集団ごとに構築した基準ゲノム配列を用いてより精度の高い解析が可能になるでしょう。さらにその次の段階はどうなるでしょうか?究極的には個々人のゲノム解読にも今回の基準ゲノム配列の構築で行われた様な手法による全ゲノム配列決定が利用されると予想します。
例えば、がんの解析では正常組織から抽出したDNAをもとに基準ゲノム配列を構築して、がん組織のバリアントを検出すればより精度の高い解析が可能になります。小児遺伝性疾患でも父・母・子で全ゲノム配列決定すれば、検出されたバリアントが祖先から受け継がれたものか、それともこの親子間で初めて生じた新生突然変異なのかの区別がより精度よく行われます。現在では夢物語とも言える解析ですが、DNA解読技術や情報解析技術の進展スピードを見ると案外近いうちに実現するかもしれません。

【関連リンク】

「日本人基準ゲノム配列」初版JG1の公開~日本人のゲノム解析がこれまでよりも精密かつ正確に~【プレスリリース】

2019.06.17|高山順

ゲノムの変異の実験的効果予測 ~BRCA1タンパク質の機能測定からみえるもの~

図を拡大
ヒトゲノム全体が解読されてから、現在ではゲノムの多様性を解明する研究が盛んに進められています。メンデル遺伝性疾患の場合、原因遺伝子に観察されるそれぞれのバリアントが、疾患の原因となるのかどうかを判断することはとても重要です。これまでの研究で報告されている病的バリアント(疾患の原因となるバリアント)の情報はデータベースに蓄積されてきているので、着目するバリアントが病的バリアントであるか、あるいはその可能性が高いと報告されているものかどうかを確認することは、専門家により広く行われています。しかしヒト集団中には、本当は疾患原因のバリアントであっても、まだ論文などで報告されていないものも存在しますし、人が世代交代を続けている以上、突然変異により新たなバリアントが発生します。では、どうすればより良い判断ができるでしょうか?

この課題へのアプローチの仕方は一つではないのですが、最近、ゲノム編集技術を活用した画期的な論文が発表されました。遺伝性乳癌卵巣癌症候群の原因遺伝子の一つとしてBRCA1が知られていますが、この研究では、BRCA1タンパク質の機能的に重要な部分の塩基配列について、あり得る全ての一塩基変異のゲノム編集実験を行いました。そして、BRCA1タンパク質が本来の機能を発揮しているかどうかを、細胞の生き残りの程度で計測しました。実際に、約4,000の一塩基変異の機能への効果を測定し、その分布は二峰性を示すことが分かりました。機能測定の結果の分析により、それぞれの変異が病因性をもつかどうかという予測について、有効な手法であることが分かりました。
この研究の手法は、他の重要な機能をもつ遺伝子についても適用できることはもちろん、得られたデータから見えてくることは、遺伝医学的側面のみならず、タンパク質の機能を保ちながら変異できる範囲など、基礎研究においてもインパクトが大きいと考えられます。また、実験的な変異の効果予測は、近い将来の詳細な研究の蓄積を先回りしているところがあり、バリアントの解釈方法の進展が加速していくことを示しています。これまでは、効果の不明なバリアントが沢山残っていたところ、本研究のような手法により得られた知見を活用することで、病的バリアントがどれであるかの判断がしやすくなるので、ゲノムに基づく個別化医療・予防の精度が高まることが期待されます。

※ 参考文献
Accurate classification of BRCA1 variants with saturation genome editing | Findlay GM, et al.  | Nature 562(7726):217-222, 2018. | doi: 10.1038/s41586-018-0461-z

2019.04.05|山口由美