はじめに

はじめに

このサイトは東北メディカル・メガバンク機構で作成を進めている日本人の基準ゲノムのポータルサイトになります。現在、Japanese Reference Genome (JRG) v2 と、 おとり配列をまとめた decoyJRGv2がこのポータルサイトからダウンロード可能です。 (JRGv1/decoyJRGv1はこちら)

背景

東北大学と岩手医科大学は、2012年から東日本大震災の被害からの復興事業として、東北メディカル・メガバンク計画に取り組み、東北大学は東北メディカル・メガバンク機構(以下、ToMMo)を、岩手医科大学はいわて東北メディカル・メガバンク機構をそれぞれ設立して、事業を進めています。両機構は、宮城・岩手両県の住民のコホート調査を進めており、2016年11月、登録者は目標の15万人に達しました。日本人の個別化医療・個別化予防に向けて、ToMMoのゲノム解析部門では、コホート参加者から提供された血液からDNAを抽出し、短鎖型次世代シークエンサー(1度に平均324塩基取得可能)であるHiSeq 2500 (Illumina社) を用いて1,070人の全ゲノム解析を行い約2,120万個の一塩基多様体 (SNV) を含む日本人の全ゲノムリファレンスパネル (1KJPN) の構築をおこないました。同成果は、2014年8月29日に当機構のポータルサイトの1つであるiJGVDから先行して公開されるとともに、2017年6月1日時点ですでに世界100カ国、2万人以上の方から利用されています。2015年8月21日には国際誌Nature Communicationsにおいて、新たに見つかった頻度の低いSNVがより疾患や形質に影響することなど示唆していることなどの報告をおこないました。また、その後、全ゲノムリファレンスパネルは2,049人まで拡充され、現在は同サイトでSNV約2,800万個すべてのアレル頻度情報を公開しています。

しかしながら、短鎖型次世代シークエンサーを用いた解析では、短時間で全ゲノム断片配列情報を数億本以上解読が可能である一方で、1本あたり一度に読み取ることができる塩基長が数百塩基(当機構では、平均324塩基)であるため、ヒトゲノムに含まれる繰り返し配列等を含む構造変異の同定が困難でした。

目的

日本人の基準ゲノムを作成するとともに、あわせて基準ゲノムにアノテーション情報(日本人集団で保有する頻度情報など)を付与して公開していくことが目標になります。

方法

日本人がもつ構造変異を同定することでより正確に1人1人の個人差を同定することができます。近年、長鎖型次世代シークエンサーPacBio RS II (Pacific Bioscience社製:以下Pac Bio)を用いることで、平均で1度に1万塩基以上を連続して読むことが可能になってきました。しかし、同シークエンサーは読み取りエラーの割合が高いことが問題点でした。ヒトゲノムは約30億塩基対から構成されています。そこで、当機構では、日本人のDNAを同長鎖型次世代シークエンサーを用いて徹底して繰り返し読み取り、一人につき合計約3,000億塩基分(100回以上繰り返したのと同じ程度)の配列情報を得ました。同機器の読み取りエラー率が高い問題を、この大量の配列情報取得と、高精度の塩基配列の新規再構成(デノボアセンブル)という情報科学的手法を用いることで克服し、今回の日本人の基準ゲノムの構築と公開をおこなうことができました。また、同解析は当機構のスーパーコンピュータシステムを数ヶ月間にわたって利用することで達成しています。国際的組織であるゲノムリファレンスコンソーシアム (Genome Reference Consortium) ではヒトゲノム参照配列を管理、改定を定期的に行っており、2016年4月現在最新の国際ヒトゲノム参照配列は2013年12月にリリースされたGRCh38です。

GRCh38と日本人1名のデノボアセンブルの結果とを網羅的にスパコン上で比較することで、GRCh38に大してにあらたな約3,500個の挿入配列(総塩基として約250万塩基)の同定に成功し、その結果を2016年6月にdecoyJRGv1、8月にJRGv1として公開していました。この度、新たに2名(合計3名)のシークエンスをおこない同様にGRCh38と比較することで、あらたに同定された配列を合わせ、合計約9,600個の挿入配列(総塩基として約620万塩基)を国際参照配列上に配した日本人の基準ゲノム配列JRGv2、およびデコイ配列decoyJRGv2を構築し、両配列を公開することとしました。

今後の目標

ToMMoで公開をおこなっている2049人から作成を行った日本人の全ゲノムリファレンスパネルは、作成開始当時最新であった国際参照配列のGRCh37を用いて構築をおこないました。今後は、同リファレンスパネルについてもJRGやdecoyJRGを用いて再解析することで、今後日本国内において同日本人基準配列を用いて解析を行った疾患解析の結果と比較できるように日本人集団のリファレンスパネルを再構築し公開していく予定です。

その他

日本人の全ゲノムリファレンスパネルの情報は、姉妹サイトiJGVDで提供を行っています。