cBioPortal 経由で TCGA のデータを閲覧 (2)

各データセット(CancerStudy)のサマリーのページから、各種の情報をたどることができます。例えば、”Mutated Genes” のタブをクリックすると、変異のある遺伝子を確認できます。

データセットのサマリーから、変異のある遺伝子のリストへ。
データセットのサマリーから、変異のある遺伝子のリストへ。

1. 変異のある遺伝子リスト

選択したデータセット(CancerStudy)において、変異のある遺伝子のリストが表示されます。ここを見れば、乳癌に多く変異のある遺伝子はどれか?肺がんに多い変異はどれか?、数百サンプルの情報を元に確認できます。

変異のある遺伝子のリスト。
変異のある遺伝子のリスト。

さらに遺伝子名をクリックすることで、染色体上のどの部分にミューテーション(=変異)があるかが表示されます。下には変異のある検体のリストが表示されます。また、図のピンをマウスでポイントすることで、どの検体に見られる変異なのか対応を確認できます。

さらに、上部のタブをクリックして、ほかの情報を参照できます。

変異のある遺伝子のリスト。
変異の位置と検体の関係。

2. 共発現(遺伝子発現の相関関係)

Co-Expression タブをクリックすると、(現在選択中の)変異のある遺伝子と、遺伝子発現レベルで相関のある遺伝子のリストを表示できます。元となるデータとしては、マイクロアレイや RNASeq のデータがあります。遺伝子名をクリックすると散布図の形で相関関係を確認できます。

共発現している遺伝子のリスト。遺伝子名をクリックすると散布図の形で相関関係を確認できる。
共発現している遺伝子のリスト。遺伝子名をクリックすると散布図の形で相関関係を確認できる。

3. 生存曲線

Survival タブをクリックして、変異と生存曲線の関係を表示することもできます。

変異と生存曲線の関係。
変異と生存曲線の関係。

4. ネットワーク図

Network タブをクリックして、その他の関連する遺伝子をネットワーク図から確認できます。ネットワークの情報は、REACTOME などが用いられています。(表示には、Cytoscape のプラグインを利用。Adobe Flash Player が必要。)

その他の関連する遺伝子を表示したネットワーク図。
その他の関連する遺伝子を表示したネットワーク図。
 

cBioPortal 経由で TCGA のデータを閲覧 (1)

cBioPortal 経由で TCGA のデータを閲覧する例を紹介します。

1. cBioPortal にアクセス

The Cancer Genome Atlas (TCGA) のデータの一部は、 cBioPortal というサイトを経由して閲覧することができます。(TCGAからダウンロードする方法もありますが、主要なデータは cBioPortal 上でダウンロードすることなく、閲覧可能です。)

2. DATA SETS をクリック

cBioPortal の上部のタブから、 “DATA SETS” をクリックします。閲覧可能なデータセットのテーブルが表示されます。

DATA SETS をクリック。
DATA SETS をクリック。

3. データセット (CancerStudy) を選択

データセット (CancerStudy) のテーブルは、がんの種類(組織)ごとにまとめられています。また、それぞれのデータセットに含まれる情報と、そのサンプル数が表示されています。例えば、シークエンス、CNA (Copy Number Alterations)、RNA-Seq、マイクロアレイ、メチレーションなどです。組織ごとにすべての種類のデータが存在するわけではありません。また、取得されているサンプル数も異なります。

目的の情報を含む CancerStudy をクリックします。

データセットのテーブル。閲覧したい CancerStudy を選択。
データセットのテーブル。閲覧したい CancerStudy を選択。

4.  サマリーの表示

データセットを選択すると、そのデータセットのサマリーが表示されます。この画面から、さらに、ミューテーションなどの情報を見ていきます。(続きます。)

CancerStudy のサマリー。
CancerStudy のサマリー。
 

The Cancer Genome Atlas (TCGA)

がんゲノムのデータベースとして、 The Cancer Genome Atlas (TCGA) が利用されるようになりました。

TCGAのサイト。
TCGAのサイト。

TCGA に登録されたデータ

乳癌、肺がん、など、組織ごとに数百サンプルのデータが登録され、公開されています。データには、マイクロアレイをはじめ、メチレーションのデータや、次世代シーケンサーによって取得された配列情報も含まれています。

ガイドラインを守って利用が可能。
ガイドラインを守って利用が可能。

これらのデータは、ガイドラインを守れば、研究目的として利用が可能です。データをダウンロードして取得し、自分で解析することもできます。(追記:2015年12月末以降、全てのデータセットが公開になりました。詳細は、ガイドラインのページをご確認ください。)

制限なく利用できるものもある。
制限なく利用できるものもある。

TCGA のデータは、 cBioPortal を通して閲覧可能

イチから解析せずに、データを見てみたいという場合は、 cBioPortal というサイトを通してデータの閲覧が可能です。一部のデータにはなりますが、各がんについて、変異の多い遺伝子などの情報を確認できます。

cBioPortal のサイト。
cBioPortal のサイト。

以前紹介した、 Cancer Cell Line Encyclopedia (CCLE) のデータも、 TCGA の一部として扱われています。

cBioPortal で扱われているデータ。TCGA の一部。
cBioPortal で扱われているデータ。TCGA の一部。