cBioPortal 経由で TCGA のデータを閲覧 (1)

cBioPortal 経由で TCGA のデータを閲覧する例を紹介します。

1. cBioPortal にアクセス

The Cancer Genome Atlas (TCGA) のデータの一部は、 cBioPortal というサイトを経由して閲覧することができます。(TCGAからダウンロードする方法もありますが、主要なデータは cBioPortal 上でダウンロードすることなく、閲覧可能です。)

2. DATA SETS をクリック

cBioPortal の上部のタブから、 “DATA SETS” をクリックします。閲覧可能なデータセットのテーブルが表示されます。

DATA SETS をクリック。
DATA SETS をクリック。

3. データセット (CancerStudy) を選択

データセット (CancerStudy) のテーブルは、がんの種類(組織)ごとにまとめられています。また、それぞれのデータセットに含まれる情報と、そのサンプル数が表示されています。例えば、シークエンス、CNA (Copy Number Alterations)、RNA-Seq、マイクロアレイ、メチレーションなどです。組織ごとにすべての種類のデータが存在するわけではありません。また、取得されているサンプル数も異なります。

目的の情報を含む CancerStudy をクリックします。

データセットのテーブル。閲覧したい CancerStudy を選択。
データセットのテーブル。閲覧したい CancerStudy を選択。

4.  サマリーの表示

データセットを選択すると、そのデータセットのサマリーが表示されます。この画面から、さらに、ミューテーションなどの情報を見ていきます。(続きます。)

CancerStudy のサマリー。
CancerStudy のサマリー。
 

The Cancer Genome Atlas (TCGA)

がんゲノムのデータベースとして、 The Cancer Genome Atlas (TCGA) が利用されるようになりました。

TCGAのサイト。
TCGAのサイト。

TCGA に登録されたデータ

乳癌、肺がん、など、組織ごとに数百サンプルのデータが登録され、公開されています。データには、マイクロアレイをはじめ、メチレーションのデータや、次世代シーケンサーによって取得された配列情報も含まれています。

ガイドラインを守って利用が可能。
ガイドラインを守って利用が可能。

これらのデータは、ガイドラインを守れば、研究目的として利用が可能です。データをダウンロードして取得し、自分で解析することもできます。(追記:2015年12月末以降、全てのデータセットが公開になりました。詳細は、ガイドラインのページをご確認ください。)

制限なく利用できるものもある。
制限なく利用できるものもある。

TCGA のデータは、 cBioPortal を通して閲覧可能

イチから解析せずに、データを見てみたいという場合は、 cBioPortal というサイトを通してデータの閲覧が可能です。一部のデータにはなりますが、各がんについて、変異の多い遺伝子などの情報を確認できます。

cBioPortal のサイト。
cBioPortal のサイト。

以前紹介した、 Cancer Cell Line Encyclopedia (CCLE) のデータも、 TCGA の一部として扱われています。

cBioPortal で扱われているデータ。TCGA の一部。
cBioPortal で扱われているデータ。TCGA の一部。
 

Rat Genome Database (RGD)

マウスのデータベースは、 MGI であるのに対して、ラットのデータベースとして、 Rat Genome Database (RGD) があります。

Rat Genome Database (RGD)
Rat Genome Database (RGD)

マウスに対して、ラットでは QTL のデータが充実しているようです。それに関連して、 Disease Ontology もよく整理されています。下図は、 Obesity に関連した遺伝子がまとめられたページです。マウスとヒトのホモログの情報もいっしょに表示されますので、ラット以外を研究している研究者にとっても便利です。

Obesity に関連した遺伝子の一覧。Human, Mouse のホモログの情報もある。
Obesity に関連した遺伝子の一覧。Human, Mouse のホモログの情報もある。

また、パスウェイの情報もよく整理されていますので、おすすめです。

 

Homologene

ある遺伝子のホモログを知りたいときは、 NCBI の HomoloGene データベースが利用できます。

Homologene データベース。
Homologene データベース。

 

検索方法

遺伝子名などを入力して、”Search” をクリックすると、入力した遺伝子のホモログの一覧が表示されます。 続きを読む Homologene

 

NF-kB のターゲットとなる遺伝子を調べるには?

マイクロアレイ解析の結果、確認したくなるのは、特定の生物学的な機能を持った遺伝子の変動パターン(増加したか減少したか)だと思います。この特定の機能を持った遺伝子のリストは、GOなどのアノテーションを見れば分かる場合もありますが、そうでない場合もあります。

例えば、転写因子である NF-kB のターゲットとなる遺伝子(制御される遺伝子、下流の遺伝子)は、アノテーションの情報からは知ることができません。このような場合では、インターネット上に公開された情報が役立つことがあります。

続きを読む NF-kB のターゲットとなる遺伝子を調べるには?