cBioPortal 経由で TCGA のデータを閲覧 (4)

cBioPortal では、データをダウンロードすることもできます。操作は、閲覧するときと同様ですが、最初に “Query” ではなく、 “Download Data” タブを選択してから行います。

データのダウンロード手順。
データのダウンロード手順。

(1) Download Data タブをクリックします。

(2) データセット(がんの種類、 CancerStudy)を選択します。

(3) データの種類を選択します。RNASeq、microRNA、通常のマイクロアレイなどから選択します。 mRNA expression の Z-scores は、 Z-score 化されたシグナル値です。(ratio とは異なります。) コントロールまたは全サンプルの平均値から、標準偏差 (=SD) の何個ぶん離れているかを表したものです。Z-score > 2 (増加)もしくは、 Z-score < -2 (減少)で有意となります。

上図の例では、Z-score ではなく、シグナル値の形式を選択しています。

(4) 取得したい遺伝子名を Official Symbol で入力します。リストから決まった遺伝子群を選択することも可能です。

(5) Submit をクリックすると、タブ区切りのテキスト形式のデータを取得できます。

 

cBioPortal 経由で TCGA のデータを閲覧 (3)

cBioPortal を利用して、特定のがん(データセット、CancerStudy)における、特定の遺伝子群の発現変動を閲覧する方法を紹介します。この操作により、自分のマイクロアレイデータで発現変動していた遺伝子が、TCGAのデータではどう変動しているかチェックすることができます。

cBioPortal のホームには、データセットを選択するための、クエリーを入力する欄があります。ここから、

  1. データセット(がんの種類)
  2. データ形式(変異、コピー数、マイクロアレイ、miRNA、RNASeq )
  3. 見たい遺伝子群(遺伝子の名前)

を選択します。

1. クエリーから、データセットを選択

まず、データセット(がんの種類、 CancerStudy)を選択します。例では、 Lung Adenocarcinoma (TCGA, Nature, in press)を選択しています。

データセットを選択。
データセットを選択。

2. データ形式を選択

データ形式(変異、コピー数、マイクロアレイ、miRNA、RNASeq )を選択します。選んだデータセットによって、利用可能なデータ形式のみ表示されます。すべてのデータ形式があるとは限りません。例では、mRNA =マイクロアレイのデータを選択しています。

(また、必要に応じて、データセットに含まれるサンプルのうち、特定の患者のものだけを選択することも可能。)

データ形式を選択。
データ形式を選択。

3. 見たい遺伝子群の入力

データセットのうち、特定の遺伝子(群)を指定して閲覧できます。ボックスの中に、見たい遺伝子の Official Symbol 公式な遺伝子名)を入力します。あらかじめ、いくつかの有名な遺伝子については、リストが用意されているので、プルダウンメニューから選択してもよいでしょう。例では、Cell Cycle を選択しています。

遺伝子群を入力または選択する。
遺伝子群を入力または選択する。

入力された遺伝子名が見つからない場合は、その旨が表示されます。昔の名前や通称の場合は、NCBIなどで、公式な遺伝子名を確認してください。

入力後に、 Submit をクリックします。

Submit
Submit

4. 結果の表示(OncoPrint)

データを Submit すると、しばらくして、 OncoPrint という画面が表示されます。例では、マイクロアレイデータを選択したので、遺伝子ごとに、その遺伝子の発現が増加している(または減少している)サンプルがハイライトされて表示されます。ここでは、遺伝子発現の増加減少Z-score によって判定されています。ヘルプによると、 Z-score を算出するときのコントロールは、全がんサンプルの場合と、健常者のデータの場合があるようです。どちらが使われているか、個々のデータセットを確認してください。

OncoPrint による遺伝子発現の増減を表示。
OncoPrint による遺伝子発現の増減を表示。