マイクロアレイデータ:表示方法

数値化されたマイクロアレイデータを表示するには下記のような方法があります。

  • 表計算ソフト(エクセルなど):テーブル形式で表示。
  • ヒストグラム:データの分布を確認する。
  • Box プロット(ボックスプロット、箱ひげ図):データの分布を確認する。
  • Scatter プロット(スキャッタープロット、散布図):2サンプル間の比較。変動の大きさを見る。
  • MA プロット(エムエープロット):2サンプル間の比較。変動の大きさを見る。

*テーブル形式以外のシグナル値は、値を log2 変換してから表示することが一般的。

 

基礎(3) マイクロアレイの数値化後のデータ

  • 一般的に、1 プローブに対して、シグナル値フラグが存在する。
  • フラグは、A = Absent,  M = Marginal,  P = Present の3種類。Pは検出されたことを意味する。Aは未検出(欠損)を表し、Mは、PとAの境界を意味する。すべてのサンプルにおいて、フラグ A を示したプローブのシグナル値は解析に使用しない。

Illumina は、Flag の代わりに Detection_P という値がある。

Detection_P < 0.01 で検出。

 

基礎(2) マイクロアレイデータの数値化

  • 数値化は、ソフトウェアやプログラムを使って行います。各アレイメーカーごとにソフトウェアが異なります。また、フリーのソフトウェアとして、Bioconductor* (統計処理ソフトウェア “R”** のパッケージ)を使用できます。数値化後のデータは、rawデータ (or なまデータ)とも呼ばれます。
  • Affymetrix社 : GCOS, Expression ConsoleTM (正規化も同時に行える), Affymetrix Power Tool (APT)
  • Agilent社 : Feature Extraction または GeneSpring (正規化とその後の解析も行える)
  • Illumina社 : GenomeStudio (出力結果は 1 プローブに 1 個のシグナル値の形式)

*http://www.bioconductor.org/

**http://www.r-project.org/

 

基礎(1) マイクロアレイデータ解析の流れ

マイクロアレイの基礎として、解析の流れから、シグナル値の扱い方を解説します。


  • 数値化:スキャナーから出力された値をバックグラウンドの値などを考慮して数値化する。1 サンプルあたり、1 プローブに 1 個のシグナル値が得られる。
  • 正規化:複数のサンプル間でシグナル値の補正を行う。平均値や分散が近い値になる。
  • 比較:シグナル値から、ratio(=fold-change) や Z-score を算出する。発現に変化のあった遺伝子(発現変動遺伝子)を抽出する。

マイクロアレイデータの数値化に続きます。

 

DAVID 操作ガイド3

8. 解析結果1:アノテーションの解析結果を見る例です。ここでは、”Functional
Annotation Clustering” を見る方法を解説します。中程の ”Functional Annotation Clustering” のボタンをクリックします。

新しいウィンドウに解析結果が表示されます。Functional Annotation Clustering では、同じような機能を持った遺伝子群を1つのクラスターとして考え、スコアの高いクラスターの順に表示されます。1つのクラスターには、metabolic process, anion transport などの Gene Ontology (GO) が複数含まれています。アップロードした遺伝子リスト中、それぞれの GO をアノテーションに持つ遺伝子は、GO の隣の青いバーをクリックすることで見ることができます(Gene Report)。 P_Value は、0.05 (5.0E-2)以下が統計的に有意と判断される目安です。

青いバーをクリックして表示される Gene Report は、右上の “Download file” をクリックすることで、ダウンロードできます。

ダウンロードした Gene Report は、Excel で読み込むことができます。開くときに、選択対象を ”すべてのファイル” とします (“すべての読み込み可能なファイル”ではなく)。

9. 解析結果2:パスウェイを表示させる例です。 Annotation Summary Results の画面(7. の画面)の “Pathways (3 selected)” を選択します。

同じウィンドウの中にアノテーション情報として登録されているパスウェイデータベースの一覧が表示されます。パスウェイデータベースの横の数字は、 アップロードした遺伝子リストのうち、パスウェイデータベースにヒットした割合と個数です。 “Chart” ボタンをクリックすると、 “Functional Annotation Chart” のウィンドウが表示されます。また、Chart ボタンの隣の ”青いバー” をクリックすると、 ”Functional Annotation Table” のウィンドウが表示されます。さらに、それぞれのウィンドウにおいて、各パスウェイ名をクリックすると、パスウェイの画像を表示できます。

パスウェイデータベース(ここでは KEGG )に登録されている ”Apoptosis” や ”Cell Cycle” といった個々のパスウェイの中から、アップロードした遺伝子リストに含まれる遺伝子が載っている(マップされる)パスウェイを探すには、 ”Functional Annotation Chart” を参照します。スコアに関係なく、マップされるパスウェイを知りたい場合は、”Functional Annotation Table” を参照します。

Functional Annotation Chart ウィンドウには、アップロードした遺伝子リスト中の遺伝子を、統計的に有意な割合で含むパスウェイだけが表示されます。 “Term” 中の各パスウェイ名をクリックするとパスウェイが表示されます。

Functional Annotation Table ウィンドウには、アップロードした遺伝子リストのうち、パスウェイデータベースにヒットした遺伝子の一覧が表示されます。各パスウェイ名をクリックするとパスウェイが表示されます。パスウェイの数が多い場合は、ブラウザの検索機能を利用すると便利です。

マップされたパスウェイの例:下図は、”Cell Cycle” のパスウェイにマップされた場合の例です。アップロードした遺伝子リストに含まれていた遺伝子は、星印をつけて表示されます。各遺伝子をクリックすると、遺伝子について詳細な情報を見ることができます。

Reference
Huang et al. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols (2009) vol. 4 (1) pp. 44-57.