基礎(3) マイクロアレイの数値化後のデータ

  • 一般的に、1 プローブに対して、シグナル値フラグが存在する。
  • フラグは、A = Absent,  M = Marginal,  P = Present の3種類。Pは検出されたことを意味する。Aは未検出(欠損)を表し、Mは、PとAの境界を意味する。すべてのサンプルにおいて、フラグ A を示したプローブのシグナル値は解析に使用しない。

Illumina は、Flag の代わりに Detection_P という値がある。

Detection_P < 0.01 で検出。

 

基礎(2) マイクロアレイデータの数値化

  • 数値化は、ソフトウェアやプログラムを使って行います。各アレイメーカーごとにソフトウェアが異なります。また、フリーのソフトウェアとして、Bioconductor* (統計処理ソフトウェア “R”** のパッケージ)を使用できます。数値化後のデータは、rawデータ (or なまデータ)とも呼ばれます。
  • Affymetrix社 : GCOS, Expression ConsoleTM (正規化も同時に行える), Affymetrix Power Tool (APT)
  • Agilent社 : Feature Extraction または GeneSpring (正規化とその後の解析も行える)
  • Illumina社 : GenomeStudio (出力結果は 1 プローブに 1 個のシグナル値の形式)

*http://www.bioconductor.org/

**http://www.r-project.org/

 

基礎(1) マイクロアレイデータ解析の流れ

マイクロアレイの基礎として、解析の流れから、シグナル値の扱い方を解説します。


  • 数値化:スキャナーから出力された値をバックグラウンドの値などを考慮して数値化する。1 サンプルあたり、1 プローブに 1 個のシグナル値が得られる。
  • 正規化:複数のサンプル間でシグナル値の補正を行う。平均値や分散が近い値になる。
  • 比較:シグナル値から、ratio(=fold-change) や Z-score を算出する。発現に変化のあった遺伝子(発現変動遺伝子)を抽出する。

マイクロアレイデータの数値化に続きます。