繰り返し実験のばらつき(2)

前回は、同じ条件のサンプルを散布図で比較した例を紹介しました。同じデータを MA プロットでも見てみましょう。(見方は、こちらその続きを参照してください。)

繰り返しサンプルのMAプロット。シグナル値が低い部分で変動しているように見える。
繰り返しサンプルのMAプロット。シグナル値が低い部分で変動しているように見える。縦軸、横軸とも対数目盛りで表示。

ほとんどの遺伝子が、 0.5 < ratio < 2 の区間 (-1 < M < 1 の区間) に分布しています。つまり、発現変動していないように見えます(黒い部分)。

一方、一部の遺伝子は、 ratio = 2 または、 ratio = 0.5 のライン(赤線)を超えていることも確認できます。よく見ると、これらの遺伝子は、シグナル値の低い部分に多く見られることが分かります。図ではに色づけされた遺伝子が3300個ほどありますが、このうち、2サンプルのシグナル値の平均値が100以下のものが3100個ほどです。(例えば、WT1=50, WT2=100 で、ratio = 2 のものなど) 続きを読む 繰り返し実験のばらつき(2)

 

MA プロット(シグナル値の高低と ratio の関係)

通常、MAプロットは、log2変換された値を用いて示されます。

MA プロット。縦軸(M)、横軸(A)とも、log2変換された値。
MA プロット。縦軸(M)、横軸(A)とも、log2変換された値。

見慣れないというかたは、次の対数目盛り(2のべき乗)の結果と見比べてみてください。

目盛りを、対数目盛り(2の倍数)で表示した MA プロット図。
目盛りを、対数目盛り(2のべき乗)で表示した MA プロット図。

M = 0 のところが、2の0乗、すなわち、ratio = 1です。また、A = 10 は、2の10乗、すなわち、 1024です。赤い部分は、 ratio > 2 の遺伝子です。青い部分は、 ratio < 0.5 の遺伝子です。

プロット図の左に行くほど、シグナル値は低く、右に行くほど、シグナル値は高いです。赤い部分または青い部分を見ると、大きく変動している遺伝子が多いように見えますが、それらのほとんどが、シグナル値の低い部分に集中していることが実感できるのではないでしょうか?(シグナル値の平均値が 32 以下。)

シグナル値の高低と、ratio の関係。
シグナル値の高低と、ratio の関係。
 

簡易的な上流解析(転写因子を探す)

発現変動遺伝子を確認後、上流解析を行うためには、代謝経路やシグナル伝達系など、一般的なパスウェイ(カノニカルパスウェイ)以外に、タンパク間相互作用 (PPI) や、遺伝子発現制御(転写制御)、共発現文献情報などが必要となります(前回までの記事を参照)。

それらの上流解析に利用できる情報は、無料で入手しやすいものから、そうでないものもあります。もし、敷居が高いと感じられるのであれば、簡易的に上流解析を行うことを考えてはいかがでしょうか。

続きを読む 簡易的な上流解析(転写因子を探す)

 

マイクロアレイ解析のフローチャート1: 発現変動遺伝子の抽出

これまでを振り返り、再度、マイクロアレイ解析の流れについて解説します。

下図にマイクロアレイ解析のフローチャートを示します。まずは、発現変動遺伝子の抽出までの流れです。左側にフローチャートの各ステップで得られるデータの形式を表記しています。右側に各ステップで行われる処理を示しています。

  • (1) ラベリング、ハイブリダイゼーション。
  • (2) スキャン、数値化。
  • (3) 正規化(コントロールを合わせる処理。全体の分布を統計的に合わせるもの (global normalization) が主流。
  • (4) シグナル値の比較。 ratio (fold-change), Z-score, p-value などを算出する。
  • (5) 発現変動遺伝子の抽出。算出された ratio, Z-score, p-value をもとに遺伝子発現が増加減少)した遺伝子をピックアップ。

 

マイクロアレイ解析のフローチャート1: 発現変動遺伝子の抽出
マイクロアレイ解析のフローチャート1: 発現変動遺伝子の抽出

 

ここまでの解析ステップが、マイクロアレイの最も基礎的な解析ステップとなります。このステップで、遺伝子発現が増加減少)した遺伝子群のリストが得られます。しかしながら、変動している遺伝子(発現に差のある遺伝子)が、どれか分かっただけであり、その後の解析が必要です。通常、数百個から数千個の遺伝子が発現変動しています。

解析のステップとして、次に何をすべきでしょうか?