log fold-change (=logFC or log ratio) の算出方法の確認(解答)

前投稿の解答です。WT と KO に、それぞれ具体的な値を入れてみると、分かりやすいかもしれません。

たとえば、WT = 128, KO = 256 であったとします。ratio = KO/WT なので、 256/128 = 2 となり、通常の ratio は、2 です。つまり、2倍に増加したことになります。では、logFC では、どうでしょうか?

  1. 先に log2 変換するので、式で書くと、 log2(KO) / log2(WT) となります。log2(256) = 8, log2(128) = 7 なので、logFC = 8/7 = 1.142 ?? 間違いです。
  2. 後で log2 変換するので、式で書くと、 log2(KO/WT) となります。 log2(256/128) = log2(2) = 1 で、正しいです。
  3. log2 変換してから、差をとります。式では、 log2(KO) – log2(WT) となります。log2(256) – log2(128) = 8-7 = 1 で、これも正しいです。
  4. 先に差をとってから、log2 変換するので、 log2(KO – WT) と書けます。log2(256 – 128) = log2 (128) = 7 ?? 間違いです。
  5. WT = 128, KO = 256 なら、logFC = 2 ?? WT = 256, KO = 128 なら logFC = -2 ?? 間違いです。

正解は、 2. と 3. です。どちらの計算方法でもよいのですが、log2変換されていれば、割り算ではないことに注意が必要です。

計算に用いているシグナル値が、log2変換された値 (log2-transformed) なのか、log2変換されていない値 (non-log) かを確認しておきましょう。

 

log fold-change (=logFC or log ratio) の算出方法の確認

log fold-change (= logFC or log ratio) の算出方法の確認です。logFC の算出方法として、正しいのは、次のうちどれでしょうか?正解は2つあります。

wild type (WT) と knock out (KO) の2サンプルのシグナル値を比較するものとします。なお、通常の fold-change (ratio) は、以前に紹介したように割り算ですので、KO を WT で割れば(KO/WT)、WTに比べて、何倍になっているか計算できます。

  1. WT と KO の値をlog2変換して、KO を WT で割る
  2. KO を WT で割ってから、算出された値をlog2変換する。
  3. WT と KO の値をlog2変換して、KO から WT を引く
  4. KO から WT を引いてから、算出された値をlog2変換する。
  5. KO を WT で割る。このとき、ratio > 1 なら、そのまま。ratio < 1 なら、逆に WT を KO で割り、ー(マイナス)の符号を付ける。
 

マイクロアレイ解析のフローチャート1: 発現変動遺伝子の抽出

これまでを振り返り、再度、マイクロアレイ解析の流れについて解説します。

下図にマイクロアレイ解析のフローチャートを示します。まずは、発現変動遺伝子の抽出までの流れです。左側にフローチャートの各ステップで得られるデータの形式を表記しています。右側に各ステップで行われる処理を示しています。

  • (1) ラベリング、ハイブリダイゼーション。
  • (2) スキャン、数値化。
  • (3) 正規化(コントロールを合わせる処理。全体の分布を統計的に合わせるもの (global normalization) が主流。
  • (4) シグナル値の比較。 ratio (fold-change), Z-score, p-value などを算出する。
  • (5) 発現変動遺伝子の抽出。算出された ratio, Z-score, p-value をもとに遺伝子発現が増加減少)した遺伝子をピックアップ。

 

マイクロアレイ解析のフローチャート1: 発現変動遺伝子の抽出
マイクロアレイ解析のフローチャート1: 発現変動遺伝子の抽出

 

ここまでの解析ステップが、マイクロアレイの最も基礎的な解析ステップとなります。このステップで、遺伝子発現が増加減少)した遺伝子群のリストが得られます。しかしながら、変動している遺伝子(発現に差のある遺伝子)が、どれか分かっただけであり、その後の解析が必要です。通常、数百個から数千個の遺伝子が発現変動しています。

解析のステップとして、次に何をすべきでしょうか?

 

増加を ratio > 1.5 で判定したとき、減少は ratio < ??

ratio (=fold-change) > “2” と増加を判定したときは、対応する減少の判定は ratio < “0.5” となるでしょう。では、 ratio > “1.5” と判定したときは、対応する減少の判定は、いくつになるでしょう?

値は 1.5/2 = 0.75 倍になっています。よって、0.5 x 0.75 = 0.375 ???

この話は、log2変換してから (logFC) のほうが分かりやすいかもしれません。「ratio > 2 または ratio < 0.5」 これを logFC にすると次のようになります。

「logFC > 1 または logFC < -1」(絶対値の記号"||"を使うと |logFC| > 1)

ここで “1” は log2(2) です。”-1″ は log2(0.5) ですが、マイナスlog2(2) とも書けます。つまり、log2(1.5) に対応するのは、マイナスlog2(1.5ということです。

logFC の値を ratio に変換 (unlog2) するには、「2のlogFC乗」を計算します。

> 2^1 # 2の1乗は2です。
> 2^(-1) # 2の-1乗は0.5です。

したがって、ratio < ?? に対応する値は、2のマイナスlog2(1.5)乗を計算します。

> 2^(-log2(1.5)) # 0.6666667

答えは ratio < 0.66 です。

 

ratio (fold-change) 1.5 は、 logFC でいくつ?

ratio (fold-change) が 2 のとき、 logFC は “1” です。では、ratio が 1.5 のとき、これは logFC でいうところのいくつなのでしょうか?

これは、ratio の2をlog2変換することで求めることができます。計算は下記のようになります。(統計処理ソフト “R” での計算方法です。)

> log2(2) # 結果は "1" になります。

よって、ratio 1.5 であれば、1.5をlog2変換します。

> log2(1.5) # 結果は "0.5849625" になります。

結果は、0.5849625 なので、logFC では 0.58 となります。(発現変動遺伝子を判定するときに用いるのであれば、少々甘く判定することが多いでしょう。)