なんとなく、理解したつもりでいても、意外と分かりにくいのが、ヒートマップの色とシグナル値の関係です。マイクロアレイのイメージの誤解でも述べたように、赤と緑は、2色法の色素の色ではありませんし、シグナル値そのものの強弱を示したものでもありません(大抵の場合)。
また、「どの程度の高さのシグナル値を何色にするか」は、それぞれの研究者が決めなければなりません。(絶対にコレ、という決まりがありません。)
実際に、色づけを行うつもりで、考えてみましょう。シグナル値の低い部分を緑に、高い部分を赤にするのが意外と難しいことが分かります。
色づけの例
下図のような遺伝子Aがあったとします。WTとKOの2群 (n=3) のサンプルがあります。これをヒートマップにしたいので、シグナル値の低いところを緑、高いところを赤に塗りたいと思います。
例えば、 シグナル値 (x) が 50より低い (x < 50) ときは緑、50より高い (50 < x) ときは赤に塗ると定義します。すると、WTは緑に、KOは赤に色付けされることになります。これはイメージ通りでしょう。
色づけの問題点
では、遺伝子 B も同時に色付けすることを考えましょう。下図のように、遺伝子 B は、1000から2000の間に分布しています。これを遺伝子 A と同様の条件で、色づけすると、どうでしょう。これは、イメージ通りの結果といえるでしょうか?
マイクロアレイのデータは、低いものは、10ほどの値を取りますが、高いものは数十万の値となります。したがって、色づけの条件を低いシグナル値に合わせると、高い遺伝子の変化が見えず、逆に高い遺伝子に合わせると、低い遺伝子の変化が見えないことになります。
遺伝子1個ずつ(=1行ずつ)、色づけの条件を設定するわけにはいかないので、何か対処が必要です。