マイクロアレイに限らず、遺伝子発現データを視覚化する手法として、ヒートマップが使われます。遺伝子発現の高いところが「赤」、遺伝子発現の低いところが「緑」というイメージを持たれている方が多いと思います。
では、ヒートマップの「黒」は何を意味しているでしょうか?
多くのケースでは、「遺伝子が発現していない」ではありません。遺伝子発現が真ん中程度、つまり、「高くも低くもない」を意味しています。
また、「遺伝子発現が高い」と言った時に、何より高いのでしょうか?
これもコントロールより高いケースもあれば、全体の平均値より高い、全体の中央値より高いなど、一概に言えません。
ヒートマップの色が何を意味しているかは、図のキャプションやレジェンドに書かれています。また、どのくらい高いと赤になり、どのくらい低いと緑になるか、という情報もスケールバーで示されているはずです。必ず確認するようにしましょう。
何をどの色で示すかは、論文で主張したいことに応じて、ヒートマップの作者が決めることです。
ヒートマップの色づけ
- ヒートマップの色づけ(1): シグナル値をそのまま色づけしたらどうなるか?
- ヒートマップの色づけ(2): ratio (fold-change) を色づけしたらどうなるか?
- ヒートマップの色づけ(3): シグナル値をlog変換して色づけしたらどうなるか?
- ヒートマップの色づけ(4): 凡例(legend)の表示。
- ヒートマップの色づけ(5): 中央値からの距離に変換して色づけ。
- ヒートマップの色づけ(6): 中央値からの距離とシグナル値の関係。
MeV を用いたヒートマップの作成
- MeV でヒートマップを作成: 検定してから色づけする場合。
MeV の場合、自動的に結果がヒートマップで表示されてしまうため、分かりにくいかもしれませんが、ヒートマップの色づけと、検定の計算は全く独立の処理です。ヒートマップを書いてから検定するわけではありません。有意差があるからといって、ヒートマップが綺麗に分かれて見えるとも限りません。綺麗に見えるように色づけする必要があります。(場合によっては、シグナル値や ratio ではなく、p-value を -log10 変換して用いることもあります。)
同様に、クラスタリングとヒートマップの作成も独立の処理です。ヒートマップを作成しなくても、クラスタリング処理だけ行いツリーをかけます。
ヒートマップの作成例