ヒートマップの色づけ (1): そのまま色づけ

なんとなく、理解したつもりでいても、意外と分かりにくいのが、ヒートマップの色とシグナル値の関係です。マイクロアレイのイメージの誤解でも述べたように、は、2色法の色素の色ではありませんし、シグナル値そのものの強弱を示したものでもありません(大抵の場合)。

また、「どの程度の高さのシグナル値を何色にするか」は、それぞれの研究者が決めなければなりません。(絶対にコレ、という決まりがありません。)

実際に、色づけを行うつもりで、考えてみましょう。シグナル値の低い部分をに、高い部分をにするのが意外と難しいことが分かります。 

色づけの例

下図のような遺伝子Aがあったとします。WTとKOの2群 (n=3) のサンプルがあります。これをヒートマップにしたいので、シグナル値の低いところを、高いところをに塗りたいと思います。

ヒートマップの色づけ。遺伝子Aを色づけ。
ヒートマップの色づけ。遺伝子Aを色づけ。

例えば、 シグナル値 (x) が 50より低い (x < 50) ときは緑、50より高い (50 < x) ときは赤に塗ると定義します。すると、WTはに、KOはに色付けされることになります。これはイメージ通りでしょう。

色づけの問題点

では、遺伝子 B も同時に色付けすることを考えましょう。下図のように、遺伝子 B は、1000から2000の間に分布しています。これを遺伝子 A と同様の条件で、色づけすると、どうでしょう。これは、イメージ通りの結果といえるでしょうか?

遺伝子Bを遺伝子Aと同じ条件で色づけ。
遺伝子Bを遺伝子Aと同じ条件で色づけ。

マイクロアレイのデータは、低いものは、10ほどの値を取りますが、高いものは数十万の値となります。したがって、色づけの条件を低いシグナル値に合わせると、高い遺伝子の変化が見えず、逆に高い遺伝子に合わせると、低い遺伝子の変化が見えないことになります。

遺伝子1個ずつ(=1行ずつ)、色づけの条件を設定するわけにはいかないので、何か対処が必要です。

 

投稿者:

Atsushi Doi

株式会社セルイノベーター、主任研究員。理学博士。山口大学大学院理工学研究科修了。東京大学医科学研究所ヒトゲノム解析センターの特任助手を経て、株式会社GNIに主任研究員として勤務。その後、株式会社セルイノベーターの立ち上げに参加し、現在に至る。専門は、バイオインフォマティクス、おもにシステムバイオロジー。

コメントを残す

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください