マイクロアレイデータの解析例 2.5 (CD抗原、転写因子でクラスタリング、ヒートマップ)

前回に続いて、生物学的な機能で抽出した遺伝子群をクラスタリングして、ヒートマップで表示する例です。

CD抗原でクラスタリング、ヒートマップ

もし、CD抗原の遺伝子をクラスタリングして、iPS細胞の株とがん細胞でクラスターが分かれるようであれば、うまく標識して区別するのに使えるかもしれません。

アノテーションをもとに、CD抗原の遺伝子を抽出して、クラスタリングした結果を示します。

CD抗原でクラスタリング、ヒートマップで表示。
CD抗原でクラスタリング、ヒートマップで表示。

大まかではありますが、クラスターは、iPS細胞とがん細胞で分かれるようです。しかしながら、明確にがん細胞だけに共通に発現している抗原は難しいようです。CD84などを含む一番上のクラスターでは、がん細胞においても2グループに分かれているように見えます。また、いずれの CD 抗原も iPS 細胞の株において、ところどころ赤くなっている(発現が高い)部分があります。

CD200 は、がん細胞では発現が低いように見えます。いくつかの抗原を組み合わせれば、評価できるかもしれません。(CD97の発現が高い、かつ、CD200の発現が低いなど。)

なお、マイクロアレイデータは、mRNA のレベルの結果なので、CD抗原がタンパクレベルで発現しているかどうかは、別途チェックする必要があります。

転写因子でクラスタリング、ヒートマップ

「iPS細胞とがん細胞の間で変動している遺伝子を制御している遺伝子」を探すのであれば、転写因子でクラスタリングしてみるのはどうでしょうか。

転写因子をクラスタリングして、ヒートマップで表示。
転写因子をクラスタリングして、ヒートマップで表示。

ほかの機能で抽出した遺伝子群の場合と同様に、転写因子を抽出してクラスタリングした結果も、iPS細胞とがん細胞で分かれるようです。同じ変動パターンを示すのであれば、転写を制御している可能性は示せるかもしれません。ただ、転写遺伝子の数としては、2000個程度ありますので、マイクロアレイデータだけから候補を絞り込むのは大変かもしれません。

参考

  • 転写因子のヒートマップの拡大図
 

転写因子を抽出(GOを使って)

マイクロアレイ解析の結果、発現が変動した遺伝子のうち、転写因子を抽出するには、どうすればよいでしょうか?

発現変動遺伝子のリストがエクセルの形式であるならば、アノテーションのうち、GOを検索する方法が考えられます。

何を選ぶ?

では、転写因子を抽出するには、どの GO を選べばよいでしょうか?これは意外に難しい問題でもあります。

まず、どのような用語が GO に登録されているか、AmiGOで探してみます。AmiGOを “transcription facotr” で検索すると、223個もの用語がヒットします。

AmiGO を "transcription factor" で検索した結果。
AmiGO を “transcription factor” で検索した結果。

続きを読む 転写因子を抽出(GOを使って)

 

NF-kB のターゲットとなる遺伝子を調べるには?

マイクロアレイ解析の結果、確認したくなるのは、特定の生物学的な機能を持った遺伝子の変動パターン(増加したか減少したか)だと思います。この特定の機能を持った遺伝子のリストは、GOなどのアノテーションを見れば分かる場合もありますが、そうでない場合もあります。

例えば、転写因子である NF-kB のターゲットとなる遺伝子(制御される遺伝子、下流の遺伝子)は、アノテーションの情報からは知ることができません。このような場合では、インターネット上に公開された情報が役立つことがあります。

続きを読む NF-kB のターゲットとなる遺伝子を調べるには?

 

簡易的な上流解析(転写因子を探す)

発現変動遺伝子を確認後、上流解析を行うためには、代謝経路やシグナル伝達系など、一般的なパスウェイ(カノニカルパスウェイ)以外に、タンパク間相互作用 (PPI) や、遺伝子発現制御(転写制御)、共発現文献情報などが必要となります(前回までの記事を参照)。

それらの上流解析に利用できる情報は、無料で入手しやすいものから、そうでないものもあります。もし、敷居が高いと感じられるのであれば、簡易的に上流解析を行うことを考えてはいかがでしょうか。

続きを読む 簡易的な上流解析(転写因子を探す)