マイクロアレイ解析のフローチャート2: Next step

発現変動遺伝子の抽出後、まず、必要なことは、増加減少した遺伝子(発現変動遺伝子)が、どのような遺伝子であるかを分析することです。この方法は、大きく分けて、次の2通りの方法のいずれかを用います。

A. (生物学的な)機能で見る。

B. 発現変動のパターンで見る。

 

マイクロアレイ解析のフローチャート2: Next step
マイクロアレイ解析のフローチャート2: Next step

A. (生物学的な)機能で見る

何系の遺伝子が多いのかを見ます。(膜タンパク?転写因子?EMT関連遺伝子?薬剤耐性遺伝子?脂質代謝?) これに該当する解析が、GO解析DAVIDなどを使用)です。

B. 発現変動のパターンで見る

特定の注目する遺伝子に似た変動パターンの遺伝子を探します。また、どのサンプルの変動パターンが似ているかを見ます。(MDM4といっしょに増減した遺伝子はどれ?健常者に近いサンプルはどれ?) これに該当する解析が、クラスタリング(k-means, SOM)、ヒートマップです。

 

このA., B. の2通りの解析は、独立したものではなく、また、それだけでは終わりません。GO解析の結果をさらにヒートマップで表示して、発現変動変動のパターンを確認するケース(A. –> B.)や、特定の発現変動パターンの遺伝子を選択して、その機能をGO解析で確認するケース(B. –> A.) が通常です。それぞれの解析を単独で行っても効果的ではありません。(セルイノベーターの解析サービスでは、初めからこれらの解析サービスを含めて提供しています。)

解析はさらに続きます

 

さらに続く解析。A. から B. や、B. の後に A. を行って遺伝子群を絞り込む。
さらに続く解析。A. から B. や、B. の後に A. を行って遺伝子群を絞り込む。

最終的にマイクロアレイ解析の結果として、「特定の(生物学的な)機能を持ち、かつ、特定の発現変動パターンを示した遺伝子群」が得られます。(数十個から数 百個の遺伝子)

最終的に得られる遺伝子群。
最終的に得られる遺伝子群。
 

MeV のヒートマップの余白を減らす

MeV でヒートマップを作成した際に、保存した画像ファイルの右側に大きく余白が生じてしまうことがないでしょうか?これは画像のサイズが、MeVのウィンドウの大きさの影響を受けているために生じた余白です。

対処方法としては、あらかじめ、ウィンドウの大きさを小さくしてから(全体が表示されない程度に)、画像の保存を行います。

ヒートマップを保存した画像の右側に生じた余白。
ヒートマップを保存した画像の右側に生じた余白。

対処方法:ウィンドウサイズを小さくします。MeVのウィンドウの右下をドラッグして、サイズを調節します。右側に余白が表示されないようにウィンドウの幅を調節してください。

MeVのウィンドウの幅を調節。
MeVのウィンドウの幅を調節。

ヒートマップの画像の全体が表示されない程度に、ウィンドウを小さくしてから、 File –> Save Image を選んで、ヒートマップを保存します。

ウィンドウ幅を調節してからヒートマップを保存。
ウィンドウ幅を調節してからヒートマップを保存。

 

 

クラスタリング結果の反転 (MeV)

MeV でクラスタリング図を作成した際に、ツリーの左右が入れ替わってほしいことがあります。例えば、下図のような結果になったとして、左側に緑色(減少している遺伝子)、右側に赤色(増加している遺伝子)になっていたほうがよかったとします。

clustering result
クラスタリングの結果の例。

(1) 表示を入れ替えるには、まず、入れ替えたいツリーをクリックして選択します。ツリーの選択された部分は、ピンクにハイライトされます。

select tree
ツリーの選択。

(2) ツリーが選択された状態で、ツリーを右クリックすると、メニューが表示されます。そのメニューから、 “Rotate Selected Node” を選びます。

rotate selected node
右クリックメニューから選択。

これで表示が反転された結果が得られます。

rotate result
反転された結果。

ただし、あくまで見た目の問題であることにご注意ください。ツリーの計算結果をコントロールする処理ではありません。

 

MeV の使い方:MeV を用いたクラスターの選択と出力

MeV では、クラスタリングした結果から、任意のクラスターを選択し、その選択されたクラスターに含まれる遺伝子群をリストとして出力できます。

クラスターの選択

クラスタリングの結果を表示したヒートマップ上で、任意のクラスターの選択が可能です。ここでは、WTで低く、KOで高い遺伝子群を含むクラスターを選択する例を示します。

ヒートマップの左側には、クラスターの関係を表したツリーが表示されています。このツリーをクリックすることで、任意のクラスターの選択を行います。クリックするツリーの場所(分岐点)により、選択されるクラスターが決定されます。選択されたツリーは、ハイライトされます。また、選択されなかったクラスターは、表示が薄くなります。

クラスターの選択

クラスターの出力

クラスターを選択した状態で、ツリーを「右クリック」し、表示されるメニューから、「Save cluster…」を選択することで、その選択されたクラスターに含まれる遺伝子群をリストとして出力できます。出力されるファイルは、タブ区切りのテキストファイルの形式です。保存するファイルの名前に拡張子(.txt)を含めるようにしてください。出力された遺伝子リストに含まれるシグナル値の値は、MeV で処理された後の値になります。ここでは、ヒートマップ用の色づけを行っているため、log2変換し、中央値からの距離に変換された値となります。

クラスターの出力
 

MeV の使い方 3. t-検定(続き)

例:t-検定の結果

  • 左側の “Analysis Results” に “T Tests” の結果が表示される。
  • “Significant Genes” に含まれる遺伝子群が、 t-検定の結果、有意となった遺伝子群。(標準の設定では、p-value < 0.01 で有意。0.01 または 0.05 を用いることが多い。)
  • サンプルデータの場合、有意となる遺伝子はない。すべての有意でない遺伝子は、 Non-significant Genes に表示される。

 

例:t-検定の結果

 

3.(3) 検定結果の色づけ

  • 現在の色づけは、他の遺伝子と比べている(図の赤枠)。遺伝子AとBが遺伝子Cより低いため、遺伝子AとBがになり、遺伝子Cがになっている。
  • 他のサンプルと比べて、シグナルの高いところは、低いところはになって欲しい。図に青枠で示されたように、遺伝子Cの6サンプル間での差を見たい。
  • 色づけのための調整が必要。調整の手段は、いろいろ考えられる。各遺伝子の中央値からの距離に変換してもよいし、各遺伝子の平均値からの距離(SD何個分か)に変換してもよい。ここでは、簡単な方法として、各遺伝子の中央値からの距離に変換する方法を紹介する。

 

推定結果の色づけ

3.(4) 遺伝子ごとの中央値からの距離を求める

1) “Adjust Data -> Gene/Row Adjustments -> Median Center Genes/Rows” を選択。 この処理は取り消すことができないので注意。元のシグナル値やほかの調整を行うには、データの読み込みから、すべての作業をやり直す必要がある。

2) 再度、“Display -> Set Color Scale Limits” を選択し、色づけのスケーリングを合わせる。

  • Lower Limit = -2
  • Midpoint Value = 0
  • Upper Limit = 2

*色の濃さは適宜、調節可能。中央値からの距離の場合、Midpoint Value は、0 以外を用いることはない。Lower = -1 , Upper Limit = 1 のように低く設定すると、色が濃くなり強調された状態となる。あまり、低い値を設定すると、どの遺伝子の差も大きいような誤解を与えるので注意。

 

遺伝子ごとの中央値からの距離
スケーリング後、再度、色づけをやり直した結果

 

3.(5) t-検定結果の保存

クラスタリング図を右クリックして出るメニューから、 “Save cluster…” を選択すると、画像ファイルとして結果を保存できる。

t-検定結果の保存