クラスタリング結果の反転 (MeV)

MeV でクラスタリング図を作成した際に、ツリーの左右が入れ替わってほしいことがあります。例えば、下図のような結果になったとして、左側に緑色(減少している遺伝子)、右側に赤色(増加している遺伝子)になっていたほうがよかったとします。

clustering result
クラスタリングの結果の例。

(1) 表示を入れ替えるには、まず、入れ替えたいツリーをクリックして選択します。ツリーの選択された部分は、ピンクにハイライトされます。

select tree
ツリーの選択。

(2) ツリーが選択された状態で、ツリーを右クリックすると、メニューが表示されます。そのメニューから、 “Rotate Selected Node” を選びます。

rotate selected node
右クリックメニューから選択。

これで表示が反転された結果が得られます。

rotate result
反転された結果。

ただし、あくまで見た目の問題であることにご注意ください。ツリーの計算結果をコントロールする処理ではありません。

 

MeV の使い方 3. t-検定(続き)

例:t-検定の結果

  • 左側の “Analysis Results” に “T Tests” の結果が表示される。
  • “Significant Genes” に含まれる遺伝子群が、 t-検定の結果、有意となった遺伝子群。(標準の設定では、p-value < 0.01 で有意。0.01 または 0.05 を用いることが多い。)
  • サンプルデータの場合、有意となる遺伝子はない。すべての有意でない遺伝子は、 Non-significant Genes に表示される。

 

例:t-検定の結果

 

3.(3) 検定結果の色づけ

  • 現在の色づけは、他の遺伝子と比べている(図の赤枠)。遺伝子AとBが遺伝子Cより低いため、遺伝子AとBがになり、遺伝子Cがになっている。
  • 他のサンプルと比べて、シグナルの高いところは、低いところはになって欲しい。図に青枠で示されたように、遺伝子Cの6サンプル間での差を見たい。
  • 色づけのための調整が必要。調整の手段は、いろいろ考えられる。各遺伝子の中央値からの距離に変換してもよいし、各遺伝子の平均値からの距離(SD何個分か)に変換してもよい。ここでは、簡単な方法として、各遺伝子の中央値からの距離に変換する方法を紹介する。

 

推定結果の色づけ

3.(4) 遺伝子ごとの中央値からの距離を求める

1) “Adjust Data -> Gene/Row Adjustments -> Median Center Genes/Rows” を選択。 この処理は取り消すことができないので注意。元のシグナル値やほかの調整を行うには、データの読み込みから、すべての作業をやり直す必要がある。

2) 再度、“Display -> Set Color Scale Limits” を選択し、色づけのスケーリングを合わせる。

  • Lower Limit = -2
  • Midpoint Value = 0
  • Upper Limit = 2

*色の濃さは適宜、調節可能。中央値からの距離の場合、Midpoint Value は、0 以外を用いることはない。Lower = -1 , Upper Limit = 1 のように低く設定すると、色が濃くなり強調された状態となる。あまり、低い値を設定すると、どの遺伝子の差も大きいような誤解を与えるので注意。

 

遺伝子ごとの中央値からの距離
スケーリング後、再度、色づけをやり直した結果

 

3.(5) t-検定結果の保存

クラスタリング図を右クリックして出るメニューから、 “Save cluster…” を選択すると、画像ファイルとして結果を保存できる。

t-検定結果の保存
 

MeV の使い方 3. t-検定

Agilent のマイクロアレイデータを想定して、 MeV の操作方法を紹介します。

  1. MeV の起動とファイルの読み込み
  2. 階層的クラスタリング
  3. t-検定

3. t-検定

t-検定により、WT vs KO で差のある遺伝子を求める。

(1) 検定方法の選択

  • “Statistics” ボタンから “t Tests” を選択。
検定方法の選択

(2)  t-検定のパラメーター

検定を行った上で、有意な差を持つ遺伝子群のクラスタリング図を作成。

  • 1) “Between subjects” タブを選択。
  • 2) “Cluster Selection” タブを選択。
  • 3) 2つのグループに割り当てる。
  • 4) “Hierarchical Clustering” タブを選択。”Construct Hierarchical Trees for:” にチェックを入れる。
t-検定のパラメーター

続きます。

 

 

MeV の使い方 2. 階層的クラスタリング

Agilent のマイクロアレイデータを想定して、 MeV の操作方法を紹介します。

  1. MeV の起動とファイルの読み込み
  2. 階層的クラスタリング
  3. t-検定

2. 階層的クラスタリング

(1) クラスタリングの方向

ヒートマップのクラスタリングには、比較する方向によって、サンプル(横方向) と、遺伝子(縦方向)の2種類に分けられます。どちらの方向でクラスタリングを行うかは、見たいものによって異なります。似ているサンプルを知りたいときは、サンプル方向でクラスタリングを行います。(がん細胞と正常細胞のデータを比較する場合など。)また、発現パターンの似ている遺伝子を知りたい場合は、遺伝子方向でクラスタリングを行います。(特定の遺伝子に興味があり、その遺伝子と発現パターンの似ている遺伝子を探す場合。)

場合によっては、サンプル、遺伝子の両方向で行うこともあるかもしれません。ただ、サンプルが時系列に並んだタイムコースのデータの場合は、サンプル方向のクラスタリングは行わない方が、発現パターンが分かりやすいと思います。

クラスタリングの方向

(2) 階層的クラスタリング

MeV で階層的クラスタリングを行う方法です。

  • “Clustering” ボタンから “Hierarchical Clustering” を選択。
  • クラスタリングの各オプションは変更しなくてもよい。
階層的クラスタリング

例:クラスタリング結果

  • 左側の “Analysis Results” にクラスタリング結果が作成される。
  • ツリーの計算と結果の色づけ (赤、緑)は、独立した作業。
  • 1色で表示されているのは、log2 変換前のスケールで色づけされているため。(スケールの設定が合っていない。)
例:クラスタリング結果

(3) クラスタリング図の色づけ

クラスタリング図を適切な表示にするには、「色づけ」の作業が必要です。論文などではシグナル値の低い遺伝子を緑色、中間の遺伝子を黒色、高い遺伝子を赤色に色付けされることが多いです。しかしながら、シグナル値がどれくらい低ければ、緑色、どれくらい高ければ赤色という決まりはありません。よって、作者が色付けを定義しなければなりません。MeV では、下記の操作で色づけを定義できます。

  • 1) “Display -> Set Color Scale Limits” を選択。
  • 2) 色付けする Lower Limit, Midpoint Value, Upper Limit を入力

追記:Color Scale Limits ウィンドウ内の Color Range Selection には、 ()内に参考までの値が表示されています。Lower Limit に「最小値」、Midoint Value に「中央値」、Upper Limit に「最大値」が表示されますが、右側のボックスへの入力自体は、ユーザーが行わなければなりません。

クラスタリング図の色づけ

例: 色づけを変更した後のクラスタリング図

色づけを変更した後のクラスタリング図

(4) クラスタリング図の出力

作成したクラスタリング図は、画像ファイルとして出力できます。

  • 1) “File -> Save Image” を選択
  • 2) ファイル名を入力。 (.pngを付ける)
  • 3) 保存形式は、PNG を推奨。
クラスタリング図の出力
 

MeV の使い方 1. (続き)ファイルの読み込み後の操作

ファイル読み込み後の操作方法を説明します。

  • ラベル変更方法
  • グループ名の設定
  • シグナル値の log2 変換

(6) ラベルの表示変更
各プローブにつけられたラベルは、メニューから、”Display -> Gene/Row Labels -> Label by GeneSymbol” などとして変更可能。

*読み込み時に “Automaticaly download” と “Load Annotation” にチェックを入れて、生物種とアレイの製品名を選択すれば、自動的にアノテーションがダウンロードされ、ラベルとして使用できるようになります。すべての製品に対応しているわけではありませんし、ダウンロードされるアノテーションが最新のデータとは限りませんので、表示したいアノテーションは、あらかじめ準備されることを推奨します。

ラベルの表示変更

(7) サンプルのグループ名の設定

  1. Sample Cluster を選択。
  2. サンプルを複数選択。 (連続した領域は、シフトを押しながら複数選択できます。連続していない領域を複数選択する場合は、 Windows は Ctrl キー、 Mac はコマンドキーを押しながら選択します。)
  3. Store Rows as Cluster を選択。
  4. グループ名を入力。
*検定などを行う際は、ここでグループを設定しておくと便利です。ラベルの色も選択して、変更できます。
サンプルのグループ名

設定例: WT と KO の2グループを設定

設定例

(8) シグナル値の log2 変換

  • メニューから、 “Adjust Data -> Log Transformations -> Log2 Transform” を選択。
  • UnLog2 Transform を選択すれば、log2 変換前の値に戻すこともできる。
log2 変換