MeV の使い方 2. 階層的クラスタリング

Agilent のマイクロアレイデータを想定して、 MeV の操作方法を紹介します。

  1. MeV の起動とファイルの読み込み
  2. 階層的クラスタリング
  3. t-検定

2. 階層的クラスタリング

(1) クラスタリングの方向

ヒートマップのクラスタリングには、比較する方向によって、サンプル(横方向) と、遺伝子(縦方向)の2種類に分けられます。どちらの方向でクラスタリングを行うかは、見たいものによって異なります。似ているサンプルを知りたいときは、サンプル方向でクラスタリングを行います。(がん細胞と正常細胞のデータを比較する場合など。)また、発現パターンの似ている遺伝子を知りたい場合は、遺伝子方向でクラスタリングを行います。(特定の遺伝子に興味があり、その遺伝子と発現パターンの似ている遺伝子を探す場合。)

場合によっては、サンプル、遺伝子の両方向で行うこともあるかもしれません。ただ、サンプルが時系列に並んだタイムコースのデータの場合は、サンプル方向のクラスタリングは行わない方が、発現パターンが分かりやすいと思います。

クラスタリングの方向

(2) 階層的クラスタリング

MeV で階層的クラスタリングを行う方法です。

  • “Clustering” ボタンから “Hierarchical Clustering” を選択。
  • クラスタリングの各オプションは変更しなくてもよい。
階層的クラスタリング

例:クラスタリング結果

  • 左側の “Analysis Results” にクラスタリング結果が作成される。
  • ツリーの計算と結果の色づけ (赤、緑)は、独立した作業。
  • 1色で表示されているのは、log2 変換前のスケールで色づけされているため。(スケールの設定が合っていない。)
例:クラスタリング結果

(3) クラスタリング図の色づけ

クラスタリング図を適切な表示にするには、「色づけ」の作業が必要です。論文などではシグナル値の低い遺伝子を緑色、中間の遺伝子を黒色、高い遺伝子を赤色に色付けされることが多いです。しかしながら、シグナル値がどれくらい低ければ、緑色、どれくらい高ければ赤色という決まりはありません。よって、作者が色付けを定義しなければなりません。MeV では、下記の操作で色づけを定義できます。

  • 1) “Display -> Set Color Scale Limits” を選択。
  • 2) 色付けする Lower Limit, Midpoint Value, Upper Limit を入力

追記:Color Scale Limits ウィンドウ内の Color Range Selection には、 ()内に参考までの値が表示されています。Lower Limit に「最小値」、Midoint Value に「中央値」、Upper Limit に「最大値」が表示されますが、右側のボックスへの入力自体は、ユーザーが行わなければなりません。

クラスタリング図の色づけ

例: 色づけを変更した後のクラスタリング図

色づけを変更した後のクラスタリング図

(4) クラスタリング図の出力

作成したクラスタリング図は、画像ファイルとして出力できます。

  • 1) “File -> Save Image” を選択
  • 2) ファイル名を入力。 (.pngを付ける)
  • 3) 保存形式は、PNG を推奨。
クラスタリング図の出力
 

MeV の使い方 1. (続き)ファイルの読み込み後の操作

ファイル読み込み後の操作方法を説明します。

  • ラベル変更方法
  • グループ名の設定
  • シグナル値の log2 変換

(6) ラベルの表示変更
各プローブにつけられたラベルは、メニューから、”Display -> Gene/Row Labels -> Label by GeneSymbol” などとして変更可能。

*読み込み時に “Automaticaly download” と “Load Annotation” にチェックを入れて、生物種とアレイの製品名を選択すれば、自動的にアノテーションがダウンロードされ、ラベルとして使用できるようになります。すべての製品に対応しているわけではありませんし、ダウンロードされるアノテーションが最新のデータとは限りませんので、表示したいアノテーションは、あらかじめ準備されることを推奨します。

ラベルの表示変更

(7) サンプルのグループ名の設定

  1. Sample Cluster を選択。
  2. サンプルを複数選択。 (連続した領域は、シフトを押しながら複数選択できます。連続していない領域を複数選択する場合は、 Windows は Ctrl キー、 Mac はコマンドキーを押しながら選択します。)
  3. Store Rows as Cluster を選択。
  4. グループ名を入力。
*検定などを行う際は、ここでグループを設定しておくと便利です。ラベルの色も選択して、変更できます。
サンプルのグループ名

設定例: WT と KO の2グループを設定

設定例

(8) シグナル値の log2 変換

  • メニューから、 “Adjust Data -> Log Transformations -> Log2 Transform” を選択。
  • UnLog2 Transform を選択すれば、log2 変換前の値に戻すこともできる。
log2 変換
 

MeV の使い方 1. MeV の起動とファイルの読み込み

Agilent のマイクロアレイデータを想定して、 MeV の操作方法を紹介します。

  1. MeV の起動とファイルの読み込み
  2. 階層的クラスタリング
  3. t-検定

(1) MeV の起動

  • MeV を起動するとメインのメニューバーと、ビューワーの2つのウィンドウが表示される。
  • 複数のビューワーを開く場合は、メニューバーから操作する。解析は、ビューワーで行う。
MeV の起動

 

(2) ファイルの読み込み (Expression File Loader)

  • ビューワーのメニューから、 “File -> Load Data” と選択する。
  • Expression File Loader のウィンドウが表れる。
ファイルの読み込み
(3) 読み込ませるファイルの形式
  • Affymetrix のデータの場合は、 GCOS や Bioconductor で処理された MAS5 や RMA の結果を読み込ませることができる。
  • Agilent, Illumina, その他のアレイデータの形式であっても、タブ区切りのテキストファイルの形式であれば、読み込ませることができる。
  • 1列目が ProbeID、2列目から遺伝子名などのアノテーション(複数列も可能)、アノテーションの次から最後の列までサンプルのシグナル値を並べる。
ファイルの形式

*マイクロアレイデータがエクセルで開けるのであれば、タブ区切りのテキストファイルは、エクセルから「名前を付けて保存」などで保存形式(フォーマット)を「タブ区切りテキスト(.txt)」と指定すれば出力できます。

(4) ファイルの読み込み
  • 1) Browse ボタンからファイルを選択。
  • 2) Single-Color Array を選択。
  • 3) 生物種とアレイを選択。
  • 4) シグナル値の先頭を選択。
ファイルの読み込み
(5) 読み込み後の画面
  • 読み込みが終わるとヒートマップが表示される。
読み込み後の画面
 

MeV の入手方法と主な機能

MeV の入手方法

MeV のウェブサイト (SorceForge) よりダウンロード

MeV の主な機能
  • log2変換などの簡単な計算。
  • クラスタリング図(ヒートマップ図)の作成。
  • t-検定、Significance Analysis of Microarrays (SAM) などの統計解析。
  • Gene Set Enrichment Analysis(GSEA), the Expression Analysis Systematic Explorer(EASE) などの機能解析。