クラスタリング (MeV, k-means クラスタリング)

遺伝子の変動パターンを分類するには、クラスタリングが用いられます。MeV を用いて、クラスタリングの手法の1つである k-means を使った例を紹介します。

クラスタリング手法の選択

MeV でデータを読み込み、クラスタリング手法(アルゴリズム)を選択します。(ここでは、クラスタリングの前に、log2変換と中央値からの距離に直す補正を行っています。操作方法はこちら

クラスタリング手法を選択。
クラスタリング手法を選択。

パラメーターの設定

ダイアログが表示されるので、パラメーターを設定します。ここでは、変動パターンで分類したいため、遺伝子方向のみのクラスタリングを行います。(似ているサンプルを探すのなら、サンプル方向にクラスタリングします。)

クラスターをいくつに分けるか指定します。標準では10個の設定です。

また、結果を見やすくするため、さらに階層的クラスタリングで処理するチェックを入れます。

K-means クラスタリングのパラメーターを設定。
K-means クラスタリングのパラメーターを設定。

結果の表示用の階層的クラスタリングのパラメーターを設定します。同様に遺伝子方向のみ指定しています。また、最適化のオプションにチェックを入れています。ほかのパラメーターは標準設定のものを使用しました。

階層的クラスタリングのパラメーターを設定。
階層的クラスタリングのパラメーターを設定。

結果の表示

ウィンドウの左側の結果をたどると、変動パターン10個に分けられた各クラスターのヒートマップを確認できます。

10個のクラスターのヒートマップ。
10個のクラスターのヒートマップ。

また、 Expression Graphs を選択すると、各クラスターに含まれている遺伝子の折れ線グラフが表示されます。各クラスターに含まれている遺伝子の数もここでチェックできます。

各クラスターに含まれている遺伝子の変動パターンの折れ線グラフ。
各クラスターに含まれている遺伝子の変動パターンの折れ線グラフ。
 

投稿者:

Atsushi Doi

株式会社セルイノベーター 取締役、研究開発部部長。理学博士。山口大学大学院理工学研究科修了。東京大学医科学研究所ヒトゲノム解析センターの特任助手を経て、株式会社GNIに主任研究員として勤務。その後、株式会社セルイノベーターの立ち上げに参加し、現在に至る。専門は、バイオインフォマティクス、おもにシステムバイオロジー。

「クラスタリング (MeV, k-means クラスタリング)」への1件のフィードバック

コメントを残す