よくある疑問・質問 (2): クラスタリングの結果、何パターンに分類できますか?

遺伝子が発現変動した結果、まず、どのような変動パターンを示す傾向にあるのか気になるのは、もっともなことだと思います。変動パターンを分類するために、クラスタリングを用いるのは正しいです。

Q: クラスタリングの結果、変動パターンは、何パターンに分類できますか?

 

A: 何パターンにも分類できます。

答えになっていないように思われるかもしれません。確かに、解析例1のデータは、 K-means クラスタリングの結果、10個の変動パターンに分類されました。

各クラスターに含まれている遺伝子の変動パターンの折れ線グラフ。
各クラスターに含まれている遺伝子の変動パターンの折れ線グラフ。

しかし、 クラスタリングの手順をよく見てみましょう。パラメーターとして、クラスターの数を入力しています。ここで「10」を設定したため、10個のクラスターが得られたのです。

例えば、このパラメーターに「27」を設定すれば、27個のクラスターに分けることができます。

27個のクラスターに分類した結果。
27個のクラスターに分類した結果。

何パターンに分けるのが適切なのか」コンピューターに決めて欲しくなるところですが、もう少しヒントがないと難しいのが現状です。(この手の問題は、コンピューターの苦手な処理です。)

参考:

K-means 法の原理については、下記のサイトの記事がイメージしやすいと思います。

http://tech.nitoyon.com/ja/blog/2009/04/09/kmeans-visualise/

 

投稿者:

Atsushi Doi

株式会社セルイノベーター 取締役、研究開発部部長。理学博士。山口大学大学院理工学研究科修了。東京大学医科学研究所ヒトゲノム解析センターの特任助手を経て、株式会社GNIに主任研究員として勤務。その後、株式会社セルイノベーターの立ち上げに参加し、現在に至る。専門は、バイオインフォマティクス、おもにシステムバイオロジー。

コメントを残す