統計処理ソフト R (GNU R)

プログラミング言語の1つとして、 “R” という言語があります。”GNU R” や “R言語” とも呼ばれます。 R はプログラミング言語の中でも統計処理を得意としています。オープンソースという形で公開されていますので、誰でも無料で使用することができます。この “R” についての詳しい解説は、 RjpWikiR-Tips を参考にされるとよいでしょう。

R のメリット

  • 無料である。
  • bioconductor などライブラリ(他人が用意してくれているプログラム)が多い。
  • ボックスプロット、散布図、ヒートマップなどの作図もできる。

R のデメリット

  • コマンドを覚える必要がある。

ボックスプロットは、エクセルでもがんばれば作成することはできます。また、t-検定も行うことは可能です。しかし、大量のサンプルを扱う場合は、コマンドで操作できる R のほうがいいこともありますし、何と言っても bioconductor の存在が大きいです。統計処理ソフトとしては、SPSS, SAS, JMP などがありますが、R であれば、 bioconductor を使ってマイクロアレイデータを比較的簡単に扱うことができます。

 

株式会社セルイノベーターの受託解析でも、解析ツールとして、この Rbioconductor を利用しています。

 

Cytoscape

タンパク間相互作用 (Protein-Protein Interaction) や、遺伝子の制御関係などのネットワークを表示するソフトとして、 Cytoscape があります。操作方法がなかなか難しいと思いますが、多機能なソフトです。ネットワーク図を作成し、そのネットワーク図のレイアウトをグラフ理論のアルゴリズムによって変更し、ネットワーク上の遺伝子の色をマイクロアレイデータの増減に応じて色付けするといったことが可能です。また、 Cytoscape の中から、GeneMANIA を呼び出すということもできます(追加でインストールが必要です)。

cytoscape
Cytoscape のサイト。

インストールするまでが少し大変かもしれません。Cytoscape を実行するには、Java と呼ばれるプログラムが別に必要になります。パソコンに初めからインストールされていることもありますが、ない場合は自分で Java をインストールする必要があります。

無料で使えるソフトですが、LGPLというライセンスに同意しなければなりません。ただ、ネットワーク図を作成したり、表示したりということに関しては、気にする必要はありません。Cytoscape を利用して、新たにプログラムを開発するといった場合に適用されます。

統合tvにも解説があります。

 

Mouse Genome Informatics (MGI)

マウスの遺伝子情報のデータベースといえば、 “MGI” です。マウスの株や、ノックアウトの種類、遺伝子のアノテーション (GO) など、 マウスに関する様々な情報が登録されています。

この MGI を使って、特定の組織で発現していることが確認されたマウスの遺伝子を検索できます。

(1) まず、トップページから、 Expression を選択します。

MGI top
MGIのトップページ。Expression を選択

(2) Gene Expression Database (GXD) が表示されます。”Gene Expression Data Query” を選択します。

GXD の画面。Gene Expression Data Query を選択。
GXD の画面。Gene Expression Data Query を選択。

(3) 検索画面が表示されるので、組織の名称を入力します。さらにステージで絞り込むこともできます。

検索画面。組織の名称を入力。
検索画面。組織の名称を入力。

(4) 検索結果が表示されます。GXD では、マイクロアレイに限らず、いろいろな実験で発現を用いて確認された遺伝子の情報があります。主に論文で示された情報が根拠となっています。

MGI Gene Expression Data Query result
検索結果。

 

 

 

COXPRESdb: 共に発現している遺伝子のデータベース

いろいろな組織において、共に発現している遺伝子を調べたデータベースがあります。それが COXPRESdb です。

COXPRESdb
COXPRESdb のホーム画面。

遺伝子名で検索することで、その遺伝子と共に発現していることが多い遺伝子の一覧が取得できます。また、それらの関係をネットワーク図として見ることもできます。

COXPRESdb example
検索結果の例。MDM4と共に発現が見られる遺伝子の情報。

もとになる情報は、GEOに公開されたマイクロアレイデータが中心となっています。また、共に発現している遺伝子の情報に加え、タンパク間相互作用 ( Protein-Protein Interaction) の情報も付加され、確認できるようになっています。

> Obayashi T, Hayashi S, Shibaoka M, Saeki M, Ohta H, Kinoshita K. (2008) COXPRESdb: a database of coexpressed gene networks in mammals. Nucleic Acids Res. 36, D77-D82.

 

クラスタリング結果の反転 (MeV)

MeV でクラスタリング図を作成した際に、ツリーの左右が入れ替わってほしいことがあります。例えば、下図のような結果になったとして、左側に緑色(減少している遺伝子)、右側に赤色(増加している遺伝子)になっていたほうがよかったとします。

clustering result
クラスタリングの結果の例。

(1) 表示を入れ替えるには、まず、入れ替えたいツリーをクリックして選択します。ツリーの選択された部分は、ピンクにハイライトされます。

select tree
ツリーの選択。

(2) ツリーが選択された状態で、ツリーを右クリックすると、メニューが表示されます。そのメニューから、 “Rotate Selected Node” を選びます。

rotate selected node
右クリックメニューから選択。

これで表示が反転された結果が得られます。

rotate result
反転された結果。

ただし、あくまで見た目の問題であることにご注意ください。ツリーの計算結果をコントロールする処理ではありません。