マイクロアレイデータの解析例 1.9 (上流解析、 GeneMANIA)

これまでの解析で、発現変動遺伝子の算出機能解析、さらにパスウェイ解析を通して、発現変動した遺伝子には、どのような機能の遺伝子が多いか、どの辺りのパスウェイの遺伝子が多いのか、全体的に見ました。

また、共通して変動したものが多いのか、特定のサンプルだけ変動した遺伝子が多いのかといった変動パターンは、ヒートマップで確認します。

特定の機能やパスウェイの遺伝子が、特徴的な変動パターンを示しているのであれば、それがキーになる可能性があるでしょう。そのあとは、それらの重要と考えられる遺伝子をリアルタイムPCRでチェックしたり、タンパクを免疫染色で確認したりといったバリデーションを行って、一段落となります。ここまでの結果で、論文なる場合もあるかと思います。(本当にキーになっているかどうか証明するのであれば、siRNAでノックダウンしたり、KOマウスを作成することになるでしょう。)

上流解析 (GeneMANIA)

もう少し、結果に新規性を求めるのであれば、上流解析を行うことになります。例えば、アポトーシスのパスウェイ上の遺伝子が増加していたのであれば、それを結果と考えて、それらの遺伝子を増加させている原因の遺伝子を探すというものです。

このとき、 Ingenuity Pathway Analysis (IPA) など有償のパスウェイデータベースがあれば便利です。無償のデータベースとしては、 GeneMANIA などがあります。

仮に PIK3R5, PRKACG, CASP12 遺伝子の増加が重要な結果であると考えられるとすると、それらを共通に制御する遺伝子が存在するようであれば、原因と言えるかもしれません。

GeneMANIA で、これら3つの遺伝子を検索すると、下記のようなネットワーク図が得られます。(オプションを変更して、50遺伝子まで検索しています。)

GeneMANIA で検索した結果。
GeneMANIA で検索した結果。

残念ながら、これら3つの遺伝子を直接共通に制御していそうな遺伝子は、見つかりませんでした。(新規性を求めるのであればということであり、必ずしもここまでの結果が要求されるわけではありません。)ネットワーク図から、次の研究のヒントは得られるかもしれません。

 

上流解析に利用できる情報

パスウェイやネットワークに含まれる情報のうち、上流解析に利用できる情報は、下記の4つに分類されます。それぞれの情報は、由来となるデータと、制御関係の方向、構成する要素(遺伝子なのかタンパクなのか)という点で、性質や入手方法が異なります。また、情報の入手しやすさも違います。これらの情報を含むパスウェイまたはネットワークを利用することで、上流解析の情報の制約をクリアできます。

  1. タンパク間相互作用(PPI)
  2. 遺伝子発現制御
  3. 共発現
  4. 文献情報

続きを読む 上流解析に利用できる情報

 

パスウェイやネットワークの持つ情報の制約

前に、「上流解析には、パスウェイ解析やネットワーク解析を用いる」と述べましたが、どんなパスウェイやネットワーク図であっても、上流解析ができるわけではありません。パスウェイやネットワークの図に含まれる情報には制約があります。「図の中に含まれる遺伝子、を制御している可能性のある遺伝子X」が載っていないのであれば、上流解析はできません。

例えば、KEGGに代表されるような代謝経路の図(マップ)は、代謝される物質と、それを触媒する酵素についてまとめられたマップです。そのため、ほとんどの場合、それらの酵素を制御する遺伝子についての言及はありません。

代謝経路に描かれる情報の範囲。
代謝経路に描かれる情報の範囲。

同様に、TGF-beta のパスウェイなど、既知のシグナル伝達系についてまとめられたパスウェイ(カノニカルパスウェイなどと呼ばれます)についても同様です。多くの場合、「シグナルの流れ」に注目してまとめられているため、「シグナル伝達を行う遺伝子、を制御する遺伝子」は、載っていません。

シグナル伝達系のパスウェイに描かれる情報の範囲。
シグナル伝達系のパスウェイに描かれる情報の範囲。

では、どうやって、Xを探せばよいのでしょうか?

続きます。

 

STRING

STRING は、タンパク質間相互作用 (Protein-Protein Interaction: PPI) のデータベースです。STRING GeneMANIA のようにネットワーク図を得ることができます。

使い方も同様です。(1) タンパク名を入力し、(2) 生物種を選択、 (3) GO ! をクリックするだけです。

STRING: タンパク質間相互作用のデータベース。
STRING: タンパク質間相互作用のデータベース。

ネットワーク図が表示されます。タンパク質をつなぐ線は、色によって、どの情報由来か示されています。例えば、黄緑色は、Textmining によって得られた関係を示します。

ANXA5 で検索した例。
ANXA5 で検索した例。

視覚的なネットワーク図を得られますが、GeneMANIAと比べると、ネットワークの情報量は少なめでしょうか。(+のアイコンをクリックして、拡張することもできます。)

ネットワーク図の例。
ネットワーク図の例。

* STRING v9.1: protein-protein interaction networks, with increased coverage and integration, Nucl. Acids Res. (1 January 2013) 41 (D1): D808-D815. doi: 10.1093/nar/gks1094

 

GO解析とパスウェイ解析の違い

GO解析パスウェイ解析も、解析の原理は同じと以前述べました。どちらの解析方法を使っても、発現変動した遺伝子が、どの機能(パスウェイ)に多く含まれているのか、確認できます。

しかし、この両者には、発現変動した遺伝子どうしの関係が含まれているかどうかという違いがあります。アノテーションのGene Ontology (GO) には、相互作用の情報は存在しません。GOは、アポトーシス促進、抑制といった機能を表す言葉を持ちますが、どの遺伝子がどの遺伝子に対してという from, to の情報を持っていません。(これは、ヒートマップGSEAにも言えることです。)

GO解析のイメージ。アノテーションに同じ機能を持つことが分かっても、相互作用の情報は含まれない。
GO解析のイメージ。アノテーションに同じ機能を持つことが分かっても、相互作用の情報は含まれない。

一方、パスウェイ(またはネットワーク)には、それらの相互作用の情報が含まれています。結合するのか、活性化するのか、抑制するのか、図に含まれる矢印から前後の関係を把握できます。

パスウェイ解析のイメージ。矢印で相互作用の情報が示されている。
パスウェイ解析のイメージ。矢印で相互作用の情報が示されている。