パスウェイ解析とは?

パスウェイ解析

発現が増加または、減少した遺伝子の一群(発現変動遺伝子群)が、「どのパスウェイに多く含まれていたかを調べる」ものです。考え方は、GO解析同様です。(パスウェイに含まれていることを、パスウェイにマップされているとも表現されます。)

特定のパスウェイに多く含まれていたこと(集中していたこと)を統計学的に有意かどうかを述べるには、GO解析の場合と同様に、下記の2点を考慮する必要があります。パスウェイに含まれている遺伝子の単純な個数で評価することは、望ましくありません。

  1. そのパスウェイに含まれる遺伝子が、ゲノム中にもともと多いのかどうか。
  2. 発現が増加または、減少した遺伝子の数が多いかのどうか。

1. パスウェイに含まれる遺伝子の数

たとえば、 “Pathways in cancer” のパスウェイなどは、パスウェイ上に描かれている遺伝子の数が多いです。そのため、このパスウェイに含まれる遺伝子は、それだけ見つかりやすいと考えられます。

 2. 発現変動遺伝子の数

数千個の遺伝子が増加、または減少している状況では、あらゆるパスウェイにおいて、増加減少した遺伝子が見つかります。

GO解析と同様に、DAVID などのサービスを利用すれば、上記の2点を考慮した各パスウェイごとの p-value が得られます。

パスウェイ解析で得られる結果

基本的にパスウェイ解析によって得られるのは、下記の2つものです。

  • 特定のパスウェイに含まれる遺伝子のリスト(シグナル値と ratio, fold-change, Z-score, p-value などのスコア)
  • 遺伝子発現の増減で色付けされたパスウェイの図
 

パスウェイデータベースとは?

様々なパスウェイをまとめてデータベース化したものが、「パスウェイデータベース」です。

パスウェイデータベース (Pathway Database)

代表的なパスウェイデータベースと言えば、京都大学の KEGG パスウェイデータベースでしょう。代謝経路を中心に、シグナル伝達系や、ヒトの疾患に関係したパスウェイなどが作成され、登録されています。世界的に利用されており、このサイトで紹介している DAVID も、パスウェイのデータとして、この KEGG のデータを使用しています。一般的な「パスウェイ解析」で利用されているのも、この KEGG パスウェイデータベースのパスウェイでしょう。KEGGのデータの閲覧は、研究目的として無償で利用できます。(アカデミックフリー。FTPを利用した方法や、商用利用にはライセンス契約が必要です。)

ほかのパスウェイデータベースとしては、下記のものがあります。

 

パスウェイとは?

マイクロアレイデータの解析には、アノテーションの情報のほかに、「パスウェイ」または「パスウェイデータベース」がよく用いられます。

パスウェイ (Pathway)

直訳すると「経路」ということになりますが、その名の通り、遺伝子やタンパク質の相互作用を経路図として表したのがパスウェイです。もともとは、代謝経路を中心に、パスウェイと呼ばれることが多かったように思いますが、現在では、シグナル伝達系や、Protein-Protein Interaction (PPI: タンパク間相互作用)、遺伝子の制御関係の情報も含めて、パスウェイの絵(マップ)として扱われています。

遺伝子やタンパク質を丸や四角などのシンボルで表し、制御関係を意味する矢印で結ぶことで、パスウェイは表現されます。(数学的には1部有向グラフとなることが基本なようです。)ただし、制御関係には、「酵素反応」、「活性化」、「抑制」、「転写を活性化」、「リン酸化」、「結合」など、非常に多くの生物学的な意味が込められています。

例えば、Aというタンパク質が、ECx.x.x.x という酵素によって、Bというタンパク質に代謝されるという経路があると、 A —> ECx.x.x.x –> B のように図示できると思います。このような関係を複数まとめるた絵が、パスウェイ(マップ)となります。

具体的な例は、下記のようなイメージです。

KEGGより。代謝経路のパスウェイの1つ。 http://www.genome.jp/kegg/pathway/map/map00010.html
KEGGより。シグナル伝達系のパスウェイの例。 http://www.genome.jp/kegg/pathway/hsa/hsa04010.html