GO解析とパスウェイ解析の違い

GO解析パスウェイ解析も、解析の原理は同じと以前述べました。どちらの解析方法を使っても、発現変動した遺伝子が、どの機能(パスウェイ)に多く含まれているのか、確認できます。

しかし、この両者には、発現変動した遺伝子どうしの関係が含まれているかどうかという違いがあります。アノテーションのGene Ontology (GO) には、相互作用の情報は存在しません。GOは、アポトーシス促進、抑制といった機能を表す言葉を持ちますが、どの遺伝子がどの遺伝子に対してという from, to の情報を持っていません。(これは、ヒートマップGSEAにも言えることです。)

GO解析のイメージ。アノテーションに同じ機能を持つことが分かっても、相互作用の情報は含まれない。
GO解析のイメージ。アノテーションに同じ機能を持つことが分かっても、相互作用の情報は含まれない。

一方、パスウェイ(またはネットワーク)には、それらの相互作用の情報が含まれています。結合するのか、活性化するのか、抑制するのか、図に含まれる矢印から前後の関係を把握できます。

パスウェイ解析のイメージ。矢印で相互作用の情報が示されている。
パスウェイ解析のイメージ。矢印で相互作用の情報が示されている。
 

GeneMANIA: 機能の一覧の保存

遺伝子名の一覧に続き、機能の一覧を表示し、保存する方法を紹介します。

機能の一覧の表示

上部の “Functions” タブをクリックして、表示されているネットワークに含まれる遺伝子の持つ機能の一覧を表示できます。GeneMANIAの検索結果で表示されているネットワークが、生物学的にどのような機能を持っているのか(アノテーションを多く含んでいるか)確認できます。遺伝子名の一覧と同様に、各機能にマウスカーソルを合わせると、ネットワーク上のその機能を持つ遺伝子のみがハイライトされます。

Functions タブをクリック
Functions タブをクリック
機能の一覧。マウスカーソルを合わせてハイライト。
機能の一覧。マウスカーソルを合わせてハイライト。

機能の一覧の保存

遺伝子の一覧と同様に、メニューの「File」から「Save functions」を選択して、機能の一覧を保存できます。ダウンロードフォルダに、 “functions_list.txt” というファイルで保存されます。

 

File から Save functions を選択。
File から Save functions を選択。
 

マイクロアレイ解析結果の論文での表現

前回記事の補足として、マイクロアレイ解析の結果について、論文で記述する際の注意点を解説します。

「マイクロアレイ解析の結果、」に続く文章として、適切なものはどれでしょうか?

  • A: 脂質代謝が活性化されていた。
  • B: 脂質代謝系の遺伝子が活性化された。
  • C: 脂質代謝系の遺伝子発現が増加した。
  • D: 脂質代謝系のいくつかの遺伝子の発現増加が見られた。

まず、 A はよくありません。レビューワーにスペキュレーションと見なされるかもしれません。理由は前回記事にあります。おそらく、「マイクロアレイ以外の他の実験結果を示せ」という注文がつくでしょう。

次に、B もよくありません。間違いではないかもしれませんが、「もう少し詳しく」と指摘されそうです。「脂質代謝系の遺伝子が活性化された可能性がある」ならよいでしょう。

C は問題ありません。無難な表現です。厳密には、脂質代謝系の遺伝子すべてが増加したわけではないでしょうから、後述の D がより無難な表現です。

D は事実のみを伝えているので、全く問題ありません。この事実をどう判断したのかは、著者の意見と明記して、追記しておけばよいでしょう。

 

マイクロアレイ解析のフローチャート3(その前に)

マイクロアレイ解析のフローチャート2までに得られたのは、「特定の(生物学的な)機能を持ち、かつ、特定の発現変動パターンを示した遺伝子群」でした。例えば、「炎症系の遺伝子が増加していた」ということが分かったとしましょう。

次のステップに移る前に、まず、ここで考慮すべきポイントがあります。それは、「炎症系の遺伝子が増加していた」=「炎症反応が亢進した」ではない、ということです。

意外に思われる方も少なくないのではないでしょうか?ここにアノテーションの問題があります。

ポイント1

第1に、「炎症系の遺伝子」というアノテーションには、「炎症を活性化する遺伝子」と「炎症を抑制する遺伝子」の両方が含まれています。

GO:0006954: inflammatory response には、 GO:0050728: negative regulation of inflammatory response と GO:0050729: positive regulation of inflammatory response が含まれます。

inflammatory response には、 negative と positive 2つの regulation が含まれる。
inflammatory response には、 negative と positive 2つの regulation が含まれる。

ポイント2

第2に、アノテーションの情報は更新され続けており、完全ではありません。まだ、活性とも抑制とも書かれていないこともありますし、活性抑制のどちらも書かれていることもあります。(おそらくは、ある条件下で逆の働きをすることもあるのでしょう。)例えば、 Angiotensinogen (AGT) は、 negative regulation of neuron apoptotic processpositive regulation of apoptotic process の両方をアノテーションに持ちます。

AGT は、apoptosis に対して抑制と活性のどちらか?
AGT は、apoptosis に対して抑制と活性のどちらか?

ポイント3

第3に生体内の多くの現象が、フィードバックにより恒常性を保っています。よって、ある現象を活性化させる遺伝子の発現が増加したとき、負のフィードバックが働き、その遺伝子を抑制する遺伝子も増加してくることが予想されます。したがって、ある現象を活性化する遺伝子抑制する遺伝子の両方が増加していても、それほど不自然ではないと言えるでしょう。フィードバックループの例としては時計遺伝子がよく知られています。

フィードバックループ。mPERはmCLKを抑制し、一方、mCLKはmPERを活性化する。
フィードバックループ。mPERはmCLKを抑制し、一方、mCLKはmPERを活性化する。

例えば、肝硬変でコラーゲンの産生が過多になっているような組織であれば、コラーゲンの遺伝子である COL1A1 の発現が高く、同時にコラーゲンを分解する MMP の発現も高いという状況が予想されます。MMPによる分解が追いついていないだけと考えれば、矛盾した状態とは言えないでしょう。

以上のようなことから、マイクロアレイデータのみを根拠に、「炎症系の遺伝子が増加していた」=「炎症反応が亢進した」と結論づけることは困難と考えられます。

 

Gene Set Enrichment Analysis (GSEA)

Gene Set Enrichment Analysis (GSEA) は、GO解析パスウェイ解析、に並んで、よく用いられる解析手法の1つです。

後者の2つの解析は、原理的には、遺伝子発現が増加または減少した遺伝子群を多く含む「特定の遺伝子群」を探すというものでした。この「特定の遺伝子群」が、あるキーワードをアノテーションに持つ遺伝子群であったり(GO解析)、あるパスウェイに載っている遺伝子群であったり(パスウェイ解析)するわけです。

この「特定の遺伝子群」を「遺伝子セット (Gene Set)」として、あらかじめ準備しておき、増加または減少した遺伝子群が、どの「遺伝子セット」に多く含まれているかを調べるのが、Gene Set Enrichment Analysis (GSEA) です。

GSEA
GSEA のサイト。

例えば、GSEA遺伝子セットには、「stem cell で発現が増加していた遺伝子群」があります。これは論文 (Pubmed 12228720) の情報をもとに作成された遺伝子セットです。このような遺伝子セットは、キュレーターによって登録されており、Molecular Signatures Database (MSigDB) と呼ばれるデータベースとして公開されています。

a gene set
遺伝子セットの例。

GSEA の利用、MSigDB の閲覧には、メールアドレスの登録が必要です。

> Subramanian,Tamayo, et al. (2005, PNAS 102, 15545-15550) and Mootha, Lindgren, et al. (2003, Nat Genet 34, 267-273).