マイクロアレイデータの解析例 1.5 (機能解析の続き)

解析例1のデータのほかのタイムポイントの発現変動遺伝子も、DAVIDで確認してみましょう。

16hr の発現変動遺伝子

前回の 24hr の発現変動遺伝子と同様に、 ratio と Z-score によって判定された発現変動遺伝子を DAVID で確認してみます。

16hr の発現変動遺伝子を DAVID で解析した結果。
16hr の発現変動遺伝子を DAVID で解析した結果。

24hr のときとは異なり、かなり膜系のタンパク、GPCRなどのレセプターの変動が多い印象です。

16hr の比較におけるケラチンのアノテーションクラスター。
16hr の比較におけるケラチンのアノテーションクラスター。

また、ケラチンを含むアノテーションクラスターも上位にあります。Enrichment Score = 1.88  で有意といえます。(1.3を超えているので。)

16hr の比較におけるアポトーシスのアノテーションクラスター。
16hr の比較におけるアポトーシスのアノテーションクラスター。

一方、アポトーシスを含むアノテーションクラスターは、24hr のときと同様に、それほど多くありません。

40hr の発現変動遺伝子

同様に 40hr のタイムポイントにおける発現変動遺伝子も確認してみました。

40hr の発現変動遺伝子を DAVID で解析した結果。
40hr の発現変動遺伝子を DAVID で解析した結果。

トップは、 T-cell activation です。また、16hr と同様に膜系、レセプターが上位にきていますが、Enrichment Score は下がっています。(他の機能に分散している?)

40hr の比較におけるケラチンのアノテーションクラスター。
40hr の比較におけるケラチンのアノテーションクラスター。

ケラチンの変動はあまり見られなくなっています。16hr, 24hr, 40hr とだんだん変化がなくなるということでしょうか。

40hr の比較におけるアポトーシスのアノテーションクラスター。
40hr の比較におけるアポトーシスのアノテーションクラスター。

アポトーシス関連遺伝子の変動は、やはり少ないようです。

全体を通して、個人的には、アポトーシスの影響は小さいように感じました。また、増殖系への影響も少なそうです。膜タンパクの影響もありそうですが、24hr でいったん少なくなるのが解釈に困るような気がします。

今回の解析の内容は、あくまで主観的なものです。論文の内容を確認していませんし、フェノタイプに変化があるなら、必ずしも、DAVIDのスコアが高い必要はないと考えます。

 

マイクロアレイデータの解析例 1.4 (発現変動遺伝子、機能解析)

正規化後のシグナル値から、ratio と Z-score を算出して、発現変動を判定します。その結果、発現変動している遺伝子のリスト(例えば、エクセルファイルのようなテーブル)が得られます。ここでは、 sample2/control2 = 24hr どうしを比較したデータを使用しています。

発現変動遺伝子のテーブル。
発現変動遺伝子のテーブル。

発現変動遺伝子

この例では、下のMAプロットに示されたような部分が変動していると判定されています。判定条件としては、 ratio > 2 かつ Z-score > 2 (または ratio < 0.5 かつ Z-score < -2)という少し厳しめの条件にしています。増加しているもの、減少しているもの合わせて、1032個を変動していると判定しています。

発現変動遺伝子を色づけしたMAプロット。
発現変動遺伝子を色づけしたMAプロット。

まずは、変動している遺伝子の機能を調べてみましょう。機能を調べるには、データベースの DAVID が便利です。

DAVIDによる機能解析

DAVIDに変動している遺伝子の ID のリストをアップロードすると、そのリストに含まれる遺伝子にどのような機能の遺伝子が多いのか(膜タンパクが多いのか、転写因子が多いのか、アポトーシスに関連する遺伝子が多いのか)、確認することができます。操作方法は、リンク先を参照してください。

DAVID の Functional Annotation Clustering を実行すると、下記のようなテーブルが得られます。

DAVID の Functional Annotation Clustering の結果。
DAVID の Functional Annotation Clustering の結果。

左上の表示を確認すると、1032個の変動遺伝子のうち、558個が認識されたことがわかります。(ここでは、EntrezGeneID をアップロードしています。)変動しているもののうち、アノテーションがついていないもの、機能が未知のものが多かったようです。

テーブルの最初 (Annotation Cluster 1) から、signal peptide, glycoprotein 、つまり、シグナルを伝達する分子、糖タンパクの遺伝子が多かったことが分かります。だいたい、この機能のグループ(クラスター)は、どんなデータでも上位に来ることが多いです。これらの用語は、漠然とした分類のアノテーションなので、あまり、情報としての価値はないかもしれません。

アノテーションのクラスターとして、次は、ホルモンのようですが、遺伝子数はそれほど多くありません。

入手元のデータのサマリーによると、変異の結果、アポトーシスが活性化され、ケラチノサイトの分化が抑制とあります。

TRPV3 dysfunction may increase apoptotic activity, inhibit keratinocyte differentiation and disturb the intricate balance between proliferation and differentiation state of keratinocytes in the skin.

ブラウザの検索機能で、”apoptosis” を検索して見ると、テーブルの下の方に見つかりました。

apoptosis を含む Annotation Cluster.
apoptosis を含む Annotation Cluster.

確かに変動しているようですが、数は少ないようです。(1032個のうち、20個程度)Enrichment Score も 0.37 と低いです。

“keratinocyte” を検索すると、 “keratinocyte differentiation” も見つかりますが、これも数は少ないです。

"keratinocyte differentiation" を含む Annotation Cluster.
“keratinocyte differentiation” を含む Annotation Cluster.

24hr の比較では、あまり、変異体の影響が出ていないように思われます。ほかに 16hr, 40hr のタイムポイントもあるので確認してみる必要がありそうです。

 

NF-kB のターゲットとなる遺伝子を調べるには?

マイクロアレイ解析の結果、確認したくなるのは、特定の生物学的な機能を持った遺伝子の変動パターン(増加したか減少したか)だと思います。この特定の機能を持った遺伝子のリストは、GOなどのアノテーションを見れば分かる場合もありますが、そうでない場合もあります。

例えば、転写因子である NF-kB のターゲットとなる遺伝子(制御される遺伝子、下流の遺伝子)は、アノテーションの情報からは知ることができません。このような場合では、インターネット上に公開された情報が役立つことがあります。

続きを読む NF-kB のターゲットとなる遺伝子を調べるには?

 

簡易的な上流解析(転写因子を探す)

発現変動遺伝子を確認後、上流解析を行うためには、代謝経路やシグナル伝達系など、一般的なパスウェイ(カノニカルパスウェイ)以外に、タンパク間相互作用 (PPI) や、遺伝子発現制御(転写制御)、共発現文献情報などが必要となります(前回までの記事を参照)。

それらの上流解析に利用できる情報は、無料で入手しやすいものから、そうでないものもあります。もし、敷居が高いと感じられるのであれば、簡易的に上流解析を行うことを考えてはいかがでしょうか。

続きを読む 簡易的な上流解析(転写因子を探す)

 

パスウェイやネットワークの持つ情報の制約

前に、「上流解析には、パスウェイ解析やネットワーク解析を用いる」と述べましたが、どんなパスウェイやネットワーク図であっても、上流解析ができるわけではありません。パスウェイやネットワークの図に含まれる情報には制約があります。「図の中に含まれる遺伝子、を制御している可能性のある遺伝子X」が載っていないのであれば、上流解析はできません。

例えば、KEGGに代表されるような代謝経路の図(マップ)は、代謝される物質と、それを触媒する酵素についてまとめられたマップです。そのため、ほとんどの場合、それらの酵素を制御する遺伝子についての言及はありません。

代謝経路に描かれる情報の範囲。
代謝経路に描かれる情報の範囲。

同様に、TGF-beta のパスウェイなど、既知のシグナル伝達系についてまとめられたパスウェイ(カノニカルパスウェイなどと呼ばれます)についても同様です。多くの場合、「シグナルの流れ」に注目してまとめられているため、「シグナル伝達を行う遺伝子、を制御する遺伝子」は、載っていません。

シグナル伝達系のパスウェイに描かれる情報の範囲。
シグナル伝達系のパスウェイに描かれる情報の範囲。

では、どうやって、Xを探せばよいのでしょうか?

続きます。