簡易的な上流解析(転写因子を探す)

発現変動遺伝子を確認後、上流解析を行うためには、代謝経路やシグナル伝達系など、一般的なパスウェイ(カノニカルパスウェイ)以外に、タンパク間相互作用 (PPI) や、遺伝子発現制御(転写制御)、共発現文献情報などが必要となります(前回までの記事を参照)。

それらの上流解析に利用できる情報は、無料で入手しやすいものから、そうでないものもあります。もし、敷居が高いと感じられるのであれば、簡易的に上流解析を行うことを考えてはいかがでしょうか。

簡易的な上流解析は、次のように考えます。発現変動遺伝子群を制御するような遺伝子 X が存在すると仮定します。このとき、遺伝子 X の発現が増加すると、それに制御されると遺伝子 A の発現も増加するのではないでしょうか。逆に、遺伝子 X の発現が減少すると、遺伝子 A の発現も減少すると考えられます(話を簡単にするために、インヒビターのケースについては説明を省略します)。つまり、「遺伝子 X発現変動遺伝子群は、同じ発現変動パターンを示す」と仮説を立てます。

遺伝子Xは、発現変動遺伝子に含まれる転写因子と仮定。
遺伝子Xは、発現変動遺伝子に含まれる転写因子と仮定。

そうであれば、遺伝子 X も発現変動遺伝子群の中に存在しているといえます。したがって、発現変動遺伝子群の中から、他の遺伝子の発現を制御しそうなものを探すとよいと考えられます。発現を制御しそうなものというと、真っ先に思いつくのは、転写因子 (transcription factor, TF) でしょう。最終的に、「発現変動遺伝子群のうち、アノテーションに転写因子に関連した用語をもつ遺伝子が X 」という仮説となります。

発現変動遺伝子を記録したエクセルファイルに Description や Gene Ontology (GO) などのアノテーションが含まれていれば、その列を検索すると、転写因子を見つけられます。

ちなみに、現在の GO に “transcription factor” というものはありません。検索するときは、代わりに、 “transcription, DNA-dependent” や “transcription factor binding”, “transcription factor complex” などを用います。

また、話はそう単純でないことを付け加えておきます。転写因子関連のアノテーションを持つ遺伝子は、ゲノム中に2000個ほどあります。発現変動遺伝子が数百から数千個であれば、その中に含まれる転写因子は、数十個から数百個ほどは見つかるでしょう。その中で、どれが決定的なのかというのは、1個ずつ実験で確認するほかありません。発現変動遺伝子が多ければ、割合的に、見つかる転写因子も多いでしょう。以前に述べた、発現変動遺伝子の判定基準を低くすると、あとで支障が出るという一例です。

 

投稿者:

Atsushi Doi

株式会社セルイノベーター 取締役、研究開発部部長。理学博士。山口大学大学院理工学研究科修了。東京大学医科学研究所ヒトゲノム解析センターの特任助手を経て、株式会社GNIに主任研究員として勤務。その後、株式会社セルイノベーターの立ち上げに参加し、現在に至る。専門は、バイオインフォマティクス、おもにシステムバイオロジー。

コメントを残す