マイクロアレイデータの解析例 1.9 (上流解析、 GeneMANIA)

これまでの解析で、発現変動遺伝子の算出機能解析、さらにパスウェイ解析を通して、発現変動した遺伝子には、どのような機能の遺伝子が多いか、どの辺りのパスウェイの遺伝子が多いのか、全体的に見ました。

また、共通して変動したものが多いのか、特定のサンプルだけ変動した遺伝子が多いのかといった変動パターンは、ヒートマップで確認します。

特定の機能やパスウェイの遺伝子が、特徴的な変動パターンを示しているのであれば、それがキーになる可能性があるでしょう。そのあとは、それらの重要と考えられる遺伝子をリアルタイムPCRでチェックしたり、タンパクを免疫染色で確認したりといったバリデーションを行って、一段落となります。ここまでの結果で、論文なる場合もあるかと思います。(本当にキーになっているかどうか証明するのであれば、siRNAでノックダウンしたり、KOマウスを作成することになるでしょう。)

上流解析 (GeneMANIA)

もう少し、結果に新規性を求めるのであれば、上流解析を行うことになります。例えば、アポトーシスのパスウェイ上の遺伝子が増加していたのであれば、それを結果と考えて、それらの遺伝子を増加させている原因の遺伝子を探すというものです。

このとき、 Ingenuity Pathway Analysis (IPA) など有償のパスウェイデータベースがあれば便利です。無償のデータベースとしては、 GeneMANIA などがあります。

仮に PIK3R5, PRKACG, CASP12 遺伝子の増加が重要な結果であると考えられるとすると、それらを共通に制御する遺伝子が存在するようであれば、原因と言えるかもしれません。

GeneMANIA で、これら3つの遺伝子を検索すると、下記のようなネットワーク図が得られます。(オプションを変更して、50遺伝子まで検索しています。)

GeneMANIA で検索した結果。
GeneMANIA で検索した結果。

残念ながら、これら3つの遺伝子を直接共通に制御していそうな遺伝子は、見つかりませんでした。(新規性を求めるのであればということであり、必ずしもここまでの結果が要求されるわけではありません。)ネットワーク図から、次の研究のヒントは得られるかもしれません。

 

上流解析に利用できる情報

パスウェイやネットワークに含まれる情報のうち、上流解析に利用できる情報は、下記の4つに分類されます。それぞれの情報は、由来となるデータと、制御関係の方向、構成する要素(遺伝子なのかタンパクなのか)という点で、性質や入手方法が異なります。また、情報の入手しやすさも違います。これらの情報を含むパスウェイまたはネットワークを利用することで、上流解析の情報の制約をクリアできます。

  1. タンパク間相互作用(PPI)
  2. 遺伝子発現制御
  3. 共発現
  4. 文献情報

続きを読む 上流解析に利用できる情報

 

マイクロアレイ解析結果の論文での表現

前回記事の補足として、マイクロアレイ解析の結果について、論文で記述する際の注意点を解説します。

「マイクロアレイ解析の結果、」に続く文章として、適切なものはどれでしょうか?

  • A: 脂質代謝が活性化されていた。
  • B: 脂質代謝系の遺伝子が活性化された。
  • C: 脂質代謝系の遺伝子発現が増加した。
  • D: 脂質代謝系のいくつかの遺伝子の発現増加が見られた。

まず、 A はよくありません。レビューワーにスペキュレーションと見なされるかもしれません。理由は前回記事にあります。おそらく、「マイクロアレイ以外の他の実験結果を示せ」という注文がつくでしょう。

次に、B もよくありません。間違いではないかもしれませんが、「もう少し詳しく」と指摘されそうです。「脂質代謝系の遺伝子が活性化された可能性がある」ならよいでしょう。

C は問題ありません。無難な表現です。厳密には、脂質代謝系の遺伝子すべてが増加したわけではないでしょうから、後述の D がより無難な表現です。

D は事実のみを伝えているので、全く問題ありません。この事実をどう判断したのかは、著者の意見と明記して、追記しておけばよいでしょう。

 

Papers

最近では、論文をPDFファイルで配布することが一般的になりました。研究者であれば、コンピューターのハードディスクのあちこちに、大量のPDFを保存していると思います。このPDFを整理できる “Papers” というソフトを紹介します。

Papers のサイトで確認できるように、インターフェース(見た目)は、音楽を管理するソフトの iTunes と似ています。iTunes で曲のプレイリストを作るように、論文のリストを作成することができます。Cancer や Gene Network など、研究テーマごとにリストを作っておくと探しやすくてよいと思います。BibTeX や EndNote 形式で出力できるので、論文執筆時にも助かります。

また、iOS版 (iPhone, iPad)用の Papers もあります。Mac版の Papers とシンクさせることができます。この機能を使うと、iTunes の音楽を iPod に入れて持ち出すように、 iPad に論文を入れて持ち出すことができます。

Mac版は Papers のサイトから、iOS版は App Store から購入可能です。Mac版は、学生割引もあります。

以前は、Mac版のみでしたが、最近、Windowsにも対応したようです。

スクリーンショット。Papers より。
 

マイクロアレイデータの Gene Expression Omnibus (GEO) への登録

GEOへの登録

最近のジャーナルでは、マイクロアレイデータを用いた論文を投稿する際に、マイクロアレイデータの Gene Expression Omnibus (GEO) への登録を求められることが多いです。GEOは、これまでに多くのマイクロアレイデータが登録されており、自由に閲覧が可能なデータベースです。

GEO にマイクロアレイデータを登録すると、”GSExxxxx” という番号をもらうことができます。他の研究者は、この番号を指定することで、そのマイクロアレイデータを閲覧することが可能です。レビューワーから、このアクセッション番号や、IDという言い方で、求められることもあります。

登録する際に準備するもの

GEOにマイクロアレイデータを登録する際に必要なものは、下記の3点です。(ここでは、GEOarchive という形式の登録方法を紹介します。)

  1. NCBI のアカウント(ユーザー名とパスワード)
  2. メタデータ(論文の要旨や、サンプルの情報など。)
  3. マイクロアレイデータ(CELファイルなどのrawデータを含む。)

1. NCBI のアカウント

NCBIを利用するときのアカウントです。NCBIのサイトで無料で作成できます。左下の “Register for an NCBI account” から先へ進みます。(以前は、GEO専用のアカウントがありましたが、現在は、NCBIアカウントに統合されています。)

アカウント作成後、登録されたメールアドレスに、confirm 用のメールが届きます。そのメールに書かれたリンクをクリックすることで、確認されたことになり、アカウントが有効化されます。(迷惑メールと判断されることもあるようですので、ご注意ください。)

2. メタデータ

論文の要旨や、サンプルの情報を専用のエクセルのフォームに記入します。Affymetrix, Agilent, Illumina ごとに専用のフォームがあります。テンプレートのエクセルファイルをダウンロードして記入します。このテンプレートの3枚目以降のシートに記入例があります。各項目の意味はこちらをご覧ください。

3. マイクロアレイデータ

正規化済みのマイクロアレイデータと、これに加えて、rawデータ(AffymetrixであればCELファイル、AgilentであればFeatureExtractionから出力されるファイル)も必要です。ratioやアノテーションの情報は、必須ではありません。プローブIDと、シグナル値と(あれば)フラグの情報を登録します。

正規化に用いたすべてのサンプルの情報が必要です。「8サンプルで正規化を行って解析した後、論文に使用した4サンプルだけを登録」ということはできません。8サンプルで正規化した場合と、4サンプルで正規化した場合では、若干、シグナル値が変わるためです。上記のような場合は、4サンプルだけで再度、正規化から解析しなおして、登録する必要があります。

 

株式会社セルイノベーターでは、「マイクロアレイデータのGEOへの登録」も受託解析サービスの料金の中に含まれています。登録の際は、ご相談ください