Gene Expression Omnibus (GEO) のテンプレートの種類

マイクロアレイデータを GEOarchive 形式で保存するには、まず、テンプレートのエクセルファイルを GEO から取得します。このテンプレートのファイルは、AffymetrixAgilent などのメーカーごとに用意されています。

なお、このテンプレートは、使用したマイクロアレイの種類ごとに分かれており、また、データの処理方法によって、さらにオプションが分かれています。例として、 Affymetrix と Agilent の場合を紹介します。

Affymetrix

使用したマイクロアレイが 3′ or Whole Gene Expression Array または、Exon Array または、Tiling Array または SNP Array なのかによって異なります。また、始めの2つのマイクロアレイには、正規化後のデータの形式によって CHP file なのか Matrix table なのかを選択します。

  • CHP file オプション: 正規化の方法が MAS5.0 のときはこちらです。正規化後のシグナル値を CHP ファイルとして添付します。(GEOarchive のエクセルファイルに含める必要はありません。)
  • Matrix table オプション: 正規化の方法が RMA (GC-RMA) のときはこちらです。正規化後のシグナル値を GEOarchive のエクセルファイルの2枚目のシートに含めます。

最近では、 3′ or Whole Gene Expression Array – Matrix table option が多いのではないでしょうか。(セルイノベーターで受託解析を行った場合は、こちらです。)

いずれのオプションを選んだとしても、 raw データである CEL ファイルは必要です。

Agilent

まず、使用したマイクロアレイが、 Two-color なのか One-color なのかで異なります。また、正規化後のデータの形式によって Matrix table なのか Feature Extraction files なのかを選択します。

  • Matrix table オプション: 正規化後のシグナル値を GEOarchive のエクセルファイルの2枚目のシートに含める場合です。
  • Feature Extraction files オプション: 正規化後のシグナル値を Feature Extraction のファイルに含めて登録する場合です。

One-color の Matrix table option というケースが多いのではないかと思います。 (セルイノベーターで受託解析を行った場合は、こちらです。)

いずれのオプションを選んだとしても、 raw データを含む Feature Extraction のファイルは必要です。

 

投稿者:

Atsushi Doi

株式会社セルイノベーター、主任研究員。理学博士。山口大学大学院理工学研究科修了。東京大学医科学研究所ヒトゲノム解析センターの特任助手を経て、株式会社GNIに主任研究員として勤務。その後、株式会社セルイノベーターの立ち上げに参加し、現在に至る。専門は、バイオインフォマティクス、おもにシステムバイオロジー。

コメントを残す

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください