マイクロアレイデータの解析例 1.1 (データのダウンロード)

GEO に公開されたデータを利用して、実際に解析を行ってみましょう。マイクロアレイ解析によって、どのような情報が得られるのかイメージがつかめると思います。

マイクロアレイデータ

まずは、 GSE53614 のデータを使ってみます。293T cell lines を用いた解析のようです。サンプル名から推測するに、3つのタイムポイント (16hr, 24hr, 40hr) があり、それぞれに、コントロールと対照サンプルがあるようです。また、使用されたアレイは、 Agilent SurePrint G3 Human GE 8x60Kv2 です。

GSE53614

マイクロアレイデータの取得

データを取得します。取得する方法は、いくつかあります。著者らが正規化したデータをそのまま利用するには、 “Series Matrix Files(s)” をダウンロードしましょう。正規化からやり直す場合は、その下の GSE53614_RAW.tar をダウンロードします。 (ここでは、正規化前のデータを用いました。)

マイクロアレイデータの取得

なお、 SOFT形式のデータをダウンロードすれば、アノテーションが付いた状態のファイルを取得できますが、計算時に読み込むときに苦労する場合があります。また、MINiML形式の場合も、XML形式のデータであるため、計算に用いない情報が含まれています。

Series Matrix File の始めの行(ヘッダー)は、サンプル情報です。 ID_REF から始まる行以降のデータが、正規化後のデータです。1列目はプローブのIDです。2列目以降に各サンプルのシグナル値があります。(6サンプルなので6列)プローブの ID が A_ で始まらないものは、バックグラウンドなどの値です。

サンプル情報がヘッダーに含まれています。
サンプル情報がヘッダーに含まれています。
 

投稿者:

Atsushi Doi

株式会社セルイノベーター、主任研究員。理学博士。山口大学大学院理工学研究科修了。東京大学医科学研究所ヒトゲノム解析センターの特任助手を経て、株式会社GNIに主任研究員として勤務。その後、株式会社セルイノベーターの立ち上げに参加し、現在に至る。専門は、バイオインフォマティクス、おもにシステムバイオロジー。