GSEA 操作ガイド (3): パラメーターの設定と実行

データの読み込みができたら、GSEA を実行する際に必要なパラメーターを設定します。GSEAには、設定を変更できる非常に多くのパラメーターがあります。ここでは最低限必要なパラメーターを紹介します。

1. Run Gsea タブの表示

正常にデータを読み込んだら、左側の “Run GSEA” をクリックして、 Run Gsea タブを表示させます。

GSEA をクリック。
“Run GSEA” をクリック。

2. 最低限、設定が必要なパラメーター

Run Gsea タブに、GSEA の実行に必要なパラメーターを設定します。最低限、これらの下記の7項目の設定が必要です。(これらの設定に必要なパラメーターの多さが、GSEAを難しくしている要因の1つかと思います。) 続きを読む GSEA 操作ガイド (3): パラメーターの設定と実行

 

GSEA 操作ガイド (2): データの読み込み

データを読み込むところまでを紹介します。フォーマットを合わせることができれば、操作は難しくありません。(データは、3. で示すフォーマットで事前に準備しておく必要があります。)

1. Load data をクリック

メインとなるウィンドウの左上にある “Load data” のボタンをクリックします。

Load data をクリックする。
Load data をクリックする。

2. 読み込むファイルの選択

右側にデータを読み込むためのタブが表示されます。読み込む方法は3種類あります。いずれかの方法を使用します。通常は、読み込み方法1を使うとよいでしょう。 続きを読む GSEA 操作ガイド (2): データの読み込み

 

GSEA 操作ガイド (1): GSEA の起動

人気のある解析ツール GSEA の紹介です。GSEAを使うと、DAVIDのように、どのような機能の遺伝子が発現変動していたかを解析できます。ただ、解析結果の解釈は難しいかもしれません。(発現変動遺伝子に含まれる遺伝子の機能(GO)や、所属するパスウェイを見るだけなら、DAVIDのほうが簡単と思います。)

今回は、起動するまでの操作を示します。なお、GSEAを使用するには、Javaプログラムが必要になります。PCにインストールされていない場合は、あらかじめ、ORACLE 社から、Java をダウンロードして、インストールしておいてください。

1. GSEA のサイトにアクセス

以前、紹介した MSigDB と同じサイト(http://www.broadinstitute.org/gsea/index.jsp) です。Download をクリックして、GSEAソフトウェアのダウンロード画面へ進んでください。なお、使用するには、メールアドレスの登録が必要となります。(MSigDBを閲覧するときに登録していれば、同じメールアドレスで利用できます。)

GSEAのサイト。MSigDBと同じサイトです。
GSEAのサイト。MSigDBと同じサイトです。

2. ファイルをダウンロード(または直接、GSEAを起動)

GSEAに割り当てるメモリのサイズを選択してから、”Launch” を押すと、GSEA.jnlp ファイルがダウンロードされます。(または、直接、GSEAが起動します。) 続きを読む GSEA 操作ガイド (1): GSEA の起動

 

上流解析に利用できる情報

パスウェイやネットワークに含まれる情報のうち、上流解析に利用できる情報は、下記の4つに分類されます。それぞれの情報は、由来となるデータと、制御関係の方向、構成する要素(遺伝子なのかタンパクなのか)という点で、性質や入手方法が異なります。また、情報の入手しやすさも違います。これらの情報を含むパスウェイまたはネットワークを利用することで、上流解析の情報の制約をクリアできます。

  1. タンパク間相互作用(PPI)
  2. 遺伝子発現制御
  3. 共発現
  4. 文献情報

続きを読む 上流解析に利用できる情報

 

Molecular Signatures Database (MSigDB)

「遺伝子セット」のデータベースが、 Molecular Signatures Database (MSigDB) です。Broad institute の GSEA 内にあります。メールアドレスを登録することで閲覧が可能です。

MSigDB top
MSigDB のトップページ。

遺伝子セット

MSigDB の遺伝子セットは、大きく分けて6つのコレクションから構成されています。

  • c1: positional gene sets, 染色体の座標によるもの。
  • c2: curated gene sets, キュレーターが論文から取り出したもの。
  • c3: motif gene sets, 転写制御のモチーフごとのリスト。
  • c4: computational gene sets: がん由来のマイクロアレイデータをコンピューターで分析して作成したリスト
  • c5: GO gene sets, Gene Ontology (GO) から作成したリスト。
  • c6: oncogenic signatures, さまざまな因子の影響下にある、がん細胞のマイクロアレイデータから作成したリスト。

MSigDB の代表的な遺伝子セットとしては、c2 の論文から取得されたリストでしょう。論文に書かれた遺伝子群をキュレーターがチェックして、遺伝子セットとして登録しています。また、この中には、BioCarta, KEGG, Reactome など、パスウェイに関するリストも含まれています。また、 c5 には、GO から得られた遺伝子セットもあります。つまり、GSEA を行うと、パスウェイ解析GO解析も同時に行えるといえます。(パスウェイの色づけはなく、アノテーションが最新とは限らないため、完全な代用にはなりませんが。)

> Subramanian, Tamayo, et al. (2005, PNAS 102, 15545-15550)