Papers

最近では、論文をPDFファイルで配布することが一般的になりました。研究者であれば、コンピューターのハードディスクのあちこちに、大量のPDFを保存していると思います。このPDFを整理できる “Papers” というソフトを紹介します。

Papers のサイトで確認できるように、インターフェース(見た目)は、音楽を管理するソフトの iTunes と似ています。iTunes で曲のプレイリストを作るように、論文のリストを作成することができます。Cancer や Gene Network など、研究テーマごとにリストを作っておくと探しやすくてよいと思います。BibTeX や EndNote 形式で出力できるので、論文執筆時にも助かります。

また、iOS版 (iPhone, iPad)用の Papers もあります。Mac版の Papers とシンクさせることができます。この機能を使うと、iTunes の音楽を iPod に入れて持ち出すように、 iPad に論文を入れて持ち出すことができます。

Mac版は Papers のサイトから、iOS版は App Store から購入可能です。Mac版は、学生割引もあります。

以前は、Mac版のみでしたが、最近、Windowsにも対応したようです。

スクリーンショット。Papers より。
 

MAMP

自分のマイクロアレイデータやその解析結果をデータベース化して、整理、保存するには、 “MAMP” が便利です。

MAMP は、MySQL データベースをブラウザ(Safari や Chrome)から操作できるようにしたものです。SELECTWHERE などの命令を覚えていなくても、比較的簡単に扱えます。

一度、データを MAMP に格納してしまえば、数万行のデータも一瞬で検索できます。エクセルファイルを開いて検索するより、オススメです。有償版 (MAMP Pro) と無償版 (MAMP) がありますが、通常の使い方であれば、無償版で十分に対応できます。

 

MAMP logo
MAMP

 

なお、Windows には、 WampServer があります。

 

特定の遺伝子を含むパスウェイの検索

「ある特定の遺伝子が、どのパスウェイに載っているのか?」知りたいことがあると思います。この場合、 NCBI で検索することで、簡単にパスウェイの一覧を得ることができます。

1. NCBI で検索

(1) NCBI のサイトで、対象に “Gene” を選択します。(2) 目的となる遺伝子の名前(Official Gene Symbol など)を入力します。(3) Search をクリックします。

NCBI_Gene_Search
NCBIで検索。

2. 検索結果

検索した遺伝子の候補が表示されます。生物種などを手がかりに、目的の遺伝子を選択します。

NCBI_Search_Result
検索結果、候補の遺伝子。

3. 遺伝子の詳細な情報

目的となる遺伝子の詳細な情報が表示されます。さまざまな情報を確認できますが、画面をずっと下までスクロールさせていくと、”Pathways from BioSystems” という項目があります。

Search_Result_Detail
遺伝子の詳細な情報。

4. Pathways from BioSystems

パスウェイの一覧が見つかります。パスウェイは、各パスウェイデータベースの情報とリンクしています。同じ名前のパスウェイであっても、元となるパスウェイデータベースによって中身が少しずつ異なっています。また、パスウェイとして扱われていても、パスウェイのマップ(ダイアグラム、絵)が描かれていないものも多数あります。KEGGパスウェイデータベースのマップが一番参考になると思います。

Pathways_from_BioSystems
パスウェイの一覧。
 

増加を ratio > 1.5 で判定したとき、減少は ratio < ??

ratio (=fold-change) > “2” と増加を判定したときは、対応する減少の判定は ratio < “0.5” となるでしょう。では、 ratio > “1.5” と判定したときは、対応する減少の判定は、いくつになるでしょう?

値は 1.5/2 = 0.75 倍になっています。よって、0.5 x 0.75 = 0.375 ???

この話は、log2変換してから (logFC) のほうが分かりやすいかもしれません。「ratio > 2 または ratio < 0.5」 これを logFC にすると次のようになります。

「logFC > 1 または logFC < -1」(絶対値の記号"||"を使うと |logFC| > 1)

ここで “1” は log2(2) です。”-1″ は log2(0.5) ですが、マイナスlog2(2) とも書けます。つまり、log2(1.5) に対応するのは、マイナスlog2(1.5ということです。

logFC の値を ratio に変換 (unlog2) するには、「2のlogFC乗」を計算します。

> 2^1 # 2の1乗は2です。
> 2^(-1) # 2の-1乗は0.5です。

したがって、ratio < ?? に対応する値は、2のマイナスlog2(1.5)乗を計算します。

> 2^(-log2(1.5)) # 0.6666667

答えは ratio < 0.66 です。

 

ratio (fold-change) 1.5 は、 logFC でいくつ?

ratio (fold-change) が 2 のとき、 logFC は “1” です。では、ratio が 1.5 のとき、これは logFC でいうところのいくつなのでしょうか?

これは、ratio の2をlog2変換することで求めることができます。計算は下記のようになります。(統計処理ソフト “R” での計算方法です。)

> log2(2) # 結果は "1" になります。

よって、ratio 1.5 であれば、1.5をlog2変換します。

> log2(1.5) # 結果は "0.5849625" になります。

結果は、0.5849625 なので、logFC では 0.58 となります。(発現変動遺伝子を判定するときに用いるのであれば、少々甘く判定することが多いでしょう。)