SQL言語を使った遺伝子の選択
マイクロアレイのデータを処理するときに知っておくと便利なツールとして、SQL言語があります。コンピューターにいろいろな命令を出すのが、プログラミング言語と呼ばれるものです。その中でもデータベースの処理に特化した言語が、SQL言語です。(SQL言語にはいくつかの種類があり、ここでは MySQL という種類を用います。)
プログラミング言語の中でも、SQL言語は、人間にも比較的読みやすい言語です。例えば、次のようなものです。
SELECT ProbeID, GeneSymbol FROM 'アノテーションのテーブル名';
アノテーションのデータが、データベースのテーブルに格納されていれば、このような表現で、ProbeID と GeneSymbol の一覧を取得できます。
アノテーションの GO に “tumor” を含む遺伝子すべてを取得するには、次のようなSQL(クエリー)を用います。
SELECT a.ProbeID, a.GeneSymbol, a.GO, d.Sample1, d.Sample2 FROM annotation a INNER JOIN data d ON a.ProbeID = d.ProbeID WHERE a.GO LIKE '%tumor%';