SQL言語 (MySQL)

SQL言語を使った遺伝子の選択

マイクロアレイのデータを処理するときに知っておくと便利なツールとして、SQL言語があります。コンピューターにいろいろな命令を出すのが、プログラミング言語と呼ばれるものです。その中でもデータベースの処理に特化した言語が、SQL言語です。(SQL言語にはいくつかの種類があり、ここでは MySQL という種類を用います。)

プログラミング言語の中でも、SQL言語は、人間にも比較的読みやすい言語です。例えば、次のようなものです。

SELECT ProbeID, GeneSymbol
FROM 'アノテーションのテーブル名';

アノテーションのデータが、データベースのテーブルに格納されていれば、このような表現で、ProbeID と GeneSymbol の一覧を取得できます。

アノテーションの GO に “tumor” を含む遺伝子すべてを取得するには、次のようなSQL(クエリー)を用います。

SELECT a.ProbeID, a.GeneSymbol, a.GO, d.Sample1, d.Sample2
FROM annotation a
INNER JOIN data d
ON a.ProbeID = d.ProbeID
WHERE a.GO LIKE '%tumor%';