Gene Ontology (GO) とアノテーション

Gene Ontology (GO)

オントロジー[1]とは、もともとは、工学や情報科学の分野で使用されていた考え方です。このオントロジーを使って、生物学的な言葉(単語、用語)を整理したものが Gene Ontology (GO) です。

論文などで、「GO」というと、時々、遺伝子の機能を説明するデータベースのように扱われていることもありますが、あくまで「用語集」であると理解しておいた方がよいでしょう。

GOとアノテーション

確かに、GO を使ったデータベースとして、 AmiGO などがあります。これは、GOに含まれる特定のターム(用語)に対して、それをアノテーションに持つ遺伝子を逆引きできるようにしたものです。果物を例に考えると、「赤」という用語でデータベースを検索すると、「赤」をアノテーションに持っていることが登録されている「りんご」や「いちご」が表示されるというイメージです。

アノテーションのイメージ
アノテーションのイメージ

しかし、特定の遺伝子に GO を割り当てる(関連づける)作業を AmiGO が行っているわけではありません。その作業は、MGIなどの各コンソーシアムで行われています。上記の例でいうと、「りんご」に「赤」や「丸」、「甘」、「酸」などの用語を関連づける作業(=アノテーション)となります。このとき、各自が自由な用語を使ってアノテーションを行うと、後々、整理に困ります。そこで、あらかじめ使用できる用語を限定しておき、その限定された用語(用語集)を使って、アノテーションを行うようになったのです。遺伝子にアノテーションする場合に用いる用語集が、「GO」というわけです。

[1] http://www.atmarkit.co.jp/aig/04biz/ontology.html