エクセルで値を log2 変換する方法の一例です。LOG 関数を使います。
LOG 関数 LOG(数値,底)
セル A1 に変換したい値がある場合、セル B1 に =LOG(A1, 2) と入力します。
セル B1 に 2 を底としたセル A1 の値の対数が求められます。
底の指定がない場合 (=LOG(A1)) は 10 を底とした対数が求められます。
今回も、引き続き、マイクロアレイ解析結果をLinuxコマンドを用いて簡単に操作する方法を紹介していきたいと思います。今回は、行の整列に関する操作を扱いたいと思います。
データの昇順/降順の並べ替えは、データのチェック時に良く使用すると思いますが、
他の機能と組合わせて使うと効果なチェックを行ったり、形式を整えたりする事ができます。
使い方
sort data.txt または cat data.txt | sort
# タブ(\t)区切りのテキストファイルを、先頭列をキーにして昇順ソートします。
# 他にも、キーに使用するフィールドの指定や昇順/降順の指定などができます。
サンプル> $ cat sorttest.txt orange 100 apple 150 banana 90 grape 300 melon 400 apple 150
# 単純なソート $ cat sorttest.txt | sort apple 150 apple 150 banana 90 grape 300 melon 400 orange 100
# 重複チェックと組み合わせ1(重複を除外) $ cat sorttest.txt | sort | uniq apple 150 banana 90 grape 300 melon 400 orange 100
# 重複チェックと組み合わせ2(重複のみ抽出)
$ cat sorttest.txt | sort | uniq -d
apple 150
今回も、引き続き、マイクロアレイ解析結果をLinuxコマンドを用いて簡単に操作する方法を紹介していきたいと思います。今回は、列の並べ替えに関する操作を扱いたいと思います。
awk
前回紹介したsed同様に、代表的なテキストフィルタリングツールです。
色々な使い方ができるツールですが、今回は使用する機会の多い列の並び替えについてです。
使い方
cat test.txt | awk ‘BEGIN{FS=”\t”; OFS=”\t”}{print $3, $2, $1}’
# タブ(\t)区切りのテキストファイルを、形式は同じで、指定した列の順番($1,$2…)に並び替えます。
# 本例のように、列の並び替えを行うだけの場合は、決まった書き方で対応可能です。($番号を変更)
サンプル> # ターゲットとなるテキストファイル $ cat test.txt no columnA columnB 1 mouse aaa 2 cat bbb 3 mouse ccc 4 mouse ddd 5 cat eee # 列を逆順に並べ替え $ cat test.txt | awk 'BEGEN{FS="\t"; OFS="\t"}{print $3, $2, $1}' columnB columnA no aaa mouse 1 bbb cat 2 ccc mouse 3 ddd mouse 4 eee cat 5 # 列を逆順に並べ替え&抽出 $ cat test.txt | awk 'BEGEN{FS="\t"; OFS="\t"}{print $3, $1}' columnB no aaa 1 bbb 2 ccc 3 ddd 4 eee 5
eArray などのメーカーサイトからアノテーションファイル(タブ区切りのテキストファイル)をダウンロードして、ドラッグ&ドロップでエクセルで開くと、’MARCH*’ や ‘SEPT*’ などの遺伝子名は ‘*-Mar’ や ‘*-Sep’ のように自動変換されてしまいます。
次回、この問題を回避する方法を記述します。