バイオインフォマティクス

昨日、バイオインフォマティクスの基礎講座を受講させていただいた。17日に行われた分子生物学、分子遺伝学の続編にあたるものだ。

内容としては、代表的な公共データベースやアプリケーションの種類を知り、場面に応じた活用方法を体験してみようというもの。

題材となるクエリは先生が与えて下さり、こいつをBLASTにかける。この時点でどの生物の塩基配列かは受講者に知らされず、BLASTによって抽出されたデータから何かを定めるという課題から始まった。生物が特定された後は、同じくBLAST抽出されたデータ中、上位5つのクエリを使って・・・と、短い時間の中で系統樹の作成までを教わった。3時間のセミナーであったが、「あっ!」 っという間に時間が過ぎていったのである。

そして今日、仕事を早めにあがり自宅へ帰ると妻は息子二人を連れて外出中。ふと思い立ち、昨日のおさらいをしてみることにした。しかし、昨日先生の与えてくれた題材を使うのはあまりにも芸がない。なにか面白そうなネタはないかと考えてみる・・・

クマムシ

そう、あの独特の風貌と奇跡の身体能力を誇るあの「クマムシ」。こいつについて、何らかのデータを引っ張ってみよう!

まずはグーグルでクマムシの学名を調べ、SRSで検索をかける。抽出されたいくつかのデータの中で、

AY305483|Macrobiotus islandicus elongation factor-1 alpha mRNA, partial cds.

を選んだ。ちなみにMacrobiotusはクマムシの学名だ。elongation factorはタンパク質合成の際に必要な伸長要因のこと。mRNAはメッセンジャーRNAの略。

クマムシにもいろいろな種類が存在するようなので、それらの比較をしてみようと思ってしまったのである。さっそくこいつのアクセッションナンバーをgetentryへ! ちゃんと形式も「全塩基配列FASTA」を選ぶ。流石に昨日の今日ではまだまだ覚えているな。

ここで得られた塩基データをBLASTにかける。

???

おいおい、クマムシちゃんは? 自分のぶちこんだデータ以外Macrobiotusの文字がない・・・。その代わり、見たことも聞いたこともない学名がズラり。ちびちび学名をコピーしてはグーグルで検索。すると、学名は違うがクマムシに酷似している生物がいるではないか! そんなこんなで上から40件ほど見ては検索を続け、次の7種類をチョイス!

AY305483|AY305483.1 Macrobiotus islandicus
AY305485|AY305485.1 Richtersius coronifer
AY305473|AY305473.1 Orchesella imitari
AB003718|AB003718.1 Escarpia sp.
AY305482|AY305482.1 Isohypsibius elegans
AF240880|AF240880.1 Trogulus nepaeformis
AF240792|AF240792.1 Cylindroiulus punctatus

クマムシに良く似たRichtersiusとIsohypsibius以外はトビムシっぽいのが二種類、クギみたいな生き物が一種類、ムカデのようなグロテスクなやつが一種類だ。

再びgetentryを使ってそれぞれのelongation factor-1 alpha mRNA, partial cds.情報を取得。こいつをテキストファイルに保存し準備万端。

今度はClustalWを使ってアライメント! 実は私、アライメントの結果をみるのが結構好き。何が好きって、専門的なことが分からなくても、「へぇ〜、違う生き物なのに、結構同じような配列してやがるんだな」と単純に感心できるからである(あ、そうそうBootstrapはOnにするって言ってたな)。

それはさておき、後で系統樹を作るために.phb形式ファイルでアウトプットだ。


生成されたphbファイルをいよいよNJplotで読み込む。

「おお!!!」

7種類の生き物の系統樹ができた。当然のできごとなのだろうが、ド素人の私にとっては驚きの瞬間だ。クマムシ系の連中と、トビムシ系、その他の虫系とやはり系統が分かれる。しかし、さかのぼってみると合流するポイントがあるわけで、それが実に面白い。

その他ClustalXでのアライメントも視覚的に楽しかったな。

そんなこんなで、ちょっとしたお遊び・・・いやいや復習が終わったのである。まったく下手なゲームよりよっぽど面白い。高校生くらいなら体験させてあげてもいいんじゃないかな。