真夏の怖い話(2010.08.26)

今、卒論の4年生二人が線虫糖鎖遺伝子のノックアウト・ノックダウン結果のデータベースを作ってくれています。来年卒業までには公開予定です。Wormbaseというすぐれたデータベースも参照しながら作ってくれていますが、先日怖いことがありました。

私達の実験結果以外に、糖鎖遺伝子のRNAiの結果をWormbaseからとってきて検討しています。この前、四年生が「おかしい、前調べた遺伝子のRNAi異常の表現型がなくなっている!」と騒いでいました。ある遺伝子のRNAiの結果で、locomotion abnormalの他、様々な異常があると記入していたのに、今調べたら異常なしになっているというのです。私達が以前、異常なしというのを確かめていた遺伝子だったので、どうせみまちがえていたんだろうと思いました。しかし

「二人で別々に確認したので、絶対まちがっていません!」 ときっぱり。

うーん。良くある間違いは、「No abnormalities were observed in the following experiments:以下の実験では以下の異常な表現型はみられなかった」という部分を間違えて表現型があると思いこむことです。しかし今回はその部分にはlocomotion abnormalなんてないし、やっぱり彼らが正しいかも、と思いました。

彼らが調べた時期は6月頃。そのころのWormbaseはWormbase release 210, 今のはrelease 215です。ひょっとして、と思い、Wormbase のtop pageの右下のほうにあるReferential Data Freezesを使ってrelease 210のデータを調べてみる事にしました。Wormbaseでは作業をしたときに使ったWormbaseのversionが変わってしまってデータベース検索結果が再現できないということがないように、それぞれのreleaseが保存してあります。これがfreezeと呼ばれるものです。WS210というのを選んで調べてみました。

結果は四年生が正しかったのです。ごめん!よくも注意深くデータベースの変化に気づいてくれました。さすがです。

彼らの調べた遺伝子のRNAiの表現型の欄にはlocomotion abnormalなどいろいろずらっと表現型の異常の項目が並んでいます。リンクをたどるとリンクの先にも異常に関するデータが並んでいます。しかしより古いversionや最新のversionのデータベースには、異常な表現型なしとなっています。念のためRNAiのoriginalの結果をみましたがやはり異常な表現型なしが正しかったのです。
ということで、教訓は

四年生を信じましょう、というのと、
Wormbaseほどのデータベースでも時として誤りがまぎれこんでいることがあるということです。
Wormbase release 210でデータマイニングの作業をしていた方は注意して下さい。

昔、四年生の論文購読の演習授業で先生がわざと誤りの入った論文を教材として読ませて、論文や書物にも誤りがありうるのだというのを、体得させる授業をされていたのを思い出しました。データベースでも同じです。こういう経験はやはり大事ですね。
(写真は同じ生物科学部門の仁田坂先生から大学院説明会でいただいた種から育って我が家の庭で咲いた朝顔です。)