科学の方法1(統計学を勉強しよう)(2011.9.22)

科学の方法について議論するなら、統計学をぬきに議論することは不可能です。科学の哲学的側面に興味がある人は是非、科学哲学を学ぶ時に統計学をおろそかにせずに勉強してもらいたいと思っています。今回は、統計学をてっとりばやく勉強する方法を紹介しましょう。

実験してデータが得られて、値に差があるときその差が本当に意味のあるものなのか(有意差があるのか)、あるいは単なる偶然によって差があるように見えているだけなのかが心配になります。実験のデータ数がまだ少ないのではないか、一体どれくらいのサンプル数を用意したら有意差があるといえるのだろう、など悩みがちなものです。統計学の本は今までは平均、標準偏差とかを紹介した後、二項分布、正規分布などがでてきて中心極限定理とかまでたどりついて息切れというパターンで、実際に使う解析法にたどりつけず統計学が使えないで困っている人が多かったのです。またExcelでも統計解析がある程度できますが、もう少しだけ進んだ統計解析をするのに必要なコンピューターソフトウエアを買いに行くと、3500円かと思ってパッケージをよくみると35000円だったり、十万円を超える値段がついていたりとあきれるような状況でした。安くてよい統計解析のソフトはないものでしょうか。

生物統計学に関するベストセラー「生物学を学ぶ人のための統計のはなし―きみにも出せる有意差」を書いておられる生物科学部門の粕谷英一先生は、統計解析のソフトウエアとして(無料のオープンソースのソフトウエアで世界中で最もよく使われている統計ソフトウエアです。Windows版もMac版もあります)をすすめてくださいました。一元配置分散分析とかt検定、多重比較、一般化線型モデルとかでも、ちょっと勉強すれば誰でもすぐ皆使えるようになります。私達も昔はExcelで統計解析をしていましたが、最近の論文での統計解析はすべてRを使っています。

Rのインストールの仕方、使い方、そしてRを使った統計学の解説は入門レベルから高度な内容まで、インターネットに充実した解説がありますし、本もいっぱいでていますまずはグラフィカルインターフェイスでRを使いやすくするR commanderを使って勉強をはじめるのがお勧めです。R commanderというのはRの補助パッケージで、これを組み込めばデータのグラフなどは一瞬に書くことができて分析も簡単ですので是非R commanderを使うところからRの入門をしてみてください。

私達の研究室で入門用に薦めている本は、
「R」Commanderハンドブック (舟尾 暢男著)です。有名なFisherのアイリスの花の統計解析にはじまってタイタニック号の乗客の生死の解析(1等、2等、3等船客の間、大人と子供、男女などで生死に差があったのかなど)など興味深い例をR commanderで次々に解析しているうちにRと統計に入門することができます。映画タイタニックを観ながら勉強するのもよいかもしれません。

今年に入って、九州大学の伊都キャンパスでの特別講義として、三中信宏先生がRを使った統計解析の入門講義(データ解析概論)をなさいました。なんとその全てが九州大学生物体系学研究室によってYouTubeに公開されています。(三中先生のページの真ん中あたり、統計高座中継にリンクがあります。)

このYouTube講義から勉強を始めればなお簡単に統計学が使えるようになると思います。ExcelからRへのデータ移行は簡単ですのでExcelと併せて使うこともできます。またExcelの中からRを使うRExcelというパッケージもありますので、これをインストールしてもよいでしょう。これをインストールすると自動的にRとR commanderがインストールされて便利です。

昔とちがって、高度な計算がパソコンで簡単にできますので、昔は個人ではほぼ不可能だったデータ解析が手軽にできます。試してみて下さい。