jamoviで学ぶ統計学―統計ソフトRをもとにした統計学のスプレッドシート型グラフィカルインターフェイスの紹介

このブログでは統計解析のためのおすすめソフトとしてRを紹介してきました。

ネットサーフィンしていると、jamovi(ジャモウヴィと読むようです)というソフトがあるのに気づきました。これは無料で使えるRをもとにしたソフトで、スプレッドシートでSPSSなどの高価な有料ソフトと似たわかりやすい使い方ができ、かつ無料のソフトだそうです。jamoviの “syntax mode”をつかえば、解析にjamoviが用いているRのコードが表示されそれをRにコピーして使うことができます。逆に、Rj Editorというjamoviのモジュールをjamoviに入れて使うと、Rのコードをjamovi内で利用することもできます。windows, mac, linux, chrome OSで利用でき、使い方のビデオや、jamoviを使った統計学の教科書(Version 0.70, 2019)も無料で公開されています。これはLearning Statistics with R(Navarro DJ著)に基づいた教科書で、なんと日本語版(Version 0.65の翻訳)も芝田征司先生が作成して公開されています。心理統計と初歩の入門者向けの本とのことですが、Rや RStudioより初心者向きの解析ツールを探しているかたなど、興味のある方は使ってみると良いと思います。

写真は家で実っているリンゴです。今年は昨年より沢山花が咲いたため、10個以上の実がなっています。

京都大学の動画サイトの紹介です―福岡では桜が本日開花しました

今朝 散歩しているとき、桜の花が開花しているのを見つけて写真にとりました。福岡市近郊での写真ですが、福岡市でも桜が開花したそうです。つくしもずいぶん大きくなっていて、近所の奥さんから どっさりいただいて先週おいしくいただきました。春のはじまりです。

今日は京都大学の動画サイトを紹介します。
京都大学OCW (Open Course Ware) というサイトです。理学部や医学部、医学研究科など京都大学の様々な講義、講演のビデオやシラバスが集められて公開されています。

上のリンクからいろいろ探してごらんになるといいですが、たとえば
聴講コース 臨床研究者のための生物統計学 (AMED生物統計家育成支援事業
聴講コース 臨床研究者のための生物統計学)という医学研究科のコースには、ここをコピペしただけですが以下のような講義のビデオがならんでいます。
宇宙怪人しまりす医療統計を学ぶ」(岩波科学ライブラリーに二冊あります)の著者の佐藤先生や挿絵を描いておられるという奥様の講義もみられますので是非ご覧ください。

第1回 2017年5月25日 なぜランダム化が必要なのか?
(日本語字幕あり)
田中 司朗 特定教授 Video
第2回 2017年7月20日 リスクの指標と治療効果の指標
(日本語字幕あり)
田中 司朗 特定教授 Video
第3回 2017年10月19日 仮説検定とP値の誤解
(日本語字幕あり)
佐藤 俊哉 教授 Video
第4回 2017年12月21日 生存時間解析の基礎
(日本語字幕あり)
米本 直裕 助教 Video
第5回 2018年2月1日 メタアナリシス
(日本語字幕あり)
田中 司朗 特定教授 Video
第6回 2018年5月17日 統計家の行動基準
この臨床試験できますか?

(日本語字幕あり)
佐藤 恵子 特任准教授 Video
第7回 2018年7月12日 データマネジメントとは
(日本語字幕あり)
多田 春江 特定准教授 Video
第8回 2018年10月25日 ランダム化ができないとき
(日本語字幕あり)
佐藤 俊哉 教授 Video
第9回 2018年12月20日 交絡とその調整
(日本語字幕あり)
佐藤 俊哉 教授 Video
第10回 2019年2月21日 回帰モデルと傾向スコア 佐藤 俊哉 教授 Video

そのほか、理学部をみると、細胞内情報発信学という講義が掲載されおり森 和俊 先生(理学研究科教授)の講義がみられます。3年生向けの講義ですが、面白そうです。

その他いろいろ探して各人の興味にあった講義を聴講してみてください。

夏休みおすすめソフト(3)RstudioにR commanderとそのプラグインEZRを入れてみよう―EZRインストールのトラブルシューティング

前回はRとRstudioの紹介をしました。続いてRstudio上からRのプラグインであるR commanderと、RコマンダーのプラグインであるEZRをインストールする方法を紹介しようと、最新版のRを使って紹介記事を書いていたのですが何故かEZRのインストールがうまくいきませんでした。Rcmdr(R コマンダー)をRstudioからインストールしたあと、EZRをRstudioからインストールする時うまくいきませんでした。解決したのでうまくいったRコマンダーとEZRをインストール法を紹介しておきます。

前回紹介した方法でRをインストールし、次にRstudioをインストールします。
次にRstudioを起動してRcmdrをインストールします。やり方は、

Rコマンダーのインストール:
右下のpane(パネルのようなもの)からpackagesタブを選びます。boot, class, clusterなどのsystem libraryのパッケージがすでに存在するのがわかります。アルファベット順にならんでいるのでずっとリストをみていってもR commanderなどのパッケージ(Rcmdrなど)はありません。これをインストールするのが今回の作業です。 右下パネルのInstallタブをクリックします。すると新しいウインドウが開いてpackagesという部分にカーソルが点滅していますので、そこにrcmdrといれてみましょう。ポップアップがでてきてRcmdr以下、RcmdrMiscとかRcmdrPlugin.aRnovaなどがずらーっと一覧ででてきます。下ののほうにRcmrPlugin.EZRもありますね。まずRcmdrを選択します。install depencenciesのチェックがはいっているので、そのままにします。そしてInstallボタンを押します。すると左下のコンソールpaneにいろいろいろ赤字で表示がはじまり、packagesを次々と解凍してインストールしているのがわかります。結構な時間がかかると思いますが終わるまで気長に待ちましょう。赤字でいろいろ経過が表示され、その後、カーソルが点滅してすすまなくなったように見えますが、5分も放置しておくと次にすすむようでパッケージの解凍などに時間がかかるようです。コンソールパネルにThe downloaded binary packages are in どこそこ、というパッケージの保存場所の表示がでたら終わりです。終わると右下のPane{パネル)に前にはなかった様々なパッケージがあるのがわかります。パッケージの表示パネルにRcmdrとRcmdrMiscが表示されているのを確認してください。

次に、library(Rcmdr)とコンソールにうちこんでR commanderを起動。see ?effectsTheme for details.という赤字のメッセージでRstudioのコンソール画面は止まるので、Rstudioのウインドウを最小化して画面をみると、「Rcmdrが利用する次のパッケージがありません」というメッセージのでているポップアップウインドウがあり、「これらのパッケージをインストールしますか?」ときいてくるので、はいをクリック。すると、「ないパッケージをインストールする」という画面がでるので、CRANの指定でOKを押します。

Rstudioにもどって見ていると、つぎつぎと赤字でインストールがすすみます。そしてインストールが成功すると>の印がコンソールにでますので、インストール終了です。

コンソールにlibrary(Rcmdr) とうちこんでエンターを押すと、Rコマンダーのポップアップウインドウが自動で開きます(日本語です)。

EZRのインストール:
上の図のR コマンダーのメニューのツール(ヘルプの左)をクリックして、Rcmdrプラグインのロードをクリックします。(ここが大事なのですが、この段階で、Rstudioの右下のPackageのパネルでRcmdrPlugin.EZRにチェックが入っていないことを確認してください。つまりRにロードされていませんので注意してください。私は最初、Rcmdr, RcmdrPlugin.EZRの順にRstudioの右下パネルでチェックをいれて、Rコマンダーを立ちあげていました。そうするとEZRがこのプラグインのロードに表示されない=RコマンダーからEZRが使えないという不具合が起こります。必ずPackageのパネルでEZR pluginにチェックが入っていないことを確認してください。上の図のようにプラグインにEZRが選択されて表示されているので、OKをクリックします。するとRコマンダーを再起動しないとプラグインを利用できません、再起動しますか?(下図)ときいてくるので「はい」をクリックします。

再起動するとEZRの画面がでます(下図)。Rstudioとは別のウインドウに表示されるので注意してください。

メニューの一番右に「標準メニュー」というのがでていたら成功です。ここに本来のRコマンダーのメニューがあつまっていて、Rコマンダープラスアルファの機能がその他のメニューから使えます。解析結果のグラフなどはRstudioのplotパネルではなく独自のポップアップパネルにでてきます。

Rstudioにもどってみると、右下のパネルのPackageのところのRcmdrPlugin.EZRにチェックが入りました。

EZRを閉じるときには、Rコマンダーのメニューから閉じて、その後、Rstudioを閉じてください。

以上です。

その他のRstudioについての注意:
1)RstudioではLinuxとおなじようにTab補完機能が使えます。たとえばコンソールでlibrary(Rとうちこんでtabキーを押すと、RcmdrとかRcmdrPlugin.EZRとかの候補がポップアップしますので、適当なのを選んでエンターをおせば入力の手間がはぶけます。これは便利な機能です。

2)あとR commanderが起動している状態でRstudioを終了するときの注意。Rstudioでquitコマンドをいれても永遠に終わらないので困ります。これは、R commanderの終了画面でOKをおさないとR コマンダーが終了できないためです。RstudioのquitコマンドではRコマンダーはquitできず、quitting sessionsが永遠に続くのです。

3)インストールしたパッケージは、ドキュメントのフォルダにあります(windows7以上の場合)。まっさらにRをしたいときは、Rをアンインストールした後、このドキュメントフォルダ内の、Rフォルダを削除しないとパッケージは残ります。

4)Rstudioでは4つのpaneが表示されるといろんなところに書いてあります。でも一番左上のソースエディタが表示されていない人が多いのではないでしょうか。これを表示させるには、ToolsからGlobal Options、Pane LayoutとすすみEnvironment, History, connections, presentationsと並んである画面にあるViewerのチェックをいれると表示されるようになります。もう一つよくあるのは、ソースエディタが隠れていて見当たらないケースです。この場合は、sourceと書いてあるのでわかります。その部分をマウスでドラッグして拡げればソースエディタが見えるようになります。

夏休みおすすめソフト(1):無料で最強の統計ソフト RやRStudioを使ってみよう!インストール法とパッケージがインストールできないとき。

夏休みのおすすめソフトを紹介します。統計学の重要性は「統計学が最強の学問である」(西内啓 著)という本をきっかけに、ビジネスの世界にも広く認識されたようです。この本で、はじめて一般化線形モデルという言葉がひろく紹介されたと思います。本屋にいってみるとR(アール)という統計ソフトの入門書や専門書がたくさんならんでいて、このソフト(無料で、統計解析では最強のソフトです)が広く使われていることがわかります。MacでもLinuxでもWindowsでも動くソフトで、有料の統計ソフトをしのぐソフトですので、ますますこれからも使われていくと思います。私も学生さんにRとPythonとLinuxを勉強しておくと将来絶対必要になるので早めに学ぶことをすすめていました。生物系では統計学は必須ですし、バイオインフォマティクスや次世代シークエンサーのデータ解析にもRは大活躍しています。今ではRのパッケージのR commanderや日本の神田善伸先生(自治医科大学)が開発されたEZR(これも大評判になってRのパッケージになりました)がありますので、グラフィカルインターフェースでRを使うことができて、初心者にもやさしいソフトとなりました (これらはRをインストールしたあと、パッケージとして追加インストールして使います。EZRはR commanderの追加プラグインになっています。インストールするとどちらも日本語で使えます。EZRを中心に使いたい場合は開発者の神田先生のサイトからダウンロードして使うのもおすすめです)。また、RStudioというRの統合開発環境ソフトを使えば、Rをもっと便利にスムーズに利用することができるようになったので、Rはますます便利で使いやすくなっています。

Rをインストールするのは簡単で、まずCRANというサイトにいって、ダウンロードサイトから自分のコンピュータに応じたRのインストーラーをダウンロードします。Mac版、Linux版もありますし、Windowsの場合はここから、最新版のR 3.5.1をダウンロードして、インストールできます。
Download R 3.5.1 for Windows (62 megabytes, 32/64 bit)という部分をクリックしてダウンロードして、インストールしてください。インストールする場所はデフォルトでよいですが、空きの多いドライブにするのもよいでしょう。インストールが終わったら、とりあえず起動ができることを確認してください。

Rのインストールが無事終わったら、続いて、RStudioをインストールしましょう。ダウンロードページをひらいて、Rstudio Desktop Open Source LicenceのDownloadボタンを選んでダウンロードします。windows版、Mac版、ubuntuやfedra用のlinux版があります。自分のOSにあったものをダウンロードしますインストールは簡単ですぐ終わるので終わったらRstudioを起動してください。RStudioを使ってRを使い始めるのも良いと思います。
Rstudioの使い方については、統合TVのビデオ
あるいはそのYouTube版をみてください。

とてもわかりやすいです。
もっと新しいMac版のRStudioの使い方ビデオもあります。Windows版でもほとんど同じですのでこれも参考になります。

その他、RやRstudioの使い方については、YouTubeで検索するといろいろなサイトがでてきます。後日、いくつかサイトを紹介する予定です。(9月17日追記、RstudioにRコマンダーとEZRをインストールする方法については続きの記事→ここをご覧ください!)

さて、昨日からRでの統計解析をしようとパッケージのダウンロードをRStudioで行おうとしたのですが、うまくいきませんでした。以下はその解決法です。

症状エラーメッセージ(以下を参照)がでて、R やRStudioはちゃんと起動しているが、あらたにパッケージがインストールできない。RstudioからでもR本体(64ビット版でも32ビット版でも)からでも同じことでエラーがでてパッケージのインストールができない。Rのメニューの「パッケージ」から「CRANミラーサイトの設定」を選んでTokyoなどのミラーサイトを選ぶと、コンソールに以下のようなメッセージがでてパッケージがインストールできない。ネットにはつながっているようで、httpsでなくhttpのミラーを選べば、ちゃんとサイトに接続できて、パッケージをインストールできることがわかった。一台のパソコンだけでこの症状がでているので、たぶんネット関係の設定がおかしいのだろうとは思いましたが、原因は不明でした。以下がエラーメッセージです。
> chooseCRANmirror()
警告: failed to download mirrors file ( URL ‘https://cran.r-project.org/CRAN_mirrors.csv’ を開けません ); using local file ‘C:/PROGRA~1/R/R-3.5.1/doc/CRAN_mirrors.csv’
警告メッセージ:
download.file(url, destfile = f, quiet = TRUE) で:
InternetOpenUrl の失敗: ‘失効サーバーに接続できなかったか、最終応答を取得できませんで(以下略)

解決策を探す:
Google検索を、failed to download mirrors file ( URL ‘https://cran.r-project.org/CRAN_mirrors.csv’ でやってみると、たとえばここのペーに同じようなトラブルに見舞われた人が質問していて、それに対する解決策がでていた。症状もhttpならOKでhttpsではだめだというので同じ。R consoleからネットにつながるのも同じだが、どうやらproxy設定とかが問題らしい。Firefoxの設定をInternet Explorerに反映させれば解決すると書いてあるだけで、あと一歩、親切に書いてない。プロキシは使っていないし、ファイアウオールを切っても症状はかわらないし、もちろん Rをクリーンインストールしてもだめだったし…。ちょっと途方にくてしまいました。

解決策がみつかった:
気分を変えて、今度はエラーメッセージの後半
「InternetOpenUrl の失敗: ‘失効サーバーに接続できなかったか、最終応答を取得できませんで」を使って検索すると12057エラーというのが起こっていることがわかりました。その対策はここの記述によると「Internet Explorerで「ツール」→「インターネットオプション」→[詳細設定] タブ の中にあるセキュリティセクションにある- “サーバーの証明書失効を確認する” と “発行元証明書の取り消しを確認する” のチェックを外します。 Internet Explorer を再起動し、上記変更が反映されているか確認します。」(野村がわかりやすいように一部を追記改変) だそうで、このとおりすると解決しました。

上の二つのチェックボックスうち、最初の“サーバーの証明書失効を確認する” のチェックを外すだけでよさそうで、これでパッケージが無事インストールできるようになりました。また同様のことが起こった時の解決用のメモとして記事にしておきます。

写真は前と同じところで撮影したアメンボです。まだ元気に何匹も泳ぎ回っています。

2017.01.01 元旦

本年もどうぞよろしくお願いいたします。
左の 写真は氷川。本年の元旦はこの有名な船の写真にしました。昔、たくさんの研究者がこの船にのって外国留学しました。私が学生だったころ、発生生物学会が横浜で開催された時(第25回大会)は、懇親会がこの船で開催されました。先生がたが
「この船でいきましたなぁ」と、感慨深げに語っておられたのを覚えています。今は、多くの留学生を迎える我が国です…。
お休みに読める無料本がありますので紹介しておきます。The Gene Ontology Handbookです。
Open Accessの本ですのでどなたでも無料でダウンロードできます。
GO termをよくつかう私達ですがとても勉強になる本だと思いますので是非ご覧ください。
もう一つ、統計解析に私たちがよく使っているRについてのニュースです。
Multi-threaded math libraries を含んでいて計算がスピードアップされている他、信頼性をあげ、かつ互換性をたもっているというMicrosoft R Openというものがでています。
Microsoft R Openというもので、RStudio も使えるそうです。一度お試しください。

では本年もどうぞよろしくお願いいたします。皆様にとって今年が素晴らしい一年でありますように。


新しいPowers of Ten :ものの大きさの旅 プランク長から宇宙の果てまで 大学図書館を活用しよう―その2です(2015.06.12)

まず7月6日(月曜日)、7月7日(火曜日)に開講される三谷昌平先生の特別講義開講のお知らせです:学部3年生も聴いて得るところが多い講義ですので多数の学生の聴講をすすめます。

東京女子医科大学の三谷昌平先生をお迎えしての特別講義が7月6日,7日の2日間箱崎で開講されます。「線虫のゲノム機能解析と医学・生命科学への展開」というタイトルで,線虫C. elegansを全く使ったことのない学生にも、本格的に研究している研究者にも役立つ講義をしていただきます。学部生から大学院生に最適の講義ですので、是非聴講におこしください。

線虫の飼育と保存,形態や細胞系譜,遺伝様式にはじまりトランスジェニック解析・RNAi・遺伝子破壊から線虫の表現型など線虫を医学・生命科学にこれから使ってみようかなと思っている医師医学研究者・学生に大いに役立つ講義です。

The Scale of the Universeというweb pageをみつけました。これは昔、本ででていたPowers of Ten の最新版のようなものです。

Firefoxではみられないので、ブラウザをIEにかえてここにアクセスすると、Adobe Flash Playerの使用を許可しますかという画面がでるので許可してから、利用してみてください。AppleのiOS版もある(120円)そうですので、そちらをみるほうがいいかもしれません(2018年4月3日追記)
身近なものの大きさからウイルス、核酸、αヘリックスや水分子、原子、原子核など小さなもの。そして家やエッフェル塔、地球や土星、オールトの雲、マゼラン星雲から宇宙のはてまで、interactiveに大きさのスケールを体感させてくれるホームページです。3 メートルもあるミミズとか,顕微鏡でみることができる巨大なウイルスMimivirusとかも載っています。
細胞の大きさといえば、細胞生物学の授業でも先日紹介した本:GoodsellさんのThe Machinery of Life (second edition)という本が面白いと思います。細胞の構造を実際のサイズで描いたカラーの図が満載の本で,細胞内部がけっこう混み合っているというのがよく分かります。翻訳本は「生命のメカニズム―美しいイメージで学ぶ構造生命科学入門」というタイトルで今年発行されました。英語の本でよければ九大関係の人は学内からあるいはSSO-KIDとパスワードで自宅などからアクセスして一冊まるごとダウンロードできます(2016.1.29注:去年は可能でしたが契約変更のためもうダウンロードできなくなりました!残念です)。 前に紹介したようにSpringer社の多くの書籍はhttp://link.springer.comから,無料でダウンロードできます。

下は上のリンクからGoodsellさんの本をダウンロードできるページにいったときの写真です。

大学図書館はいろんなサービスを提供しています。

今日は大学の中央図書館で読める日本語の本の紹介です。丸善eBook Libraryをクリックするといろんな本がオンラインで読めます。TOEIC対策本や就職活動に役立つ本、数学や生命科学の本からピケティの21世紀の資本だど文科系の本まで、多くの本が大学図書館経由でオンラインで読めます。すこしづつダウンロードすることもできます(一回に最大60ページまで)ので九大関係の方は是非試して下さい。たとえば以下の本はどうでしょう。そのほか、分子生物学講義中継など羊土社の本などもありますので、ブラウズしてみてください。英語の冠詞の本だの就職関係の本、iPadの本などなどいっぱいありますよ。以下は読める本のタイトルの例です。

遺伝統計学の基礎 ―Rによる遺伝因子解析・遺伝子機能解析―

おもしろ遺伝子の氏名と使命

いかにして問題をとくか・実践活用編

Microsoft Excel 2013対策テキスト&問題集 WordやPowerPointの本もあります

エントリーシート完全突破塾 [2016年度版]

就職活動がまるごと分かる本

3か月でやり直し!英語モジュール学習法

分子生物学講義中継 セット

バイオ実験超基本Q&A ―意外に知らない、いまさら聞けない―改訂版

やるべきことが見えてくる研究者の仕事術 ―プロフェッショナル根性論―

ライフサイエンス英語表現使い分け辞典

ライフサイエンス文例で身につける英単語・熟語

医師のためのモバイル仕事術 ―iPad/iPhoneを使い倒す!―新版

Rによる統計解析

Rによるやさしい統計学

医薬研究者のための統計記述の英文表現 改訂3版

国際誌エディターが教えるアクセプトされる論文の書きかた

21世紀の資本 ピケティ

2015年、あけましておめでとうございます!大学図書館を活用しよう―その1です(2015.01.13)

 あけましておめでとうございます。
本年も皆様にとってすばらしい一年でありますように!
自宅で余った干し柿を庭木につるしておきました。すると春を告げる鳥たちがこまめに食べにやってきています(写真)。春ももうすぐです。
去年の末にSpringer社からGlycoscience Biology and Medicineという本が出ました。私達もコンドロイチンやGPI anchorの話を書いています。この本(e-bookもあります)は糖鎖生物学とその医学への応用について基礎から最新の成果までコンパクトにまとめてある本で是非、図書館には備えておいて欲しい本です。同様な趣旨の本が(これにも私達が書いた章があります)、今年日本語でも刊行されますので(NTS社)、糖鎖生物学を学ぶためのテキストとして両者をお勧めします。
さらにHandbook of glycosyltransferases and related genes 2nd editionという本もお薦めです。この本の線虫の糖鎖遺伝子についての項目のほとんどに私達の仕事が引用されています。九大のメンバーなら大学経由で各章をダウンロードできますので、研究・学習に役立てて下さい。
上の本にかぎらずSpringer社の多くの本は、九大がSpringerと契約を結んでいるため、無料で読むことが出来ます。残念ながら最初に紹介した本は駄目ですが、
Methods in Molecular Biologyシリーズなどは2014年-2015年分までは全部pdfでダウンロードできます。 なお2016年分は今のところダウンロードできます(2016.01.29追記)九大の方は、このリンクからSpringerのサイトにつなぎ、
Browse by disciplineからLife Sciencesとか、Statisticsとかを選びます。
その後、表示されるページから、Content typeでBookをクリックし、さらに九大からダウンロードできる本に限定するため、Include Preview Only Contentという左上の鍵マークの部分のチェックを外します。するといろんな本が表示されますが、どれもダウンロードできます。表示をsort してnewest firstにすると便利だと思います。RNA Interference
Chromosomal Mutagenesis
RNA bioinformatics
Epistasis
など丸ごとダウンロードして読めます。Methods and Protocolsシリーズは全部無料です。
例えば平林淳先生が編集されたLectinsという本などは以下からダウンロード出来ます。

統計学の本では、Statisticsのジャンルで探せば
Excel 2013 for Biological and Life Sciences Statistics
Bayesian Essentials with R
Functional and Phylogenetic Ecology in R
とか、SpringerのRを使ってみよう(Use R!) シリーズなど、英語版ですが、無料ダウンロードできます。他に、物理の本とか哲学の本とかいっぱいあります。
是非、大学図書館を活用して下さい!(2015.01.13)

新学期が始まっています! (2012.04.18)

線虫  C. elegansのデータベースWormbaseが一新されました。 前のWormbase(今はlegacy siteにあります)とはデザインが全く違うので、慣れないとめちゃめちゃ使いにくいです。そこでごく簡単な使い方入門のpdfをこしらえました。ここにありますので、ダウンロードしてお使い下さい。

卒業式が終わり、あっという間に新学期がはじまりました。GPIアンカー合成の意義を明らかにした博士論文で学位を取得した村田大輔君は、大阪大学医学部の金井好克先生の研究室に就職しました。ミネソタ大学の中藤先生のところでポスドクをしていた出嶋克史君は、今年から米国のカリフォルニア大学サンディエゴ分校で学術振興会のJSPS postdoctoral fellowとして活躍を始めました。線虫の研究をしているChisholmさんの研究室ですが、近くには糖鎖生物学の大家のJeff Eskoさんもおられるようです。私達も新しい卒論生を迎えて新年度早々から実験に励んでいます。

桜の花は散りましたが私達のいるコラボステーションIIがある馬出地区のキャンパスでは八重桜や写真のような緑の桜の花がきれいに咲いています。大学病院にこられる患者さんや家族の方々も見物しておられます。新学期ですので、新入生や進級した学生のみなさんに参考になるような話をまとめておこうと思います。

英語を使う能力は今後、在学中、卒業後を通じて絶対役立ちますから、時間をみて向上させておいてください。今はYouTubeなどで英語のプレゼンを聞くのも簡単ですし、無料の英語講座などもYouTubeなどにありますからいろいろ視聴してみると、リスニングも上手になると思います。
大学院入試でTOEICが英語の試験の代わりになっているところが激増しています。就職活動のとき企業にだすエントリーシートにもTOEICの得点を書き込む欄があるところが増えているようです。TOEICテストは練習しだいで結構点数が上がるようですから、皆さんの大学などで提供されているTOEIC練習用の無料プログラム(以下はリンク切れです。2018年4月追記:九州大学ならここにあります技術英語や医学英語の勉強コースも同じ所にあります。試してみて下さい。)や授業をせいぜい利用して、一年生から勉強をはじめて卒業前には750点以上はとれるようにするとよいようです。

コンピュータは今や必須の勉学アイテムですから、絶対自分のパソコンをもって勉強に役立ててください。
九大ではこのアドレスからたどれるソフトウエアのライセンスプログラムもありますので、Microsoft Officeなどは学生個人のコンピュータに無料でインストール可能です(制限など詳細は大学のホームページをご覧なさい)。九大のようなライセンスプログラムをもっていない大学も多いので、九大はとても恵まれていると思います。)Windowsも下位バージョン(Home editonとかです)がインストールしてあるコンピュータさえあれば、九大のライセンスで無料でバージョンアップして最上位バージョンにグレードアップすることができます。
Windows7 EnterpriseエディションではVirtual PCがはじめからついてきますし、XPモードもあります。Virtual PCやVirtualboxというソフトを使えばWindowsのパソコンでLinux(下を参照)を動かすのも簡単です。

 

プログラムをやってみようかなと思っている人もいると思います。私の時はFortranとかBasicの時代でしたが、今はいろいろプログラム言語があります。私は統計解析によく使われるRから勉強しておくとすぐ役立つのでおすすめだと思います。全く無料ですし、以前紹介したように大量の無料の解説サイト、ビデオ、わかりやすい書籍などがあふれています。統計解析を使ってなれながら、理論面を授業で学ぶとよいと思います。PerlとかRubyとかいうプログラム言語も生物科学ではよく使われています。Rの次におすすめです。

また無料のOS(オペレーティングシステム)であるLinux(りなっくす)をコンピュータにインストールして使うのもやってみると良いと思います。最近ではubuntuなどインストールしやすいLinuxがありますので、、インストールして使ってみるとよいでしょう。(Virtualboxをインストールして仮想マシーンを作成し、仮想マシーンにubuntuのisoイメージをつかってubuntuをインストールするのが簡単でしょう。詳しくはいつか時間があるときに書きます) LinuxはUNIXをモデルに開発されたオペレーティングシステムですので、コマンドも昔からずっと同じで一回学んだコマンドが何十年も使えるというメリットも大きいと思います。バージョンアップも無料ですし、世界中で使われていて、バイオインフォマティクスなど生物学の分野でもLinuxでしか動かない有用なプログラムが多いため、Linuxでプログラムを動かせる能力が研究に不可欠になりつつあるのが現状です。

また物理や数学の好きな人、逆に数式の苦手な人は、数式処理言語のMathematicaの学生版を買って(大学のライセンスを使える人は大学のライセンスを利用して無料で)大学の数学や物理の授業に並行して遊んでみると良いでしょう。Rとならんでこのソフトも将来の仕事で大いに役立つものですので、おすすめです。

今は就職活動の真っ最中の時期ですね。エントリーシートを書いて、何回も面接にいって内定がでた人もいるかもしれませんが、まだまだ活動は続く人がほとんどでしょう。今年卒業して公務員になった私達のところの四年生も内定は秋にずれこんでいました。卒業生には獣医さんをめざしてセンター試験を突破して再入学した人もいます。各卒論生の成果はおいおいデータベースや論文として公開していく予定です。第一弾として遺伝子相互作用の解析システムVisantの使い方をマスターして使い方の手引きもつくった21世紀プログラムの卒業生の「Visant使用のてびき」を近々このサイトにアップロードする予定です。

皆さん、健康に留意してがんばって能力を向上させていってください。

科学の方法1(統計学を勉強しよう)(2011.9.22)

科学の方法について議論するなら、統計学をぬきに議論することは不可能です。科学の哲学的側面に興味がある人は是非、科学哲学を学ぶ時に統計学をおろそかにせずに勉強してもらいたいと思っています。今回は、統計学をてっとりばやく勉強する方法を紹介しましょう。

実験してデータが得られて、値に差があるときその差が本当に意味のあるものなのか(有意差があるのか)、あるいは単なる偶然によって差があるように見えているだけなのかが心配になります。実験のデータ数がまだ少ないのではないか、一体どれくらいのサンプル数を用意したら有意差があるといえるのだろう、など悩みがちなものです。統計学の本は今までは平均、標準偏差とかを紹介した後、二項分布、正規分布などがでてきて中心極限定理とかまでたどりついて息切れというパターンで、実際に使う解析法にたどりつけず統計学が使えないで困っている人が多かったのです。またExcelでも統計解析がある程度できますが、もう少しだけ進んだ統計解析をするのに必要なコンピューターソフトウエアを買いに行くと、3500円かと思ってパッケージをよくみると35000円だったり、十万円を超える値段がついていたりとあきれるような状況でした。安くてよい統計解析のソフトはないものでしょうか。

生物統計学に関するベストセラー「生物学を学ぶ人のための統計のはなし―きみにも出せる有意差」を書いておられる生物科学部門の粕谷英一先生は、統計解析のソフトウエアとして(無料のオープンソースのソフトウエアで世界中で最もよく使われている統計ソフトウエアです。Windows版もMac版もあります)をすすめてくださいました。一元配置分散分析とかt検定、多重比較、一般化線型モデルとかでも、ちょっと勉強すれば誰でもすぐ皆使えるようになります。私達も昔はExcelで統計解析をしていましたが、最近の論文での統計解析はすべてRを使っています。

Rのインストールの仕方、使い方、そしてRを使った統計学の解説は入門レベルから高度な内容まで、インターネットに充実した解説がありますし、本もいっぱいでていますまずはグラフィカルインターフェイスでRを使いやすくするR commanderを使って勉強をはじめるのがお勧めです。R commanderというのはRの補助パッケージで、これを組み込めばデータのグラフなどは一瞬に書くことができて分析も簡単ですので是非R commanderを使うところからRの入門をしてみてください。

私達の研究室で入門用に薦めている本は、
「R」Commanderハンドブック (舟尾 暢男著)です。有名なFisherのアイリスの花の統計解析にはじまってタイタニック号の乗客の生死の解析(1等、2等、3等船客の間、大人と子供、男女などで生死に差があったのかなど)など興味深い例をR commanderで次々に解析しているうちにRと統計に入門することができます。映画タイタニックを観ながら勉強するのもよいかもしれません。

今年に入って、九州大学の伊都キャンパスでの特別講義として、三中信宏先生がRを使った統計解析の入門講義(データ解析概論)をなさいました。なんとその全てが九州大学生物体系学研究室によってYouTubeに公開されています。(三中先生のページの真ん中あたり、統計高座中継にリンクがあります。)

このYouTube講義から勉強を始めればなお簡単に統計学が使えるようになると思います。ExcelからRへのデータ移行は簡単ですのでExcelと併せて使うこともできます。またExcelの中からRを使うRExcelというパッケージもありますので、これをインストールしてもよいでしょう。これをインストールすると自動的にRとR commanderがインストールされて便利です。

昔とちがって、高度な計算がパソコンで簡単にできますので、昔は個人ではほぼ不可能だったデータ解析が手軽にできます。試してみて下さい。