夏休みおすすめソフト(1):無料で最強の統計ソフト RやRStudioを使ってみよう!インストール法とパッケージがインストールできないとき。

夏休みのおすすめソフトを紹介します。統計学の重要性は「統計学が最強の学問である」(西内啓 著)という本をきっかけに、ビジネスの世界にも広く認識されたようです。この本で、はじめて一般化線形モデルという言葉がひろく紹介されたと思います。本屋にいってみるとR(アール)という統計ソフトの入門書や専門書がたくさんならんでいて、このソフト(無料で、統計解析では最強のソフトです)が広く使われていることがわかります。MacでもLinuxでもWindowsでも動くソフトで、有料の統計ソフトをしのぐソフトですので、ますますこれからも使われていくと思います。私も学生さんにRとPythonとLinuxを勉強しておくと将来絶対必要になるので早めに学ぶことをすすめていました。生物系では統計学は必須ですし、バイオインフォマティクスや次世代シークエンサーのデータ解析にもRは大活躍しています。今ではRのパッケージのR commanderや日本の神田善伸先生(自治医科大学)が開発されたEZR(これも大評判になってRのパッケージになりました)がありますので、グラフィカルインターフェースでRを使うことができて、初心者にもやさしいソフトとなりました (これらはRをインストールしたあと、パッケージとして追加インストールして使います。EZRはR commanderの追加プラグインになっています。インストールするとどちらも日本語で使えます。EZRを中心に使いたい場合は開発者の神田先生のサイトからダウンロードして使うのもおすすめです)。また、RStudioというRの統合開発環境ソフトを使えば、Rをもっと便利にスムーズに利用することができるようになったので、Rはますます便利で使いやすくなっています。

Rをインストールするのは簡単で、まずCRANというサイトにいって、ダウンロードサイトから自分のコンピュータに応じたRのインストーラーをダウンロードします。Mac版、Linux版もありますし、Windowsの場合はここから、最新版のR 3.5.1をダウンロードして、インストールできます。
Download R 3.5.1 for Windows (62 megabytes, 32/64 bit)という部分をクリックしてダウンロードして、インストールしてください。インストールする場所はデフォルトでよいですが、空きの多いドライブにするのもよいでしょう。インストールが終わったら、とりあえず起動ができることを確認してください。

Rのインストールが無事終わったら、続いて、RStudioをインストールしましょう。ダウンロードページをひらいて、Rstudio Desktop Open Source LicenceのDownloadボタンを選んでダウンロードします。windows版、Mac版、ubuntuやfedra用のlinux版があります。自分のOSにあったものをダウンロードしますインストールは簡単ですぐ終わるので終わったらRstudioを起動してください。RStudioを使ってRを使い始めるのも良いと思います。
Rstudioの使い方については、統合TVのビデオ
あるいはそのYouTube版をみてください。

とてもわかりやすいです。
もっと新しいMac版のRStudioの使い方ビデオもあります。Windows版でもほとんど同じですのでこれも参考になります。

その他、RやRstudioの使い方については、YouTubeで検索するといろいろなサイトがでてきます。後日、いくつかサイトを紹介する予定です。(9月17日追記、RstudioにRコマンダーとEZRをインストールする方法については続きの記事→ここをご覧ください!)

さて、昨日からRでの統計解析をしようとパッケージのダウンロードをRStudioで行おうとしたのですが、うまくいきませんでした。以下はその解決法です。

症状エラーメッセージ(以下を参照)がでて、R やRStudioはちゃんと起動しているが、あらたにパッケージがインストールできない。RstudioからでもR本体(64ビット版でも32ビット版でも)からでも同じことでエラーがでてパッケージのインストールができない。Rのメニューの「パッケージ」から「CRANミラーサイトの設定」を選んでTokyoなどのミラーサイトを選ぶと、コンソールに以下のようなメッセージがでてパッケージがインストールできない。ネットにはつながっているようで、httpsでなくhttpのミラーを選べば、ちゃんとサイトに接続できて、パッケージをインストールできることがわかった。一台のパソコンだけでこの症状がでているので、たぶんネット関係の設定がおかしいのだろうとは思いましたが、原因は不明でした。以下がエラーメッセージです。
> chooseCRANmirror()
警告: failed to download mirrors file ( URL ‘https://cran.r-project.org/CRAN_mirrors.csv’ を開けません ); using local file ‘C:/PROGRA~1/R/R-3.5.1/doc/CRAN_mirrors.csv’
警告メッセージ:
download.file(url, destfile = f, quiet = TRUE) で:
InternetOpenUrl の失敗: ‘失効サーバーに接続できなかったか、最終応答を取得できませんで(以下略)

解決策を探す:
Google検索を、failed to download mirrors file ( URL ‘https://cran.r-project.org/CRAN_mirrors.csv’ でやってみると、たとえばここのペーに同じようなトラブルに見舞われた人が質問していて、それに対する解決策がでていた。症状もhttpならOKでhttpsではだめだというので同じ。R consoleからネットにつながるのも同じだが、どうやらproxy設定とかが問題らしい。Firefoxの設定をInternet Explorerに反映させれば解決すると書いてあるだけで、あと一歩、親切に書いてない。プロキシは使っていないし、ファイアウオールを切っても症状はかわらないし、もちろん Rをクリーンインストールしてもだめだったし…。ちょっと途方にくてしまいました。

解決策がみつかった:
気分を変えて、今度はエラーメッセージの後半
「InternetOpenUrl の失敗: ‘失効サーバーに接続できなかったか、最終応答を取得できませんで」を使って検索すると12057エラーというのが起こっていることがわかりました。その対策はここの記述によると「Internet Explorerで「ツール」→「インターネットオプション」→[詳細設定] タブ の中にあるセキュリティセクションにある- “サーバーの証明書失効を確認する” と “発行元証明書の取り消しを確認する” のチェックを外します。 Internet Explorer を再起動し、上記変更が反映されているか確認します。」(野村がわかりやすいように一部を追記改変) だそうで、このとおりすると解決しました。

上の二つのチェックボックスうち、最初の“サーバーの証明書失効を確認する” のチェックを外すだけでよさそうで、これでパッケージが無事インストールできるようになりました。また同様のことが起こった時の解決用のメモとして記事にしておきます。

写真は前と同じところで撮影したアメンボです。まだ元気に何匹も泳ぎ回っています。

プレプリントサーバーとその活用法の紹介―bioRxivの利用法3

プレプリントサーバーbioRxivの利用法の第3回です。前回紹介したように大学や大学院、そして研究室での論文ゼミでbioRxivを活用しているところが増えています。出版される前に論文を読めるというメリットの他に、その論文を査読(レフリーをする)することを体験できますし、その論文がその後どのように印刷出版されるかをたどっていくと、レフリーとのやりとりなども追跡できるので研究者の卵にもとても勉強になります。以下のサイトをみるととても役立つと思いますのでご覧ください。

まず一番のおすすめは、preLights A というサイトです。これはプレプリントのハイライトサービスで、雑誌Journal of Cell ScienceとかDevelopmentとかを出版しているThe Company of Biologistsがスポンサーになっているサービスです。生物関係のおすすめのプレプリントを教えてくれるサービスですので是非使ってください。今日みてみるとテントウムシの模様のできるメカニズムのゲノムからの解明などの研究がハイライトされています。ハイライトの一覧は、ここにハイライトされているプレプリントへのリンクがありますのでブックマークしてください。

biOverlay はプレプリントサーバーにある論文を、独自に(勝手に)選んで勝手に査読してその結果を公開しています。こういうのをoverlay journalというのだそうです。査読の仕方の勉強にもなりそうですね。ご覧ください。

Peer Community Inというのも面白いアイデアです。著者はプレプリントサーバに原稿をアップロードした後、こちらのサイトにも原稿を読んでもらうよう依頼します。こちらのサイトが原稿を独自に査読にまわすかどうか決めて、査読にまわされれば匿名のレフリーが査読します。査読がOKになったらこのサイトで推薦の辞つきで公開されるというわけです。これで著者が得心したら論文としてdoiもわりふられて業績になるという仕組みです。著者がちゃんとしたjournalに投稿するのも問題ありません(このへんの仕組みの図と詳しい説明がここにあります)。推薦の辞はプレプリントだけではなく、すでに公開されている論文についても書かれることがあるようです。
投稿できる分野は進化生物学、生態学、古生物学となっています。以下にリンクがあります。

 Peer Community in Evolutionary Biology, Peer Community in Ecology or Peer Community in Paleontology

写真は、散歩の途中で写真をとってくれと、せがんでいるように声をかけてきたスズメの子です。人を怖がらず、写真をとっている間ずっとポーズしていろんな方向をむいたりしてくれていました。数日前からヒグラシも鳴きはじめ季節が進んでいます。

 

 

プレプリントサーバーを利用した論文紹介ゼミのすすめ―bioRxivの利用法2

土曜日にサイトのテーマを携帯対応のものに変えました。携帯でアクセスする方は、携帯を横にしてみてもらうと見やすいと思います。

If you want to be one year behind, don’t read bioRxiv– Jeff Leek

今日は5月23日のプレプリントサーバーの紹介に続く記事です。上の言葉は生物統計学などで多くの論文を出しているJeff Leek先生の言葉だそうです。論文投稿前のプレプリントをプレプリントサーバーに投稿していろんな人に読んでもらい、同時に引用できるようなdoiも取得した上で改訂して適当な雑誌に投稿するという人が増えています。また大学や研究室の論文セミナーで、雑誌にでた論文を選ぶのではなく、プレプリントサーバーにアップロードされた論文を選んで紹介するという新しいスタイルの論文紹介ゼミも盛んになっているようです。雑誌に出る論文より一年以上早く最新の成果を把握できることも多いので、PubMed検索だけではなく、プレプリントサーバーの検索も習慣にすることをお奨めします。

論文紹介ゼミでは、プレプリントサーバーにアップロードされた論文を読んで紹介し、論文のレフリー(査読者)になったつもりで内容を批判し吟味します。皆で検討した結果を著者にメールなどで連絡して原稿の改善に役立ててもらうというわけです。
こうしたプレプリントのゼミをやると、研究生活の早い時期に論文のレフリーの役割を学べます。著者への連絡がとても役立ったということで、論文を雑誌に投稿するときに謝辞に名前を書いてもらった学生もいるそうです。
今までレフリーになるのは、博士課程の学生で先生のお手伝いで協力するとか、査読を依頼されたときにレフリーの経験の多い先生に教えてもらうなどしかチャンスがなかったのですが、プレプリントサーバーで原稿が読めるようになったおかげで、学部学生や修士の学生でもレフリーの勉強ができるようになったわけです。米国ではプレプリントをつかったレフリーの練習も盛んになっているとのことです。皆さんも是非お試しください。これはpreprint reviewといいますが、これについてはこのリンクも参考になります。

線虫C. elegansの最近のプレプリントで面白そうなのにこんなのがあります。 配偶子幹細胞ニッチについてのKimbleラボの論文と、ノーベル賞をとったMelloさんのところのCRISPRを用いたゲノム編集の新手法の論文です。

C. elegans germ cells divide and differentiate along a folded epithelium

Hannah S Seidel, Tilmira A Smith, Jessica K Evans, Jarred Q Stamper, Thomas G Mast, Judith Kimble

最新の論文を探してみよう プレプリントサーバー bioRxivの利用法1

最新の論文を探すのには、PubMedやGoogle検索を使う方法が良く知られています。今回は、投稿前の論文、査読中の論文の探し方を紹介します。

論文を投稿する前に、完成した論文をプレプリントのかたちで公開サーバーにアップロードして皆に読んでもらい、プライオリティの取得もかねて意見を求めるというのは、昔から物理などで盛んな ならわしでした。現在では生命科学の論文用のプレプリントサーバーbioRxiv(バイオアーカイブと読みます)が盛んに利用されています。このサーバーを検索すれば最新の査読されていない またはここに公開と同時に査読中の論文を読むことができます。

bioRxivはCold Spring Harbor Laboratoryが維持しているプレプリントサーバーで、投稿すると内容をチェックした上で(非科学的な内容ではないか、テロに用いられるような危険な知識を提供するものではないか、剽窃した内容でないかなどのチェックです。査読してくれるわけではありません)翌日には公開されます。利用は無料です。

このサーバーはほとんどの著名な生命科学系の学術雑誌(ここに今日、ダウンロードした提携雑誌のリストがあります。投稿前に必ずこちらhttps://www.biorxiv.org/about-biorxivで確認してください。)と提携しており、bioRxivに いったん投稿しておけば、提携雑誌へ投稿する際は自動的にデータがその雑誌に移動できるようになっていて、投稿時にもう一回著者のリストを入れたりする手間はないのでおすすめのサービスです。投稿してしまえば引用可能になりますので、取り下げることはできません。利用法としては、査読のある雑誌への投稿と同時にこのサービスで投稿原稿を公開したり、bioRxivのサーバーで公開して皆にすぐ読んでもらった後で、査読のある雑誌に投稿することができます。またbioRxivに公開した後、コメントなどを参考に改訂してバージョンアップした後、投稿することも可能です。下の紹介動画をご覧ください。

私の良く知っている線虫の研究者、Josh Bembenekさんも盛んにこのサービスを利用しており、最近もこんな論文のプレプリントを公開しています。
https://www.biorxiv.org/content/early/2018/05/10/319657

線虫の細胞系譜にそって細胞質分裂の仕方が変化するという面白い内容です。

皆さんもbioRxivの検索画面で自分の好きなキーワードでいろいろ検索してプリプリントを探してみてください。最新の研究成果がいろいろ見つかると思います。

多くの雑誌ではプレプリントサーバーにアップロードして公開した論文は、投稿前のもの
prior to submissionとみなされます。中には投稿前にbioRxivでの公開を許さない雑誌もありますので、投稿前に十分調べてから投稿してください。Oxford Journal系の雑誌のように、公開プレプリントサーバーに公開しているものが投稿後にアクセプトされて掲載されるときには、すでに公開していたのだからといって、オープンアクセスの料金を払わねばならないところもありますので注意してください。各雑誌のポリシーは
https://en.wikipedia.org/wiki/List_of_academic_journals_by_preprint_policy
などにまとまっています。

他の分野でのプレプリントサーバーには、物理関係(経済分野も含む)のものや、は科学哲学関係のものなどもありますので、興味ある方は訪問してみてください。

ライフサイエンス辞書のコーパスを使った英語の書き方

ライフサイエンス辞書Life Science Dictionaryのサイトで、コーパス (corpus)を検索できます。先日紹介した広島大の河本健先生のページにある動画では、コーパス検索のデフォルトとしては、詳細検索を使うのがよいとのことでした。今回お伝えしたいのは、次の点です。

ひょっとしたらコーパス corpusの検索窓に、いつも一つの単語だけをいれていませんか?それはもったいないです!

コーパスの検索窓には、複数の単語の並びをいれることができます。たとえば、今論文を書いていて、 「GPIアンカー型タンパク質は、アーキアからヒトまで保存されいる」という英文が書きたいとします。アーキア(archaea)というのは古細菌ともいいます。
「アーキアからヒトまで保存されている」というのはどう書いたらいいでしょう?

まずライフサイエンス辞書のページのコーパスタブを開きます。でフルトの簡単検索画面がでますので、それにfrom archaeaといれてみましょう。

詳細検索をクリックして、表示数などを調整します。
最大1000 行表示にして、設定を記憶。冠詞や前置詞を文章内のリストに含めるなどにしています。
検索ボタンを押すと、from archaeaの部分の前後が表示されます。(表示されないときは、スペリングミスか、あるいは入力した句を含むコンコーダンスの例がみあたらないことを示します。たとえばfrom archeaとしてみてください。archeaでも正しいはずですが、用例がありません。)

上の図のコンコーダンスをみていくと、from archaea to humansという用例があるのがわかります。保存されているconservedという単語を使っている用例がないかなぁ、と詳しくみていくと(conservedという単語を画面で検索しただけですが)、ありました!
35番の文に古細菌からヒトまで保存されているという用例がでていました。

あとは、文の番号35をクリックすると、新しいタブが開いてこのように

PubMedの画面がでてきて要約Abstractの部分にある例文が容易にみつけられます(ブラウザ画面でhumansなどの単語で検索してハイライトさせてみました)。

これで目的の作文ができました。
こんな感じで、コーパスの検索窓にいろんな句を入力して用例を探すと、英文作成がずいぶんはかどりますので試してみてください。
コーパスはphrase 検索でつかわないともったいないです。

 

ライフサイエンス辞書のコーパス活用法の動画がでています

ライフサイエンスディクショナリーのページに、「ライフサイエンス辞書・英語共起表現の活用法(広島大学ライティングセンター・河本健」が紹介されていました。まだみていませんが、とても役立ちそうです。こちらには河本先生のコーパスについての解説もあります。

近所のキンランは、合計5株花が咲いています。すこし画質のいい写真をならべておきます。

ConBio2017 ランチョンセミナーの動画が公開されました

ConBio2017 ランチョンセミナーの動画が公開されました(2018.3.15)

分子生物学会・生化学会合同年会のときの私の講演のムービーが公開されましたのでご覧ください。 講演終了後、springer exemplarのサービス終了などがありましたので、その部分をカットした動画になっています。2部にわかれていますので順にご覧いただければ一番ですが、各部のみをみていただいてもよいと思います。

研究生活における電子学術資料の利活用とメリット – 第1部 情報探索とインプットをより効果的に(Part 1)

研究生活における電子学術資料の利活用とメリット – 第2部 論文執筆やポスター発表に役立てよう(Part 2)

この講演のスライドはここにあります。

退官記念食事会をしてもらいました。ランチョンセミナーの内容変更点について

今日は卒業生のOB,OGの方たちに退官記念食事会をしてもらいました。忙しい時期なので福岡在住の方が主ですが、懐かしい顔ぶれがそろってとても楽しいひと時を過ごさせてもらいました。みなさんありがとうございました。みな元気で学生時代とほとんどかわっていないのは、社会人になってそれぞれ自分が活かせる職場にいるからだろうと思います。学生さんたちのおかげで充実した大学生活をおくらせてもらいました。ほんとうにみなさんありがとうございました。また今後の活躍をお祈りします。

昨年末のConBio2017のランチョンセミナーは、200名を越える方々にきいていただけたようで、ありがとうございました。Springer-Natureによるとあの講演の中で紹介していたSpringer Exemplarが廃止になったそうです。それでスライドの該当部分を削除したものをアップロードしてありますのでご利用ください。講演のビデオも近日中にYouTubeにアップロードされます。公開されしだいこのページで連絡します。

 

 

実験ノートについて (3) (2009/10/10)

ノーベル賞のわくわくする発表も終わりに近づいてきました。イギリスのケンブリッジにあるMRC LMBからまた一人、(出身者というのなら二人)の受賞者が化学賞(リボソームの構造に関する業績)に選ばれています。ざっと数えて15個ほどのノーベル賞メダルがこの研究所からでています。

さて先日紹介したポータルサイトをみていたらノーベル賞を2つもらった科学者Linus Paulingさんの実験ノートがオレゴン州立大学の図書館のサイトに公開されているのに気づきました。以前紹介したBrennerFaradayの実験ノートとあわせてのぞいてみてください。そしてどんなことをノートに書かなくてはいけないかを考えてみて下さい。(最近ではコンピュータが発達してきたのでパソコンで電子ノートブックというのが使われるようにもなってきています。ノートにどのようなことを書くべきかをしっかり考えてこうしたノートを使うことが大切です。)

この大学の図書館にはLinus Pauling onlineというサイトができていて、彼の実験ノートの写真や鎌状(鎌形)赤血球貧血症の研究、化学結合論の研究、DNAの構造の研究などの紹介などの他に、長時間の講演会の動画も公開されています。DNAの構造解明でノーベル賞を受賞したCrickPaulingを回顧する講演などもありますし、講演のスクリプトがついていますので英語の勉強にも使えます。是非ご覧下さい。

Paulingは化学結合論の権威で量子化学を創始した科学者の一人です。DNAの構造を研究していたWatsonがPaulingさんの本「化学結合論 The Nature of the Chemical Bond…」が必要になって探し回っていた場面が有名な「二重らせん」という本の中にあったと思います(11章後半)。今話題のノーベル化学賞と平和賞を、後者は核兵器根絶運動の功績で受賞しています。47年も前のノーベル平和賞ですが、まだ核兵器はいっぱいあります。Paulingのノート(画面一番下のSelected Highlightsを見ると面白いです)には奥さんのコメントなどもはいっていてほほえましいものもあります。画像を拡大して上の方をご覧下さい。

英語で話すコツ(2):

前回はNIHの英語の話し方の講習会を紹介しました。NIH videocastingでは2008年9月にもGiving a GREAT scientific talkと題して講習会を放映しています。これは学会などで口頭発表するときの心得です。video podcastもありますので見ると参考になります。 講演内容の一部を紹介しておきましょう。

1) 聴衆が自分の話を理解するための予備知識をどれだけもっているかをあらかじめ予測して講演内容を準備しなくてはなりません。.knowing your audienceです。エキスパートの前で基礎知識を長々と講義してはいけませんし、逆に、知的好奇心旺盛な非専門家の聴衆に基礎知識の紹介なしで専門語満載の講演をしてもいけません。どちらの場合でもすくなくとも一つ、この講演をきいてよかったという内容がつたわるようにしたいものです。

2) 下調べは大事です。学会にでかけていくとき先方のコンピュータがマックかウインドウズか、自分のパソコンで講演できるのかUSBでデータをわたすのか、あらかじめ調べておきましょう。先方からパソコンの種類などの問い合わせが普通ありますのでそれをちゃんと読んでおくことも大事です。会場であわてないように会場への行きかた、パソコン周りのことをよく調べて準備しておくことです。会場の大きさ、マイクなども講演前に必ずみて準備しましょう。

3) tell a story これはよくききますね。論文でも同じだといわれています。
・どういう点でこの仕事は重要なのか。
・この問題の解決への自分の独自の貢献とは何か。
・この仕事は今後どうなっていくのか。
この三つの質問の答えができるようにして講演内容をねりあげていきましょう。

4) スライドでの発表ですが、話しはじめて最初の90秒から2分までが第一の勝負です。ここで聴衆をつかめるかつかめないかが勝負どころです。

5) 10分とか12分の短い口頭発表では最初に結論の一部をちらっと紹介して繰り返し論点を強調したりするのがよいでしょう。

その他スライドの作り方(どれくらいの大きさの字を使うのがよいかなど)なども教えてくれます。今忙しくて時間がないのでまた後日ふれることにします。