夏休みおすすめソフト(1):無料で最強の統計ソフト RやRStudioを使ってみよう!インストール法とパッケージがインストールできないとき。

夏休みのおすすめソフトを紹介します。統計学の重要性は「統計学が最強の学問である」(西内啓 著)という本をきっかけに、ビジネスの世界にも広く認識されたようです。この本で、はじめて一般化線形モデルという言葉がひろく紹介されたと思います。本屋にいってみるとR(アール)という統計ソフトの入門書や専門書がたくさんならんでいて、このソフト(無料で、統計解析では最強のソフトです)が広く使われていることがわかります。MacでもLinuxでもWindowsでも動くソフトで、有料の統計ソフトをしのぐソフトですので、ますますこれからも使われていくと思います。私も学生さんにRとPythonとLinuxを勉強しておくと将来絶対必要になるので早めに学ぶことをすすめていました。生物系では統計学は必須ですし、バイオインフォマティクスや次世代シークエンサーのデータ解析にもRは大活躍しています。今ではRのパッケージのR commanderや日本の神田善伸先生(自治医科大学)が開発されたEZR(これも大評判になってRのパッケージになりました)がありますので、グラフィカルインターフェースでRを使うことができて、初心者にもやさしいソフトとなりました (これらはRをインストールしたあと、パッケージとして追加インストールして使います。EZRはR commanderの追加プラグインになっています。インストールするとどちらも日本語で使えます。EZRを中心に使いたい場合は開発者の神田先生のサイトからダウンロードして使うのもおすすめです)。また、RStudioというRの統合開発環境ソフトを使えば、Rをもっと便利にスムーズに利用することができるようになったので、Rはますます便利で使いやすくなっています。

Rをインストールするのは簡単で、まずCRANというサイトにいって、ダウンロードサイトから自分のコンピュータに応じたRのインストーラーをダウンロードします。Mac版、Linux版もありますし、Windowsの場合はここから、最新版のR 3.5.1をダウンロードして、インストールできます。
Download R 3.5.1 for Windows (62 megabytes, 32/64 bit)という部分をクリックしてダウンロードして、インストールしてください。インストールする場所はデフォルトでよいですが、空きの多いドライブにするのもよいでしょう。インストールが終わったら、とりあえず起動ができることを確認してください。

Rのインストールが無事終わったら、続いて、RStudioをインストールしましょう。ダウンロードページをひらいて、Rstudio Desktop Open Source LicenceのDownloadボタンを選んでダウンロードします。windows版、Mac版、ubuntuやfedra用のlinux版があります。自分のOSにあったものをダウンロードしますインストールは簡単ですぐ終わるので終わったらRstudioを起動してください。RStudioを使ってRを使い始めるのも良いと思います。
Rstudioの使い方については、統合TVのビデオ
あるいはそのYouTube版をみてください。

とてもわかりやすいです。
もっと新しいMac版のRStudioの使い方ビデオもあります。Windows版でもほとんど同じですのでこれも参考になります。

その他、RやRstudioの使い方については、YouTubeで検索するといろいろなサイトがでてきます。後日、いくつかサイトを紹介する予定です。(9月17日追記、RstudioにRコマンダーとEZRをインストールする方法については続きの記事→ここをご覧ください!)

さて、昨日からRでの統計解析をしようとパッケージのダウンロードをRStudioで行おうとしたのですが、うまくいきませんでした。以下はその解決法です。

症状エラーメッセージ(以下を参照)がでて、R やRStudioはちゃんと起動しているが、あらたにパッケージがインストールできない。RstudioからでもR本体(64ビット版でも32ビット版でも)からでも同じことでエラーがでてパッケージのインストールができない。Rのメニューの「パッケージ」から「CRANミラーサイトの設定」を選んでTokyoなどのミラーサイトを選ぶと、コンソールに以下のようなメッセージがでてパッケージがインストールできない。ネットにはつながっているようで、httpsでなくhttpのミラーを選べば、ちゃんとサイトに接続できて、パッケージをインストールできることがわかった。一台のパソコンだけでこの症状がでているので、たぶんネット関係の設定がおかしいのだろうとは思いましたが、原因は不明でした。以下がエラーメッセージです。
> chooseCRANmirror()
警告: failed to download mirrors file ( URL ‘https://cran.r-project.org/CRAN_mirrors.csv’ を開けません ); using local file ‘C:/PROGRA~1/R/R-3.5.1/doc/CRAN_mirrors.csv’
警告メッセージ:
download.file(url, destfile = f, quiet = TRUE) で:
InternetOpenUrl の失敗: ‘失効サーバーに接続できなかったか、最終応答を取得できませんで(以下略)

解決策を探す:
Google検索を、failed to download mirrors file ( URL ‘https://cran.r-project.org/CRAN_mirrors.csv’ でやってみると、たとえばここのペーに同じようなトラブルに見舞われた人が質問していて、それに対する解決策がでていた。症状もhttpならOKでhttpsではだめだというので同じ。R consoleからネットにつながるのも同じだが、どうやらproxy設定とかが問題らしい。Firefoxの設定をInternet Explorerに反映させれば解決すると書いてあるだけで、あと一歩、親切に書いてない。プロキシは使っていないし、ファイアウオールを切っても症状はかわらないし、もちろん Rをクリーンインストールしてもだめだったし…。ちょっと途方にくてしまいました。

解決策がみつかった:
気分を変えて、今度はエラーメッセージの後半
「InternetOpenUrl の失敗: ‘失効サーバーに接続できなかったか、最終応答を取得できませんで」を使って検索すると12057エラーというのが起こっていることがわかりました。その対策はここの記述によると「Internet Explorerで「ツール」→「インターネットオプション」→[詳細設定] タブ の中にあるセキュリティセクションにある- “サーバーの証明書失効を確認する” と “発行元証明書の取り消しを確認する” のチェックを外します。 Internet Explorer を再起動し、上記変更が反映されているか確認します。」(野村がわかりやすいように一部を追記改変) だそうで、このとおりすると解決しました。

上の二つのチェックボックスうち、最初の“サーバーの証明書失効を確認する” のチェックを外すだけでよさそうで、これでパッケージが無事インストールできるようになりました。また同様のことが起こった時の解決用のメモとして記事にしておきます。

写真は前と同じところで撮影したアメンボです。まだ元気に何匹も泳ぎ回っています。