jamoviで学ぶ統計学―統計ソフトRをもとにした統計学のスプレッドシート型グラフィカルインターフェイスの紹介

このブログでは統計解析のためのおすすめソフトとしてRを紹介してきました。

ネットサーフィンしていると、jamovi(ジャモウヴィと読むようです)というソフトがあるのに気づきました。これは無料で使えるRをもとにしたソフトで、スプレッドシートでSPSSなどの高価な有料ソフトと似たわかりやすい使い方ができ、かつ無料のソフトだそうです。jamoviの “syntax mode”をつかえば、解析にjamoviが用いているRのコードが表示されそれをRにコピーして使うことができます。逆に、Rj Editorというjamoviのモジュールをjamoviに入れて使うと、Rのコードをjamovi内で利用することもできます。windows, mac, linux, chrome OSで利用でき、使い方のビデオや、jamoviを使った統計学の教科書(Version 0.70, 2019)も無料で公開されています。これはLearning Statistics with R(Navarro DJ著)に基づいた教科書で、なんと日本語版(Version 0.65の翻訳)も芝田征司先生が作成して公開されています。心理統計と初歩の入門者向けの本とのことですが、Rや RStudioより初心者向きの解析ツールを探しているかたなど、興味のある方は使ってみると良いと思います。

写真は家で実っているリンゴです。今年は昨年より沢山花が咲いたため、10個以上の実がなっています。

糖鎖生物学入門―5 糖鎖を描いてみよう―糖鎖シアリル ルイスxを描いて単糖どうしの結合についての理解を深めよう。

今回は、次の図に示す有名な糖鎖 「シアリルルイスX」(sialyl Lewis x: Lexとも書かれます)を描いてみましょう。このシアリルルイスxという糖鎖は、リンパ球の炎症反応などに関わっていたり、癌組織で増えていたり癌の転移に関わっていたりと大変重要な糖鎖です。

まずシアリルルイスxという糖鎖の構造をネットで調べます。(ルイスxやルイス血液型については註1をご覧ください。)

sialyl Lewis(x)というのをPubChemでしらべてみると以下のように化合物名がでています。
https://pubchem.ncbi.nlm.nih.gov/compound/Sialyl-Lewis_X
ページの中を読んでいくと、
sialyl Lewis xとあって下に様々な表記で同じ化合物を表したものがならんでいます。
Neu5Acα2-3Galβ1-4(Fucα1-3)GlcNAcbβ
α-Neu5Ac-(2->3)-β-D-Gal-(1->4)-[α-L-Fuc-(1->3)]-β-D-GlcNAc
alpha-Neup5Ac-(2->3)-beta-D-Galp-(1->4)-[alpha-L-Fucp-(1->3)]-beta-D-GlcpNAc (Neup、Galp、Fucpについては注2参照。pはピラノースの意味です。)
alpha-Neu5Ac-(2-3)-beta-D-Gal-(1-4)-(alpha-L-Fuc-(1-3))-beta-D-GlcNAc

この表示の意味がわかるようになるのが今回の目標です。

今回は上のシアリルルイスxの構造表記をもとに、前に紹介したCarbodrawというソフトをつかって糖鎖を描いてみましょう。このソフトのヘルプに英語ですがシアリルルイスxの書き方がのっています。(最後のD-GlcNAcがαになっている図を描いた例です。)
大学院の講義でこのソフトで糖鎖を描く例としてとりあげていたので、この入門でもやってみようと思います。生物が使っている単糖はたいていはD型ですが、フコースとイズロン酸はL型であることに注意して描いてみましょう。まず以下の表記を使ってみましょう。
alpha-Neup5Ac-(2->3)-beta-D-Galp-(1->4)-[alpha-L-Fucp-(1->3)]-beta-D-GlcpNAc

Carbodrawでこの構造を書く方法は以下のとおりです。

まずFucoseとGlcNAcをα(1,3)結合で結びましょう。
-[alpha-L-Fucp-(1->3)]-beta-D-GlcpNAcの部分を描く作業です。デフォルトで表示されるFucose(フコース)はD型になっています。これをL型にかえなくてはなりません。αD Fucoseの上で右クリックして、Propertiesを選択すると下図のような画面がでます。ConfigurationがDになっているのをLに変えて、OKを押すとできあがり。これでL-Fucoseになりました。

(今回はやりませんが、Anomerityの項目でAlphaとあるところをBetaにするとβ-Fucoseができます。SubstitutionsのUp, Downのメニューを選ぶと、硫酸化とかの修飾も入れることができます。)
次に、-[alpha-L-Fucp-(1->3)]-beta-D-GlcpNAcの表記の後半、
beta-D-GlcpNAcを、Fucoseの時と同様にalpha-D-GlcpNAcから作ります。メニューからGlcNAcを選ぶと、デフォルトではα-D-GlcNAcが表示されるので、名前の文字のあたりを右クリックして、Propertiesを選び、Anomerityの部分にAlphaとあるところをプルダウンからBetaにかえてOKを押すとα-D-GlcNAcがβ-D-GlcNAcにかわります。

最後に、作ったα-Lフコースと、α-D-GlcNAcをα(1,3)グリコシド結合で結びます。それにはメニューの矢印の隣、魔法の杖のようなマークをクリックします。カーソルが魔法の杖に変わったら、単糖の炭素の番号表示をオンにしておき(炭素の番号表示のオン、オフは➂と書いてあるボタンをクリックして行います)、Fucoseの1番の炭素をこの杖のカーソルでクリックし、ドラッグすると線がマウスカーソルを動かすにつれて伸びていきますので(下図)、GlcNAcの3番の炭素までドラッグしていきます。

フコースの1番炭素からGlcNAc(グルックナック)の3番炭素にちゃんと結合ができると、線が太くなるのでそこでドラッグを止めると結合が描画されます。

 

まず一つ結合が書けました。こうして実際にソフトを使って書いてみると[alpha-L-Fucp-(1->3)]-beta-D-GlcpNAc化合物の表示の(1,3)などという表現の意味が良くわかると思います。

次はalpha-Neup5Ac-(2->3)-beta-D-Galp-(1->4)-[alpha-L-Fucp-(1->3)]-beta-D-GlcpNAc

の前半、alpha-Neup5Ac-(2->3)-beta-D-Galp-(1->4)-を描きましょう。

CarbodrawのメニューからNANA(Neu5Ac:N-Acetylneuraminic acid=N-アセチルノイラミン酸)を選んでそれをβ-D-Galに結合させます。
まずNANAの結合するGalactoseを描きましょう。Galactoseを選んで図に追加すると、α-D-Galactoseが描かれます。それをβ-D-Galactoseに変えて、(右クリック、PropertiesででるメニューのAnomerityのプルダウンからBetaを選んでOKを押すだけです)、できたものの一番目の炭素を、さきほど作ったβ-D-GlcNAcの四番炭素へ結合させます。

次に、シアル酸のNANAをメニューから選び、図に追加します。これをβ-D-Galacotoseの3番の炭素に結合させます。NANAで炭素の番号を図のように表示するとわかりますが、シアル酸以外の他の単糖(ピラノース型のもの)の酸素(図では酸素は赤丸で表示されています)のとなりの炭素は1番なのに、シアル酸ではピラノースの酸素の隣の炭素の番号は2番になっています。それで普通の単糖の場合1-3結合に相当する結合がシアル酸では2-3結合になるわけです。この炭素の番号づけのずれのために、シアル酸転移酵素(シアル酸をくっつける酵素)はα2-3、α2-6、α2-8というように2番炭素がグリコシド結合に関与する結合表示となります。NANAの2位の炭素からalpha-Neup5Ac-(2->3)-beta-D-Galp-(1->4)-の表記にしたがって、α2-3結合をGalactoseの3位の炭素にむけて作りましょう。これでシアリルルイスx糖鎖が完成です。

 

 

自分でいろんな結合をつくってみると、糖鎖の論文にでているα1,3とかいう文言が怖くなくなるでしょう。詳しいやり方は、CARBODRAW/HELP/CARBODRAW.HTMLにありますので、CarbodrawのヘルプメニューからHelp Topicsをクリックして、参照してください。

記号表示では以下のようになります。

シアル酸の場合、何も書いていときは上に書いたとおり、αのあとには2が略してあると思ってください。それ以外のαやβはα1、β1が略してあるということです。

註1:ルイスエックスという名前にある、ルイス(Lewis)というのは、ルイス血液型という名前に由来します。ルイス血液型をになうのはルイスaとルイスbという糖鎖です。ルイスというのは、この血液型を解明するのに貢献した抗ルイスa抗体を提供したドナーのルイスさんの名前にに由来するのだそうです。LeaやLebの糖鎖は、糖脂質に付加されており、血清に存在する糖脂質が赤血球表面に吸着して血液型物質になっている例です。ルイスa, ルイスという糖鎖の異性体がそれぞれルイスx、ルイスyという糖鎖です。ルイスxやそれにシアル酸が付加されたシアリルルイスxは赤血球表面には存在していないので血液型物質ではないのですが、リンパ球の表面に存在して炎症反応などに関わっていたり、癌組織で増えていたり癌の転移に関わっていたりと大変重要な糖鎖です。
註2:この表現でのNeupとかGalp、Fucpという表記のpはピラノースの意味です。ピラノースは、O(酸素)を含む6員環の化合物ピランpyranに由来する糖の命名法で、Oを含む6員環構造をとっている糖を指します。furanoseはOを含む5員環の構造をとっている糖を指し、これもOを含む5員環の化合物furanに由来する命名です。

お知らせ―サイトを常時SSL化しました!(5/27日追記有)常時SSL化の手順

昨日、WordPressで作っているこのサイトをSSL化しました(SSLはSecure Sockets Layerの略だそうです)。具体的にはサイトにアクセスしてもらったとき、ブラウザのサイトのurl表示のところが鍵マークになり、ブラウザとサイトのサーバー間の接続が暗号化されるようになるということです。最近のブラウザではhttpsでアクセスしないと警告表示がでたりしますので多くのサイトが常時SSL化をしています。昨日やってみましたが以外に簡単にできました。今後はアクセスするときのurlがhttp://glycostationx.orgからhttps://glycostationx.orgにかわるというわけです。

以下は覚書をかねたSSL化したときの手順です。各自ご自分のサイトに合わせて読み替えてみてください。(写真はひと月ほど前に咲いていたリンゴの花です。今年は去年より沢山花が開きました。意外かもしれませんが、九州ではリンゴも栽培されています。)

1.最初にSSL化の失敗に備えて、サイトhttp://glycostationx.orgを丸ごとバックアップしました。サイト自体をAll-in-One WP Migration というWordPressのプラグインでバックアップして保存しておきます。やり方は簡単で、このプラグインをインストールしたあと起動し、エクスポートを選びます。画面がエクスポート用画面に変わるので、エクスポート先をクリックして出てきたメニューから、ファイルを選びます(クラウドを選ぶこともできます)。するとサイト名であるglycostationx.orgをダウンロード、サイズ:何メガバイトなどと表示されるので、拡大収縮表示されている部分をクリックして、保存先をパソコンの適当な場所に指定してダウンロードしたらOKです。この作業は以下を参考にして実施しました。
https://smakoma.com/wordpress-backup-restore.html
(もちろんこのようなプラグインを使わず、ftpなどでサイトのファイルを丸ごとダウンロードすることもできます。こちらのほうがギガバイト以上あるようなサイトの場合は早くて確実だと思います。)

2. サイトのバックアップができたら、次に私の使っているレンタルサーバーで無料のSSL証明書を発行してもらってSSL化を申請して、http://glycostationx.orgをhttps;//glycostationx.orgに変えました。これはレンタルサーバーごとに手順があるのでお使いのサーバーのマニュアルなどで調べるか、Google検索などでレンタルサーバー名とSSL化などのキーワードで探してみてください。エックスサーバーでのやり方を解説している以下のページはとても参考になりました。https://nelog.jp/wordpress-ssl
私の使っているレンタルサーバーでは、SSL化を申請後、1時間もかからずにサイトにhttps://glycostationx.orgでアクセスできるようになりました。

3.次に、WordPressのダッシュボードで、設定―一般とすすみ、WordPressアドレス(URL)とサイトアドレス(URL)の項目(どちらもhttp://glycostationx.orgになっている)をhttps://glycostationx.orgへと変更して変更を保存します。

4.次に、http://glycostationx.orgをブックマークしてある方などをhttps://glycostationx.orgへと自動で誘導するように設定する作業を行います(これはサーバー側での301HTTPリダイレクトというそうです。)。これには.htaccessのファイル(ドットエッチティーアクセスファイル)を編集します。とても簡単な作業で、
サイトの”.htaccess”ファイルの先頭に以下を追加しておくだけでOKです。
RewriteEngine On
RewriteCond %{HTTPS} !on
RewriteRule ^(.*)$ https://%{HTTP_HOST}%{REQUEST_URI} [R=301,L]

.htaccessファイルの編集には、自分のドメインのフォルダの下にあるpublic_htmlの中にある.htaccessファイルを編集します。レンタルサーバーが.htaccessファイルを編集する手段を提供している場合はレンタルサーバーのツールで編集するのもよいですが、安全のため、いちどftpなどで.htaccessファイルをダウンロードして、保存しておき、テキストファイルエディタで開いてみて中身をよくみてから編集するのをすすめます。

今回、サイトでの.htaccessファイルのありかを確認してftpでダウンロードし、編集してアップロードするには、WinSCPというファイル転送ソフトを使いました。
https://winscp.net/eng/docs/lang:jp
このソフトはデフォルトではドットが先頭についている隠しファイルは表示しないので、ソフトを起動して環境設定―パネルを選び、「一般」にある「隠しファイルを表示する」にチェックを入れるのを忘れないようにしてください。こうすると.htaccessファイルが表示され、ダウンロード、アップロードができるようになります。編集が終わったら、編集済みファイルをWinSCPでアップロードしてもとあった.htaccessファイルに上書きしたら完了です。http://のサイトurlでアクセスしてhttps://のサイトへ飛ぶことを確認してください。
WinSCPは九大での旧ホームページ作りにも使っていたとても便利なFTP/SFTP/SCPクライアントソフトです。他にもiPadへのWindowsからの電子ブック転送とかにも使って重宝しています。

5.次に、自分のサイト内での画像やpdfへのリンクなどにhttp://glycostationx.orgではじまるurlを使っているので、これらをすべてhttps://に変える必要があります。1.でバックアップができていることを確認した上で、サイト内のhttp://glycostationx.orgの記述(画像やpdf, サイト内の別のページへのリンクなど)をhttps://glycostationx.orgへ一括で変更します。一括変更には、WordPressのプラグインSearch Regexを使います。このプラグインでブログ内の記述でhttp://glycostationx.orgで始まるものを検索、これをhttps://glycostationx.orgに一括で変更できるので大変便利です。検索にはプラグインのタイトルどおり正規表現も使えますが、単なる文字列でも検索・置換ができます。

注意:このプラグインは更新が3年ほどなされていないため、最新のWordPress(バージョン5.2)で使うと、エラーのメールがとどきます。ブログ名のあとに「サイトで技術的な問題が発生しています」というタイトルのメールがとどいて驚いたのですが、内容は、
”エラータイプ E_ERROR が ブログサイトのwp-content/plugins/search-regex/view/results.php ファイルの 26 行目で発生しました”などというものでした。
Google検索で以下のキーワードで調べてみると、
「”search regex” wordpress 技術的な問題が発生しました」
次のような解決策のページがありました。
https://smakoma.com/search-regex-error.html
このページのとおり、WordPressのダッシュボードからプラグインを選び、プラグインエディターを開いて、該当のエラー行を削除したら完了です。この作業後はもうエラーのメールはこなくなりました。

エラーがでなくなったところで、プラグインをインストールしてあれば、ツールメニューにSearch Regexがありますので、クリックして起動します。SourceにはPost Contentをまず選びます。Limit toとOrder Byはデフォルトのままでよいです。http://glycostationx.orgを検索して、https://glycostationx.orgへと置換したいので、Search patternと書いてある検索窓にhttp://glycostationx.org、Replace patternと書いてある置換窓にhttps://glycostationx.orgといれて、Replaceボタンを押します。するとサイト内のhtml記述中のhttp://glycostationx.orgで始まる部分が全部表示され、https://glycostationx.orgで置換された表現も併せて表示されます。この段階では置換は行われていません。ちゃんと置換すべき部分が表示されているかどうか、全部確認した上でOKならReplace & Saveボタンを押せば全部置換してくれます。このボタンの操作は戻せないので確認は慎重にしてください。終わったら他にhttp://glycostationx.orgの記述がないかを、SourceをPost excerptにして再確認します。あれば確認して置換します。他のSourceについても順次作業を繰り返し、終わったら置換終了です。

6.最終確認です。ChromeとかFirefoxとかでサイトにアクセスしてちゃんと鍵マークが表示されるか試してください。トップページや固定ページごとに試してみて全部鍵マークが表示されればOKです。私の場合は、論文と研究概要の固定ページでエラーになり、鍵マークが表示されませんでした。その部分をクリックすると画像が疑わしいというようなメッセージがでました。そこで、ブラウザのChromeで問題のあるページを表示して、右クリックしメニューの中の検証をクリックします。表示されるページでConsoleをクリックすると、問題のある画像がどれか教えてくれるので修正することになります。私の場合は、画像を九大の旧サイトを参照することで表示しており、このサイトへのリンクがhttpsではなかったからエラーになったのがわかりました。訂正すると無事、全部鍵マークになりました。

7. あとはGoogle Search ConsoleやGoogle Analyticsへの登録が必要になったりするサイトもあるかもしれませんので、その場合は、各自検索して調べてみてください。

私はGoogle Search Consoleを使っていますが、その場合はプロパティの追加で、URLプレフィックスではなくて、ドメインのほうを選びます。ドメイン名を入れて続行ボタンを押すと、「DNSレコードでのドメイン所有権の確認」という画面に変わり、テキストレコードが発行されます。このテキスト(特定のドメインの同定用の文字列です)をコピーして、サイトのサーバーのDNS編集画面から、このテキストを内容とするTXT タイプの新しいDNSレコードを作成します。DNSレコードの追加が終わったら、あとはGoogle Search Consoleの「DNSレコードでのドメイン所有権の確認」画面で確認ボタンをおして所有権を確認します。確認がまだですというような画面がでたら10分ほどおいて再度確認すると確認が終わると思います。この方法を使えば、http://glycostationx.orgの時のデータもそのまま移行されるので便利です。http://glycostationx.org, https://glycostationx.org, http://www.glycostationx.org, https://www.glycostationx.orgそれぞれについてプロパティをGoogle Search Consoleで作成して所有権を確認‥‥という面倒な手順は不要です。

この方法は、「サーバー名 dns レコードでのドメイン所有権の確認」という検索キーワードで見つけました。

ゲノム、トランスクリプトーム、プロテオームにグリコーム‥‥オームの話

OBS studioの使い方について少し補足しましたのでご覧ください。録画設定には自動構成ウイザードを使うと録画失敗が少なくなりますよという内容です。

さて今日はゲノム、トランスクリプトーム、グリコーム、コネクトームなどオームのついた言葉の解説です。簡単にいえば、オームは数学の記号のΣ(シグマ)のようなものと考えてください。genomeというのはgeneの総和Σです。transcriptomeというは、transcriptの総和Σです。connectomeというのは、神経どおしの結合様式の総和Σです。またglycomeというのは生物や組織、器官、細胞などの糖鎖修飾状態ののすべてという意味になります。
つまり、-omeという接尾語の前についている単語が表すものを全部もれなくあつめたものが、なんとか-omeの意味となります。genomeはgeneを全部集めたものの意味になりますから、発音もゲノムではなくて、ジーンの総和なのでジーノムとなります。プロテオームというのは、proteinの総和ですから、発現しているタンパク質のすべての集合の意味である、といった具合です。接尾辞の-omeについてOxford English Dictionary(OED)をひいてみると(九州大学図書館が契約しています)、以下の引用のように解説してあります。
3. Cell Biology and Molecular Biology. Forming nouns with the sense ‘all of the specified constituents of a cell, considered collectively or in total’
とあります。

genomeをOEDでひいてみると、1920年頃のドイツのでの用例からはじまり、もとは染色体のハプロイドの全体を意味しており、後にcomplete set of genes of an organism, species,organelle, etc.を意味するようになったとあります。以下引用です。

 Originally: a complete haploid set of chromosomes (of an organism, species, or    gamete). Later also:  the complete set of genes of an organism, species, organelle,   etc.
所属機関でOxford English Dictionaryを契約している方はご覧ください。
(-omeがΣの意味だというのは、以前、EMBLのバイオインフォマティクスの専門家が九大で講義されたときに習いました。)

写真の水仙は今朝撮影しました。福岡はあたたかで、梅も満開になっています。

テキストデータをどんどん蓄積していくソフトの紹介その3―詳しいTextclipperのclipfileツールの使い方です

前に紹介したTextClipperのクリップツールの一つclipfileを作者の吉村隆樹さんがバージョンアップしてくださいました(2018/11/28)。前のバージョンを使っている方は新しいバージョンにしてください。ここからバージョンアップ版をダウンロードして解凍してできたclipfile.ctaファイルをtextclip7962フォルダ中に上書き保存するだけです。以前のバージョンでは保存日時の年号が正しく入らなかったのですが、今回のバージョンアップで2018がちゃんと入るようになりました。吉村さんによると典型的な2000年問題だったそうです。バージョンアップをお願いして数時間で新バージョンを作ってアップロードしてくださいました。吉村さん、どうもありがとうございました。

以下では先日紹介したTextClipperのクリップツールclipfileの使い方をもうすこし詳しく紹介しておきます。
1)まずTextClipperをここからダウンロードしてダウンロードしたzipファイルを解凍してください。解凍してできたフォルダがtextclip7962という名前になります。このフォルダはProgram Filesのフォルダには入れないでください。入れると動きません。このプログラムを使用するには7-zip32.dllが必要です(バックアップ時)のでここから取得してください。

2)ここまでの作業でtextclip7962というフォルダができました。バージョン番号がフォルダ名になっていますね。TextClipper本体はこのフォルダの中にあるtextclip.exeです。これをダブルクリックするとTextClipperが起動します。このソフトの使い方については

http://www.hi-ho.ne.jp/makoto_watanabe/tc/index.html などをみてください。

では次にclipfileというクリップツール(TextClipperの機能拡張のようなものです)をインストールしましょう。これはブラウザにかぎらずMS WordやAcrobat Readerで表示しているpdfファイルなど、任意のソフトで表示しているテキストを選択し、それを規定の名前のテキストファイルTc_txt.txtに次々と保存できるツールです。
一つのテキストファイルに、保存日時と出典、および保存時に追加できる任意のキーワードとともに保存してくれます。新しくクリップしたテキストはもとのテキストファイルの末尾に追加されます。これを使うと、ネットサーフィンで見つけたテキストをキーワード付きでテキストファイルで保存できますので、あとで秀丸など適当なテキストエディタでgrep検索して簡単に探し出すことができます。保存するときに将来検索の時に思いつきそうな、選択したテキストには含まれないキーワードを追加しておけるので、後々の検索時に探しもれが少なくなるのもこのツールの便利な点です。

3)では、clipfileを使えるようにしましょう。
以下のurlからクリップツールのclipfileを選んでダウンロードします。
http://takaki.la.coocan.jp/freesoft/textclipper/
ここをクリックしてダウンロードしてもいいと思います。clipfile.zipがダウンロードできますので、前に紹介した7-Zipなどのソフトで解凍します。解凍してできたclipfile.ctaというファイルを上の2)でできたtextclip7962のフォルダにドラッグして移動させます。これでclipfileを使う準備ができました。

4)TextClipperを起動して、clipfileを使ってみましょう。
まずTextClipperを起動します。

上の図のヘルプの左にある、環境設定を選び、

開いてでてくるメニューでクリップツールキーをAlt+cなど好きなキーの組み合わせに設定します。

これでAlt+Cを押したらクリップツールが動くように設定できました。

5)では、実際にテキストを適当に選んでスクラップブックのようにテキストファイルに保存してみましょう。
まずTextClipperを起動しておいてください。そのあと、ブラウザなどで適当なサイトを訪れて、保存したいテキストを選択し、さっき決めておいたクリップツールキー(Altをおして同時にCを押す)を押します。すると下の画像のようにポップアップメニューが開いて一番上に「TextFileに追加」がありますのでこれを選択します。
するとキーワード入力のポップアップ画面が開きますので、あとで検索に便利なキーワードを入れます。複数入れても構いません。自由に入力しましょう。

保存ボタンをおして完了です。Tc_text.textという名前のファイルに上の選択した部分が出典の一部、日時、キーワードとともに保存されているはずです。

ではうまく保存できたかどうかをtextclip7962フォルダ内にできているTc_txt.textというファイルを開いて確認しましょう。出典、日付、キーワード、クリップしたテキストの順に保存されていたら成功です(下図参照)。

上の例では、私の去年の学会でのランチョンセミナーの講演動画がでているYouTubeのページにあるテキストをクリップしたテキストの後に、今しがたクリップした論文のテキストが追加されています。N型糖鎖、先天性グリコシル化異常症などとあるのは、さきほどつけたキーワードです。その下にクリップしたテキストが保存されているのがわかります。

このように、ちょっと気になったテキストを、どんどんクリップして蓄積しておき、あとで秀丸エディタなどのテキストエディタのgrep検索機能で検索します。grep機能についているタグジャンプ機能を使えば該当するクリップしたテキスト全文のある場所に容易にジャンプすることができます。テキストファイルのサイズが大きくなってきたら、Tc_text.textファイルの名称をTc_text1.txtなどすきな名前に変更します。次にclipfileツールでクリップしたら、自動的にまっさらなTc_txt.txtファイルができてそこに保存されますので、またゼロからクリップがはじめられます。

こうしてできた大量のクリップファイルを一斉に grep検索したら何年にもわたって蓄積したデータを一瞬で検索できて便利です。データはテキストファイルですので、加工も活用もきわめて簡単です。英語論文の例文集の作成、アイデアメモの作成などいろいろな用途につかえるすばらしいツールですので是非活用してみてください。

写真は福岡で撮影したイチョウです。とてもきれいに黄葉しています。秋も深まってきました。

 

AntConcの使い方と活用法その2―自分専用の英語論文例文集(コーパス)の作り方pdftotextの使い方

前回紹介した英語論文用の例文集に使えるAntConcはテキストファイルやhtmlファイルを扱いますが、最も身近な英語の例文集の素材はpdfファイルだと思います。そこで今回は英語の例文集の作成のために重宝する、「pdfファイルをテキストファイルに変換する方法」を紹介します。AcrobatやFoxit Readerなどでpdfを開いて、textファイルとして保存する方法は、pdfファイルが数百、数千ある場合は手作業では対応できません。こんな場合は、Acrobatなどで複数のpdfファイルを一つのpdfファイルに結合してからtextファイルに変換するという方法もありますが、そんなめんどうくさいことをしなくてもpdftotextという無料ソフトを使えば一括で複数のpdfファイルをそれぞれ別のテキストファイルに変換でますので、やってみましょう。

まずpopplerというpdfを扱うプログラミングライブラリ(その中にpdftotextが入っています)をお使いのWindows, Mac, linux用のものを選んでダウンロードしてインストールします。linuxではsudoコマンドでpopplerをダウンロードしてインストールできますし、Mac版もアプリストアからダウンロードできるはずです。私が使っているWindows 10やWindows 7のPCの場合については、ここに詳しいインストールの仕方が書いた記事がでているのを見つけました。大変丁寧に書いてありますのでそのよく読んでインストールしてください。私もこの記事のとおりにインストールして利用しています。

私はCドライブ直下にpoppler-0.68.0というフォルダ(ダウンロードしたPopplerの圧縮ファイルを解凍(解凍ソフトは註1をみてください)してできるフォルダ名のままコピーしただけです)を作り、その直下にあるbinフォルダ(binaryフォルダの意味で、実行ファイルが入っているフォルダのことです)に自分の必要なpdfファイルを集めてテキストファイルに変換しています。shareフォルダの下にはpopplerとrenameしたデータファイル(上述のホームページにあるリンク
https://poppler.freedesktop.org/poppler-data-0.4.9.tar.gz からダウンロードしたpoppler-data-0.4.9.tar.gzファイルを解凍したもの。註1参照)をおいてください。あとは以下のコマンドを記述したバッチファイルをテキストファイルエディタで作ることが必要です。

for %%i in (*.pdf) do (pdftotext %%i %%i.txt)

このコマンドをテキストファイルエディタにうちこみ、できたファイルに適当な名前(pdf2txt.batとかすきな名前)をつけて保存します。保存のときデフォルトではテキストファイルで保存されれウため、pdf2txt.txtになりますのでファイル名の変更でpdf2txt.batにするか、保存時に.batで保存してください。保存場所はpdftotextのあるフォルダ(上の例ではbinフォルダ)にします。

あとは、変換したいpdfファイルを上のbinフォルダにコピーして、コマンドプロンプトでpdf2txt.batファイルを実行するだけです。日本語のファイルも英語のファイルもともにテキストファイルに変換されます。(invalid font weightというエラーが出るかもしれませんが無視してよいようです。不都合があったら教えてください。)

以下はコマンドプロンプトが初めての人むけの簡単な説明です(註2参照)。

バッチファイルというのはwindowsのコマンドプロンプト(windows7では「すべてのプログラム」の部分をみていくと、アクセサリフォルダの下にあります。windows10では下の図の左端の写真ようにシステムツールの下にあります。)でファイル名を入力してエンターを押すと、ファイル内に書いてあるコマンドを逐次実行するというものです。

矢印のコマンドプロンプトをクリックして起動するとき右クリックで、管理者として実行を選んで起動しておくと管理者としてログインしていないときにおこるトラブルをさけられますので注意してください。

今回のバッチファイルは以下のような内容で動きました。

for %%i in (*.pdf) do (pdftotext %%i %%i.txt)

意味は、iという変数にpdfのファイル名をいれ、それにpdftotextコマンドを実行してpdfのファイル名(%%i)のついたテキストファイル(%%i,txt)を作るという操作をフォルダ内にあるすべてのpdfファイル(*.pdfというワイルドカード*を使っている部分で、任意のファイル名のpdfファイルを表しています) がなくなるまで一個ずつ繰り返す(for    doの部分)というものです。

コマンドプロンプトを上に説明したように起動すると、黒いバックに白い字の画面が開きます(上の真ん中の図)
自分の今いるディレクトリ(フォルダ)の名前が表示されています。これから目的のpopplerのフォルダを探すとき、たとえばCドライブの直下にpopplerのフォルダがあるなら、コマンドプロンプトでcd ..(cdとうって、ピリオドを二回うちます)というコマンド(これはディレクトリを上に登って行くコマンドです)を何回かうってディレクトリをC:¥>にします。上の図の右端の図。
dirとうつとディレクトリやファイルの一覧が表示されます。
popplerのフォルダへ移りたいのでcd poppくらいまでをタイプしてあとはタブキーを押してください。タブの自動補完機能でcd poppler-0.68.0と自動入力されます。(このタブ補完の機能はlinuxで重宝するのですがWindowsのコマンドプロンプトでも利用できますので活用してください。) enterキーを押すとC:¥poppler-0.68.0>と表示されてディレクトリを移動したのがわかります。ここでdirとうってenterを押すとディレクトリ内のファイルとフォルダが表示されます。プログラムファイルのあるbinのフォルダ(ディレクトリ)があるのを確認してください。cd binとうってenterを押すとbinのディレクトリに移動します。C:¥poppler-0.68.0\binとなっていたら成功です(上の右端の図)。再びdirとうってenterをおします。これでこのbinフォルダ内にあるすべてのファイルとフォルダが表示されます。あとはそこにコピーしてあるバッチファイルpdf2txt.batを実行する(コマンドラインにpdf2txtとうってenterを押す)と、自動的にファイル名のついたtxtファイルができあがります。

こうして一括でpdfファイルをテキストファイルに変換したら、あとはこれらのテキストファイルをAntConcに読み込んでコーパスとして論文を書くときに参照すればいいわけです。

もちろんテキストファイルですから、テキストファイルを一括検索して、検索結果にタグジャンプして参照できるgrepコマンドも使えます。適当な、grepコマンドが使えるエディタ(たとえば有料ですが秀逸なエディタでおすすめの秀丸エディタ)でpdfの内容を串刺し検索するのもよいですね。pdfgrepというソフトもあって、これを使えばpdfファイルのままでgrepができるそうです。これはまだ使っていません。windows版をダウンロードしてさきほどのbinファイルにコピーしておけば、コマンドプロンプトで使えるのですが、linux版とちがって検索語がハイライトしなかったりしてまだ使いこなせていません。興味のある方は使ってみてください。

註1:圧縮ファイルの解凍には私は7-zipを使っています。たいていの圧縮解凍はこれでできます。
註2:パスの通し方とかは説明しないでpdftotextを使う方法を説明していますので、良く知っている方はパスを通して適当な場所にpdftotextをおいて使ってください。

AntConcの使い方と活用法その1―自分専用の英語論文例文集(コーパス)の作り方

京都でひらかれた大学の同窓会にでかけたりして更新が遅くなりました。京都は快晴で、まだもみじの季節ではなかったですが美しかったです。しかし観光客が多いこと多いこと。スペイン語や中国語、韓国語、さらにはノルウエーの旗を立てた団体もみかけました。

さて、昨年の分子生物学会のランチョンセミナーの中でAntConcというフリーソフトウエアの紹介をしました。英文を書くときに自分専用の例文集を作っておいて、それが簡単に検索できればとても役立ちます。前回紹介したTextClipperで役にたちそうな例文をテキストファイルに集めておいて、AntConcというフリーウエアでコンコーダンス検索してヒットした例文を参考に英語を書く方法を紹介します。もちろん自分の関係分野の論文のpdfをテキストファイルに変換して集めておき、それをAntConcで検索してもいいわけです。pdfをテキスト化するには、pdfをAcrobatなどで開いておいてtextファイル形式で保存するのも一つのやり方ですが、一斉にpdfをテキスト化するならLinuxやWindows、macなどにあるpdftotextといったソフトを使うのが便利です。ウインドウズにもこれが含まれているLooperというソフトがありますのでそれを使うといいでしょう。これについては次回紹介します。

それではAntConcの使い方の解説をはじめます。AntConcはコンコーダンスソフトウエアという種類のソフトウエアで、検索語を入力するとテキストファイルからその単語を拾い出し、文中に含まれるその単語の前後をふくめて表示してくれるソフトです。単語の文中での出現頻度などその他の様々な情報もわかります。まず早稲田大学のLaurence Anthony先生ホームページから自分のパソコンのOS(mac, windows, linux)にあったソフト(無料です)をダウンロードします。ここのリンクをご覧ください。
AntConcのホームページには、YouTubeの解説動画や日本語の解説pdf(バージョン3.2,2の解説ですがとても参考になります)などへのリンクもありますので適宜参照するといいでしょう。
ダウンロードしたファイルは実行ファイルなのでダブルクリックして起動します。詳細な使い方は先生のhelpファイルのpdfがあるのでダウンロードしてみてください。

写真はダブルクリックして起動した直後の画面です。起動時にはConcordanceタブが開いています。 Fileメニューが上にあります。Fileメニューをクリックするとプルダウンメニューが開き、その一番上にあるOpen File(s)を選んで検索したいファイル(複数選択可能です)を読み込みます。(下の図)

複数のファイルを読み込んで串刺し検索もできます。またOpen Filesの下のOpen Dirを選ぶと、フォルダ(あるいはDirectory)内にあるすべてのテキストファイル(とかhtmlファイル)を検索してくれます。こうして必要なファイルを開いてやると以下のような画面になります。
下の写真は私達の論文(AkiyoshiさんのCGGDBデータベースについての論文をpdfからテキストファイルにしたものでcggdb.txtという名称にしました)を開いたところです。
Current Filesというところに検索するファイル名が表示されます。複数選択した時は選択したすべてのファイルが列挙されます。
では検索してみましょう。resultという単語を検索することにします。Search Termの部分にresultといれて検索窓の下にあるStartボタンを押して検索してみましょう。(このとき右にあるwordsにチェックをいれています(下図参照)。単語としてのresultが検索されます。Caseにもチェックをいれると大文字小文字の区別をして検索できますし、Regexにチェックを入れると正規表現(Perlタイプのもの)が検索に利用できます)ヒット数は上のほうのConcordance Hits に表示されます。

6個ヒットしています。注意したいのはWordsにチェックを入れた状態で、resultを検索するとresultsは検索されないことです。Wordsのチェックを外してresultとして検索すると、resultだけでなくresultsもresultedもresultingもひっかかってきます。(下図)

ヒット数が57となっているのがわかると思います。
Concordanceメニュ―では、resultというキーワード(Key Words)が文のコンテクストの中で(In Context)どのように使われているかが表示されています。この表示を略してKWIC表示といいます。結果の表示法は、いろいろ下のメニューで変更可能です。たとえばSearch Window Sizeはデフォルトで50文字(腱索キーワードの前後50文字ずつ)となっていますが、これは増やしたり減らしたりできます。ちょっと表示を左右に広げてみるとよくわかります。

Search Termの検索窓の下のほうにKwic Sortとあるのは、検索結果のソートボタンです。

図ではLevel 1が1R(キーワードresultの右の語でアルファベット順にソート)、Level 2が同じ右の単語の場合は、キーワードの二番目の単語でさらにソートします。それがLevel 2 2Rという部分です。Level 3は三番目の単語でさらにソートとなります。もしresultの左の単語でソートしたいときは、Level 1以下の部分を下向きの矢印ボタンを何回かクリックして、下の図のようにかえて、Sortボタンを押してください。

すると検索キーワードの左の単語で再ソートされますので、resultの前にくる単語がわかります。

次にKWIC画面で表示されている原文をみてみましょう。みたいヒット行の青字で表示されているキーワードをクリックしてみましょう。クリックした文を含む原文がFile Viewタブが開いてそこに表示されます。

Hit Locationという部分の上下の矢印をクリックすると、前や後のresultを含む原文が表示されます。カーソルをFile View画面で動かせるようにしておくと、マウスの中央ホイールをくるくるまわして前後のresultを表視することもできます。

皆さんもご自分でつくったテキストファイルやテキストファイル群をこのソフトで開いて遊んでみてください。大変有用なソフトです。ちょっと長くなったので今回はここで止めます。次回はAntConcのその他の機能と、どうやってpdfからtextファイルを作るかについてpdftotextの使い方を紹介したいと思います。

写真は元寇のとき筥崎宮が避難していた場所を訪れたときのものです。とてもいい天気で気持ちがよかったです。バス停をおりると案内板があって、650mほどのぼりの道を行くと古い社があって記念碑がたっていました。人はだれもいません。一番最後の写真は帰りの川面です。波紋がきらきらと川底に映えてハヤも泳いでいました。このへんはホタルも初夏には見られます。

テキストデータをどんどん蓄積していくソフトの紹介―その2 TextClipperの紹介です。

HeartyLadder (ハーティー・ラダー)というソフトをご存知ですか?このソフトのサイトにある文章をそのまま引用させてもらいます。
だれでもみんな人に伝えたい「こころ」があります。
笑みで、言葉で、手紙で、そしてE-mailで・・・・

本ソフトウエアは手などが不自由なため、キーボードやマウスでの入力が出来ない方のために 開発した文章入力用のソフトウエアです。
 ハーティーラダーは、文章の作成やメール、そしてWindows操作を支援するソフトウェアです。キーボードやマウスが使えなくても、漢字交じりの文章を書けて  E-mailのやりとりができます。またホームページを見たり、ワードやエクセルなど一般のアプリケーションの操作もできます。  このソフトを使ってラブレターも書いてもらえたら素敵だなぁと思いながら、  私たちも心を込めて作っています。また、2011年に公開したマイボイスというソフトを使うことで、自分の声での読み上げができるようになっています。 このHeartyLadderがあなたの『心の架け橋(HeartyLadder)』になればうれしいです。

Xoops(註1参照)でつくられているHeartyLadder のサイト ハーティー・ラダー・サポーターのぺ―ジhttp://heartyladder.net/xoops/をみるとこれが、物凄いソフトだということがわかります。このソフトの開発改良が多くの方々の参画を得て、日々 着実に進んでいるのを拝見して頭がさがりました。たとえば以下をご覧ください。
http://heartyladder.net/xoops/modules/whatsnew/
ハーティー・ラダーの開発者は吉村隆樹さん。以下に紹介するTextClipperの開発者でもあります。吉村さんについてはご自身の本、パソコンがかなえてくれた夢 (高文研)や、吉村さんのホームページ まなつのみかんにある、ブログをご覧ください。なおこのまなつのみかんのHeartyLadderの記述は古いようなので、上にあるリンクをご覧ください。

HeartyLadderはキーボードやマウスが使えない方でもラブレターが書けるようにというコンセプトのソフトですが、どんどん改良を重ねておられて、今では視線入力装置と連携してALSの患者さんも使えるようになっているそうです。視線入力装置対応のHeartyLadderも無料で公開されています。昔は150万円くらいした視線入力装置が2014年に12000円くらいで入手できるようになったそうで、この視線入力装置を使うためのソフトHeartyAiと、このHeartyLadderと組み合わせるとよいとのことです。以下に説明のpdfがありますのでご覧ください。http://heartyladder.net//upload/takaki/hearty/HeartyAi.pdf
関連した新聞記事もリンクが切れるかもしれませんが、ご覧ください。
https://mainichi.jp/articles/20180331/k00/00m/020/106000c

さて、TextClipperです。これは以下のページにある吉村さんの説明を引用しますと、こんなソフトです。http://takaki.la.coocan.jp/freesoft/textclipper/

TextClipperについて
本プログラムはテキストのデータベースです。
某ユーザーさん曰く
  テキストのデータベースなんてかたぐるしく言わずに、「アイデアクリップ」とか
「アイデアメモ」なんて紹介するともっとユーザーが増えると思います。

と・・・・・
多くのテキストをツリー構造で管理します。
データーベースというと、データの入力が結構大変です。特にテキストのデータベースになると、テキストファイルを読み込んだり、ソフトを切り替えてコピー&ペーストを繰り返してと言うことになるでしょう。でもこのソフトではそういう作業は必要としません。
世はインターネットブーム。ネットサーフィンに興じている人も多いでしょう。
そこで得た情報はどうやって管理しておられるでしょうか。
この部分の文章はとっておきたいと思っても、すぐに簡単には保存できないと思います。
でもこのソフトを常駐させておくと、ネットスケープやインターネットエクスプローラで保存したい部分を反転して後はボタンを1つ押すだけです。
タイトルを付けたりする必要もいっさいありません。
プログラミングやネットサーフィンをしながら手間をかけることなく自然とデータベースにデータが蓄積されていく感じです。これより簡単な保存方法はないでしょう。
また、その逆のデータベース化したテキストを利用するときも、簡単に使用中のワープロやエディタ、通信ソフトにペーストできます。
本プログラムはいろんな場面で応用できると思います。」

私はこのソフトのクリップツールという機能拡張を主に使っています。ネットサーフインしていてこれはと思ったテキストをキーワードをつけて(つけなくてもいいです)、どんどん一つのテキストファイル(Tc_txt.txtという名前のテキストファイルです)に保存していくことができます。新しくクリップしたテキストはこのテキストファイルの最後尾にクリップした日時、簡単な出典表記、自分でつけたキーワード(なしでもOKです)とともに追記されていきます。こうしてテキストデータベースを構築しておけば、あれはなんだったっけと思いだせないときにも、保存したテキストファイルをgrepソフトなどで検索したら一発で該当テキストをみつけられます。キーワードを保存時に追加しておけばなおさら検索は容易になります。保存には自分で保存用キーを設定することもできます。私はたとえばshift+Cにして保存しています(12月1日追記:すみませんshift+Cでは大文字のCを入れる時にクリップツールが起動してしまいだめです。alt+Cとか、shiftのダブルクリック+Cとかにしてください。)が、キーコンビネーションは環境設定メニューの、キー割当から設定できます。

クリップボードに入ったテキストファイルが保存されますので、TextClipperを常駐させておけば、Microsoft Wordやpdfリーダー(Acrobatなど)、ブラウザで表示したテキストなど任意のソース中のテキストファイルを保存することができます。一つの決まったファイルにクリップするごとに付け足されていきますので、このクリップをどんどんつづけていけば、結構充実したテキストデータベースができます。このクリップツールは以前、吉村さんにお願いして作ってもらったものですが、大変便利です。
これはTextClipperのページにあるクリップツールのなかの、作者のところに木谷さん 野村さんとあるものをダウンロードして解凍してできたファイルclipfile.ctaを、TextClipperフォルダに入れると使えるようになります。私はこんなツールがあったら良いなぁとうお願いをしただけです。プログラムは木谷さんと吉村さんです。

私の去年のランチョンセミナーで、論文の例文集をつくっておいて、それをコンコーダンスソフトで検索して、英文執筆に役立てると言う話をしました。その例文集の作成にもピッタリのソフトですので、お試しください。その際、改行の処理とかが必要になるかもしれませんが、いろいろ工夫してみてください。とても便利なソフトですよ。

(12月2日追記:clipfileの使い方についてさらに詳しく説明しましたのでここを次にご覧ください。)

(註1:Xoopsはこのブログで使っているWordPressのような、コンテントマネジメントシステムCMSというもので、研究室の内部ホームページで必要な資料を共有する、連絡をするなどに活用していたこともあります。いろんなレンタルサーバーで使えるので活用するのもいいかもしれません。私達は、MicrosoftのOneNoteに変えてしまったので今は使っていません。OneNoteで各人の実験結果を毎日報告してもらい、進捗状況を把握しコメントする、通勤電車の中で各メンバーの進捗状況を確認してコメントする、情報を共有する、などの使い方をしていましたが、これは役立ちました。OneNoteは絶対おすすめのソフトです)

画面、動画、テキストなどデータをクリップするソフトの紹介―その1

今日は私が使っているいくつかのソフトを紹介します。まず画面の静止画像をキャプチャするソフトです。これはWinShotを使っています。昔からあるソフトですが私のwindows10環境、windows7環境で作動しています。(残念ながらwindows10ではヘルプはでません)。起動して範囲を指定してスクリーンキャプチャするには、デフォルトではAlt+PrintScreenを押します。範囲指定の十字が出てきますので、マウスを左クリックしてドラッグして範囲を決定してクリックするとクリップボードに範囲の画面がjpgで保存されます。もちろんビットマップ保存、jpeg保存などを、アクティブウインドウ、デスクトップ、台形範囲指定、などで保存できます。保存先のフォルダの指定ももちろんできます。このソフトは教材のスライドに資料として使いたい画像を挿入するのに使っていました。

一方、論文セミナーのスライド作りでは、論文のpdfを表示させておき、pdf表示ソフトの画像キャプチャ機能’(Adobe Acrobat Professionalならスナップショットツール)を利用して必要な図や表をクリップボードにコピーして、パワーポイントファイルにペーストします。図をコピーするときにはpdfの拡大表示(ズームインの拡大率)機能を活用して、表示倍率を100%ではなく300% 以上くらいにした上で、キャプチャしたい範囲を指定してキャプチャするのがいいです。100%でやると、できた画像はスクリーンに投影すると解像度が悪くてぎざぎざが目立って使い物になりません。パワーポイントで投影したときに図の画質が十分になるためには、pdfの表示倍率を高くしてキャプチャすると覚えておいてください。

話がそれましたが、上で紹介したソフトWinShotには、さらに定期実行キャプチャというのもあって、指定した秒の間隔で、デスクトップやアクティブウインドウ、指定した台形範囲などを定期的にキャプチャして一か所のフォルダにビットマップかjpegで保存してくれるモード(ファイルに自動ナンバリングもできる)もあります。これも重宝しています。定期的にキャプチャした画像をまとめてpdfにしたりするのも簡単にできますから、この機能の応用範囲は広いです。

あと、画面上で再生されている動画やカーソルの動きなどを動画で記録するためのソフトとしては、OBS Studioとかいうソフトが有名なようです。一度ダウンロードして使ってみようと思いますので次回に報告します。また次回にはクリップボードにコピーしたテキストファイルをどんどん集めていくソフトの紹介もしますのでお楽しみに。

写真は散歩コースの途中でみかけた萩の花です。秋も深まってきました。

 

夏休みおすすめソフト(3)RstudioにR commanderとそのプラグインEZRを入れてみよう―EZRインストールのトラブルシューティング

前回はRとRstudioの紹介をしました。続いてRstudio上からRのプラグインであるR commanderと、RコマンダーのプラグインであるEZRをインストールする方法を紹介しようと、最新版のRを使って紹介記事を書いていたのですが何故かEZRのインストールがうまくいきませんでした。Rcmdr(R コマンダー)をRstudioからインストールしたあと、EZRをRstudioからインストールする時うまくいきませんでした。解決したのでうまくいったRコマンダーとEZRをインストール法を紹介しておきます。

前回紹介した方法でRをインストールし、次にRstudioをインストールします。
次にRstudioを起動してRcmdrをインストールします。やり方は、

Rコマンダーのインストール:
右下のpane(パネルのようなもの)からpackagesタブを選びます。boot, class, clusterなどのsystem libraryのパッケージがすでに存在するのがわかります。アルファベット順にならんでいるのでずっとリストをみていってもR commanderなどのパッケージ(Rcmdrなど)はありません。これをインストールするのが今回の作業です。 右下パネルのInstallタブをクリックします。すると新しいウインドウが開いてpackagesという部分にカーソルが点滅していますので、そこにrcmdrといれてみましょう。ポップアップがでてきてRcmdr以下、RcmdrMiscとかRcmdrPlugin.aRnovaなどがずらーっと一覧ででてきます。下ののほうにRcmrPlugin.EZRもありますね。まずRcmdrを選択します。install depencenciesのチェックがはいっているので、そのままにします。そしてInstallボタンを押します。すると左下のコンソールpaneにいろいろいろ赤字で表示がはじまり、packagesを次々と解凍してインストールしているのがわかります。結構な時間がかかると思いますが終わるまで気長に待ちましょう。赤字でいろいろ経過が表示され、その後、カーソルが点滅してすすまなくなったように見えますが、5分も放置しておくと次にすすむようでパッケージの解凍などに時間がかかるようです。コンソールパネルにThe downloaded binary packages are in どこそこ、というパッケージの保存場所の表示がでたら終わりです。終わると右下のPane{パネル)に前にはなかった様々なパッケージがあるのがわかります。パッケージの表示パネルにRcmdrとRcmdrMiscが表示されているのを確認してください。

次に、library(Rcmdr)とコンソールにうちこんでR commanderを起動。see ?effectsTheme for details.という赤字のメッセージでRstudioのコンソール画面は止まるので、Rstudioのウインドウを最小化して画面をみると、「Rcmdrが利用する次のパッケージがありません」というメッセージのでているポップアップウインドウがあり、「これらのパッケージをインストールしますか?」ときいてくるので、はいをクリック。すると、「ないパッケージをインストールする」という画面がでるので、CRANの指定でOKを押します。

Rstudioにもどって見ていると、つぎつぎと赤字でインストールがすすみます。そしてインストールが成功すると>の印がコンソールにでますので、インストール終了です。

コンソールにlibrary(Rcmdr) とうちこんでエンターを押すと、Rコマンダーのポップアップウインドウが自動で開きます(日本語です)。

EZRのインストール:
上の図のR コマンダーのメニューのツール(ヘルプの左)をクリックして、Rcmdrプラグインのロードをクリックします。(ここが大事なのですが、この段階で、Rstudioの右下のPackageのパネルでRcmdrPlugin.EZRにチェックが入っていないことを確認してください。つまりRにロードされていませんので注意してください。私は最初、Rcmdr, RcmdrPlugin.EZRの順にRstudioの右下パネルでチェックをいれて、Rコマンダーを立ちあげていました。そうするとEZRがこのプラグインのロードに表示されない=RコマンダーからEZRが使えないという不具合が起こります。必ずPackageのパネルでEZR pluginにチェックが入っていないことを確認してください。上の図のようにプラグインにEZRが選択されて表示されているので、OKをクリックします。するとRコマンダーを再起動しないとプラグインを利用できません、再起動しますか?(下図)ときいてくるので「はい」をクリックします。

再起動するとEZRの画面がでます(下図)。Rstudioとは別のウインドウに表示されるので注意してください。

メニューの一番右に「標準メニュー」というのがでていたら成功です。ここに本来のRコマンダーのメニューがあつまっていて、Rコマンダープラスアルファの機能がその他のメニューから使えます。解析結果のグラフなどはRstudioのplotパネルではなく独自のポップアップパネルにでてきます。

Rstudioにもどってみると、右下のパネルのPackageのところのRcmdrPlugin.EZRにチェックが入りました。

EZRを閉じるときには、Rコマンダーのメニューから閉じて、その後、Rstudioを閉じてください。

以上です。

その他のRstudioについての注意:
1)RstudioではLinuxとおなじようにTab補完機能が使えます。たとえばコンソールでlibrary(Rとうちこんでtabキーを押すと、RcmdrとかRcmdrPlugin.EZRとかの候補がポップアップしますので、適当なのを選んでエンターをおせば入力の手間がはぶけます。これは便利な機能です。

2)あとR commanderが起動している状態でRstudioを終了するときの注意。Rstudioでquitコマンドをいれても永遠に終わらないので困ります。これは、R commanderの終了画面でOKをおさないとR コマンダーが終了できないためです。RstudioのquitコマンドではRコマンダーはquitできず、quitting sessionsが永遠に続くのです。

3)インストールしたパッケージは、ドキュメントのフォルダにあります(windows7以上の場合)。まっさらにRをしたいときは、Rをアンインストールした後、このドキュメントフォルダ内の、Rフォルダを削除しないとパッケージは残ります。

4)Rstudioでは4つのpaneが表示されるといろんなところに書いてあります。でも一番左上のソースエディタが表示されていない人が多いのではないでしょうか。これを表示させるには、ToolsからGlobal Options、Pane LayoutとすすみEnvironment, History, connections, presentationsと並んである画面にあるViewerのチェックをいれると表示されるようになります。もう一つよくあるのは、ソースエディタが隠れていて見当たらないケースです。この場合は、sourceと書いてあるのでわかります。その部分をマウスでドラッグして拡げればソースエディタが見えるようになります。