私の口演動画の紹介を含むページを作っていただきました

以前、分子生物学会・生化学会の合同大会2017でランチョンセミナーをさせていただきました。その動画は以前紹介したようにYouTubeにでていますが、このたび、シュプリンガー・ネイチャーが電子ブックに関するインタビューや動画をまとめたページを作成してくださったと連絡を受けたので紹介しておきます。

「著者、利用者が語るその魅力 ― イーブック体験談」というページです。私の動画紹介だけのページはこちらです。他にもいろいろ面白い動画がありますのでご覧ください。

写真は近所の公園で一昨日撮影した桜です。桜がはらはらと散る光景も目につくようになり、そろそろ散った桜の花びらが道路をおおうようになってきました。

糖鎖生物学入門―2

糖鎖生物学入門―2

新元号が令和に決まりましたね。漢和辞典でという字を調べてみると、令日は「よき日」の意味ですし、令人は「よき人、美しい人」の意味、令嬢とか令徳など、の次に来る字が「よきものであり、うやまう」という用例が多いようです。平和や なごみがよきものになりますようにという意味になる、よい元号だと思いました。
今これを九大医学部図書館で書いていますが、九大医学部の桜も満開です。写真は今日の医学部キャンパスで撮影した満開の桜と、

3月26日に撮影した医学部キャンパスの桜です。

さて、糖鎖生物学入門の二回目です。九州大学で同名の講義をした時の資料をもとに全く新しく書いていきます。

糖鎖の構成要素(単糖):
糖鎖sugar chainというのは、単糖とよばれる糖がつながってできる鎖(枝分れするものも多い)です。糖鎖というのは例えばこんなものです。

この図には9種類の糖鎖があげてあります。色のついた丸や四角が単糖monosaccharideを表しており、単糖が様々につながって糖鎖ができるのです。枝分れしたりしていますので、糖鎖はとても多彩な分子構造をとることができそうですね。

単糖というのは、グルコース(ブドウ糖です)とかガラクトースとか、フコースとかN-アセチルグルコサミン(エヌアセチルグルコサミン)とかいう糖で、色々な種類があります。糖鎖について学び始めるときに最初に学ぶべき単糖の名前を下の図にのせておきます。こんな単糖があって、糖鎖をつくっているのだというのをみるのに最適な、入門者むけの単糖だけを選んであります(註1参照)。
この図にのっている単糖の名前や、記号を全部覚える必要はありません。その都度、参照することにしたらいいです。図にある単糖の中でN-アセチルグルコサミンGlcNAc(N-アセチルグルコサミンです。糖鎖生物の研究者は普通、グルックナックと読みます)とか、マンノースMan、グルコースGlc、ガラクトースGalなどの名前はサプリメントの広告とか、日常生活でよく耳にするのではないでしょうか?図には15個の単糖が並んでいますが、たいていの糖鎖はこの図の中の数種類だけを使ってつくられています。単糖の具体的な構造は以下で紹介します。

さて単糖の表記には図にみられるような、カラフルな記号表記が良く用いられています。昔はもっとごちゃごちゃした表記しかなかったのですが、パッと見て糖鎖の構造や類似性がみやすいカラフルな表記が普及しつつあります。Symbol Nomenclature for Glycans (SNFG)と呼ばれる記号表記で、以下のページにまとめられているので参照に便利です。
https://www.ncbi.nlm.nih.gov/glycans/snfg.html

リンクをクリックしてもらって図をご覧になればわかりますが、ものすごい数の単糖がならんでいます。これを全部覚える必要はありません。この図には様々な糖鎖を記述できるようにと、ヒトなどではあまり見かけない単糖も入っているからごちゃごちゃしているのです。そこで次の表には私の独断と偏見で選んだ、入門者に必要な単糖のみを残して後は消したものをあげてあります。(バクテリアにみられる糖とか、希少糖などめずらしい糖―いろんな生理機能も知られて重要性が叫ばれています―を除外しています。)上の図よりちょっと増えて20個ありますが必要に応じて参照していただければと思います。リンク付のpdfファイルもここにありますので参考にしてください。

Glc  Man  Gal 
グルコース マンノース ガラクトース
GlcNAc  ManNAc  GalNAc 
N-アセチルグルコサミン N-アセチルマンノサミン N-アセチルガラクトサミン
GlcN  ManN  GalN 
グルコサミン マンノサミン ガラクトサミン
GlcA  ManA  GalA  IdoA 
グルクロン酸 マンヌロン酸 ガラクツロン酸 イズロン酸
  Xyl  Fuc 
キシロース フコース
Kdn  Neu5Ac  Neu5Gc  Neu  Sia
ケーディーネヌ N-アセチルノイラミン酸 N-グリコリルノイラミン酸 ノイラミン酸 シアル酸(左の単糖から合成される単糖の分子ファミリー名)

青字の単糖にはリンクがはってありますので、クリックすると単糖の構造式や立体構造が表示されるページにとびます。
こうしたカラフルなSNFG表記の記号は、糖鎖科学の標準的教科書Essentials of Glycobiology 3rd editionでも使われています。https://www.ncbi.nlm.nih.gov/books/NBK310274/ 書籍版は有料ですが最新版が無料で上のリンクで公開されています。この本の図を全部パワーポイント形式にまとめたスライドも前の記事に書いたように無料で公開されていいます。糖鎖生物学の入門者には、この教科書の通読は必要ありません。せっかくネットにアップロードされていて、本の中身の検索もオンラインで自由にできます(このリンクのSearch this bookボタンを使います)ので、糖鎖学習のハンドブックとして是非活用してください。第二版の日本語訳も出ています。

単糖の構造を立体表示してみよう:PubChemによる表示
PubChemというのをご存知ですか?PubChemはNIHが公開しているオープンデータベースです(だれでも研究データをアップロードできて、だれもが利用できるというのがオープンの意味です)。PubChemを使うと様々な化学物質の情報、生理機能、特許、文献、構造式、立体構造そのほかが無料で調べられ利用できます。糖鎖を構成している単糖の構造を立体表示するにも最適のサイトですので、使ってみましょう。

SNFGのページを開いて以下のリンクから単糖のリストのパワーポイントファイルをダウンロードすると、

https://www.ncbi.nlm.nih.gov/glycans/docs/SymbolNomenclatureForGlycans_SNFG_Slides_UpdateJun2017.pptx

全部の単糖が入ったファイルがみられます。上で物凄い数の単糖のリストといったものです。各単糖にはPubChemへのリンクが張られており、スライド表示にして単糖の名前をクリックするとPubCemへのリンクがブラウザで開いて、化学式や立体構造がPubChemで表示されるのでとても便利です。いろいろPubChemで単糖を表示して遊んでみるのが入門にはよい経験になります。グルコースやガラクトースを立体表示してくるくる回して分子模型を手にとってみているように学べます。

注1:図は糖鎖構造を書くソフトGlycoEditorの入力画面をスクリーンショットしたものです。無料の糖鎖構造作図ソフトですので自分で使えそうな人は、ちょっと使ってみるのをお勧めします。詳しい使い方は次回以降に説明します。

 

画面、動画、テキストなどデータをクリップするソフトの紹介―その2 OBS studioの使い方

デスクトップでの操作の記録や、ビデオデータの記録方法―OBS studioの使い方

(2019/2/05に追記した部分は青字で表示してあります。参考にしてください。)
勉強や研究をしているとデータベースの使い方を説明する時にマウスカーソルの動きやクリックの様子などをビデオで記録して見せたいときがよくあります。また講演会などでストリーミング放送されているものなどを記録しておきたいこともあると思います。こんな時にはいろいろ有料のスクリーンレコーダーというジャンルのソフトウエアがあるのですが、インストールするときに使用許諾がいろいろ書いてあって、このソフト、信用できるのか?裏で妙なことをしていないのか?などと不透明な部分もあって、使用に不安を覚えます。前に名前だけ紹介しましたが、OBS studio というオープンソースの無料のソフト(Windows, Mac, Linux対応版があります)を使えば無料で使えて、わりに手軽に作業ができます。OBSはOpen Broadcaster Softwareの略です。
OBS Studio – Free and open source software for live streaming and screen recordingと題して、Githubにソースコードも公開されています
ゲームの画面を録画してYouTubeなどにアップロードするために良く使われているソフトですが、十分高解像度で画面の動きなどを逐一記録できるソフトです。ゲームをやる人のための日本語の解説は多いのですが、あまりデスクトップやウインドウの録画についての日本語の解説がないみたいですので、簡単に紹介したいと思います

OBS Studioのソフトのインストール:
https://obsproject.com/ja/download
からLinux, Mac, Windows版をダウンロードしてインストールします。私はwindows10 なのでWindows版の解説となりますが、他のOSでも大差ないはずです。

ページのウインドウズ、マック、リナックスのロゴをクリックすると右下にダウンロードインストーラが表示されるのでクリックしてダウンロードします。インストールするときにゲームの記録画面の配信モードにするか、単に録画だけにするかと聞いてきますので録画だけにするのがいいと思います。また管理者モードで実行するように設定できると思うので、そのように設定します。言語には日本語を選ぶといいでしょう。メニューなどすべて日本語になります。

ウインドウを録画してみよう:
インストールして起動すると下のギャラリーの一行目、一番左の図のような画面になります。(ギャラリーは、一番上の行の左から右へと図をみて、次は下の行にうつって左から右へとみてください。)中央の黒い枠の部分に表示されている中身が録画されます。この枠内にブラウザの画面とかデスクトップとかを表示し、録画したい部分をaltキーを押しながら枠の周りの囲み線をドラッグして選択します。選択がおわったら、shiftキーを押しながらドラッグして枠内にぴったりはいるようにしたら録画準備完了です。これから以下に詳しく説明します。

ウインドウ画面の録画をやってみましょう。まずFirefoxなどのブラウザの画面からキャプチャしてみましょう。Firefoxなどを先に起動してキャプチャしたい画面を表示しておいてください。

つぎにOBS studioを起動します。ウインドウキャプチャによる録画にはシーン、ソース、ミキサー、シーントランジション、コントロールとある下のほうの画面から、ソースの部分でプラスの記号をクリックします(ギャラリーの一行目左の図)。

するとウインドウキャプチャ、ゲームキャプチャなどがならぶプルダウンメニューがでますので(ギャラリー一行目真ん中の図)、ウインドウキャプチャを選んでみてください(一行目左から真ん中そして右の図)。ウインドウキャプチャのプロパティという画面がでて(二行目左の図)、カーソルをキャプチャするかどうかなどを設定できます。OKを押してとじてください(二行目真ん中の図)。Firefoxなどが起動していると、黒い画面の中にFirefoxのウインドウが表示されると思います。

黒い背景画面にうまく録画したい場面が全部がはいっていないと思います(二行目右の図)。黒い背景画面いっぱいの部分が録画されるので、録画する画面(クリックすると四隅と上下左右の各辺の中央に赤い丸印のある部分がハイライトされますのでその画面)を黒い画面いっぱいにあわせましょう。Firefoxの表示画面を選択する方法を例に紹介します。

表示されているFirefoxの画面をクリックして、画面の四隅と、左右、上下の辺の中央にある赤い丸を押します(二行目右から三行目左の図)。この赤丸の辺で囲まれた領域が現在録画されるようになっている範囲です。これを広げて全部が入るようにします。

Altボタンをおしながら赤丸がついている画面の赤丸をドラッグすると、記録したい画面を調節することができて、録画範囲を上下左右に広くしたり、狭くしたりして変更することができます。記録したい画面が決定できたら、altキーを離し、今度はshiftキーを押しながらドラッグして、選択した録画範囲の画面を後ろの黒い画面の隅に移動します(三行目左と真ん中の図)。大きすぎて黒い画面からはみだしていたら、右隅の赤丸を選択して、shiftキーを押しながらドラッグしてやると小さくできます。右隅の赤丸をクリックして、 shiftキーを押しながらドラッグして、一番大きな黒枠のなか(この部分が録画されます)にぴったり録画したい画面があてはまるように調節します(三行目右の図)。

あとは録画条件を次に説明するように設定し、録画ボタンをおすと録画開始です。録画開始と終了をたとえばウインドウズキーぷらすF12とかにきめることも設定でできますので、ボタンをおさずにキーコンビネーションで録画することも可能です。

OBS studioの録画条件の設定
配信をしないので以下では配信の設定は行いません。必要なら設定してみてください。
では録画条件の設定法を解説します。

一番簡単な録画条件の設定法を紹介します(2019年2月5日追記)
ファイル、編集、表示などと並んでいる項目メニューから、ツールを選びます。プルダウンメニューが開き、一番上に自動校正ウイザードというのがありますのでこれを選んでください。
デフォルトでは「配信のために最適化し、録画は二次的なものにする」にチェックがはいっています。チェックを外して「録画のために最適化し、配信はしない」にチェックを入れてください。次へをクリックすると、映像設定メニューがでてきて、基本(キャンバス)解像度―現在の値を使用というプルダウンメニュー、そしてFPS―60または30のいずれか、可能なら60を優先というメニューがでます、これらは変えてもいいですが普通はこのままで、次へを押します。するとテストがはじまって、プログラムがあなたのパソコンに最適の設定を選んでくれます。録画エンコードとか、品質などが選ばれて表示されますので設定を適用のボタンを押して終了です。この自動校正ウイザードを使えば、一番録画失敗の少ない設定になるのでおすすめです。自分でいろいろ設定したい人は以下もご覧ください。録画したムービーをどこに保存するかや、録画フォーマットなどは以下を読んで設定してください。(2019年2月5日追記終了)

手動での録画条件の設定方法;
ファイル、編集、表示…などと並んでいるメニューから、
ファイル→設定→出力とすすんで、出力モードをプルダウンで「詳細」にします。
左から配信、録画、音声、リプレイバッファーというタブがありますので、録画を選びます。
種別は標準
録画ファイルのパスは、できた録画ファイルをいれるフォルダの場所を決める部分です。右の参照ボタンなどを使って、自分の好きなフォルダを選んで設定します。
録画フォーマットは プルダウンからいろいろ選べますが、私が試行錯誤した結果は、ts やmkvがおすすめです。(ほかに動画の形式としてはflv,mp4, mov,m3u8が選べます。flvがデフォルトになっています。) 動画の形式ではmp4やmkvなども試しましたが、私のパソコンでは、録画してできたファイルを再生すると うまく録画できておらず、音声は進むのに画面が止まったままの部分があちこちにできてしまうこともありました。私のパソコンで試した時は、ts形式を選ぶとCPUへの負担が少なくなるのでエラーが回避できました。mp4などでエラーがでるときは試してください。たしかOBS Studioはマルチプロセッサーを利用していないはずです。できあがったtsファイルやmkvファイル、flvファイル、mp4ファイル、movファイルなどは前に紹介した動画プレイヤーのMPC-BE x64で再生可能です。

以下は私の使っている録画の部分の設定です。


録画フォーマットはts、
エンコーダは私はQuickSync H.264を選んでいます。プルダウンメニューで表示される
(ストリームエンコーダを使用)(QuickSync H.264), x264などから素材に応じて選択します。利用できるハードウエアエンコーダがパソコンにないときはストリームエンコーダとx264しか表示されません。
出力をリスケールするにはチェックはいれていません。
カスタムマルチプレクサ―の設定もなし。

ターゲットの使用法は、qualityをプルダウンから選択。(balanced,speedも選べますのでうまく録画できないときは試してみてください。自動設定では私のパソコンではbalancedが選ばれていました―2019/2/05追記)
プロファイルはbaselineにしています。他にhigh, mainも選べます。
キーフレーム間隔は3、
非同期深度は4、
レート制御はCBR、
ビットレートは2500としています。

次は映像です。設定画面の左側、一般、配信、出力、音声、映像、ホットキー、詳細設定というアイコンの中にある、映像アイコンをクリックしてください。
基本(キャンバス)解像度は、1366×768などご自分のパソコンのモニタの解像度に設定します。この数値はカーソルをあわせてクリックした後適当な値に変更できます。
出力(スケーリング)解像度は、基本解像度と同じでもいいですが、CPUが追い付かずに録画に不具合がでるときは、小さめに設定するといいと思います。1280×720とか、ご自分のモニタの解像度の選択枝から選ぶのがいいでしょう。(910×512が自動設定ウイザードでは設定されていました―2019/2/05追記)
縮小フィルタはバイキュービック、ランチョス、バイリニアから選びます。ランチョスが解像度がよくて、バイリニアが一番悪いのでランチョスから試してみてください。

FPS共通値は毎秒のフレーム数ですので、プルダウンから選ぶか直接入力して30とか29.97とかでいいでしょう。


あとは録画のホットキーを設定しましょう。
映像アイコンの下にある、ホットキーアイコンをクリック、開く画面で、録画開始と録画終了のキーをきめます。私はWindowsキー+F12にしています。

以上で録画の設定が終わりです。他の設定はデフォルトのままにしておいていいでしょう。右上のx印をおしてウインドウを閉じる時に「保存していない変更があります。変更を保存しますか」ときいてくるので「はい」をクリックして終わりです。

Firefoxなどでムービーを再生しておき、録画したい部分を設定して、メニューの録画開始、あるいは設定したホットキーをおしたら録画が始まり、もう一回同じキーをおすと録画終了します。カーソル操作を記録したいときは、ソースのウインドウキャプチャを右クリックし、プロパティでカーソルをキャプチャにチェックをいれます。

参考:
この条件でも録画に失敗することがあります。そこで他の録画条件設定についても簡単に触れておきます:エンコーダをソフトウエアエンコーダである、x264に設定した場合(これでもだめならストリームエンコーダにするとうまくいく時もあるかもしれません)下のほうにレート制御、ビットレートなどの選択画面がでてきます。
CPU使用のプレセットは、デフォルトがveryfastですが、CPU使用率を下げるにはsuperfastやultrafastを選ぶといいようで、私は一番CPU使用率の低いultrafastを使っています。

動画のことは素人ですので、もっとうまい設定があるかもしれません。いろいろ試してみてもっとうまくいく方法があれば教えてください。

新しい研究成果の発表の場ができています―microPublication Biologyの紹介です

福岡は暖冬のようです。例年になく早く水仙、椿が咲きはじめ、梅の開花も例年より随分早かったそうです。夜になるとオリオン座が昇ってきてとても綺麗な冬です。写真はiPhoneでオリオン座を撮影して、画像処理で見えるようにしたものです。結構感度がいいんですね。周辺の星々もちゃんと写っていました。

最近、こんな雑誌から査読依頼がきました。microPublicationといいます。

これはWormbaseのDaniela Raciti, Karen Yook,Todd Harrisさんたちが始めた研究成果の全く新しい形式での発表の場です。
”As you may know, WormBase recently launched a novel publication platform microPublication, that allows researchers to share high quality but traditionally unpublished stand-alone data and datasets.”

とDanielaさんからいただいたメールにありました。今までは論文にうまく入れ込めなずに発表できなかった研究成果、単一の論文にできなかったような優れた研究成果(データやデータセット)や取得した変異体などについても発表できて、引用できるようになるというものです。モデル生物の線虫C. elegans、ショウジョウバエ、カエルXenopusのコーナーがあり、もうすぐゼブラフィッシュやGene modelというのも追加されるようです。
Expression data, Genotype Data, Phenotype data, Genetic screens, New Methods, Software, Database updates, Integrationsなどのカテゴリーで投稿しますが、これにうまくはいらないカテゴリーのデータでもOKです。

単独では論文にできないけれど発表しておきたい研究成果があれば、図か表の一枚分くらいの程度で引用論文を含めて公開できます。

FAQのページには以下のように書いてあります。
How do you differ from traditional journals?
The major goal of microPublication Biology is to rapidly place research findings into the public domain.  Thus unlike other journal platforms, we publish single high quality research results, independent of perceived impact, which can be new research findings, negative results, reproduced/replicated results or “unpublished observations” from prior publications.  Single results can stand alone, and do not require a narrative story to placate editors. Placing such findings into the public domain not only advances the scientific endeavor, but also gives credit to the individual(s) that did the work.

このjournalの主な目的は、研究成果をすばやくpublic domainに入れることだとあります。現在のところarticle processing feeは無料、将来もsubmissionは無料だそうです。microPublicationでは、いままで雑誌に掲載できなかった否定的な結果negative resultsや、追試結果、以前の論文でunpublished resultsと書いた実験結果などの投稿もOK で、普通の論文のようにストーリーの中にいれることなく、単独で独立して発表できるという、大変チャレンジングな試みです。データを独占せず共有するという線虫コミュニティの気概を感じさせるこころみですね。同じようなものにPLosCurrentsというのがあったそうですが、これは立ち消えてしまいました。
公開例は、たとえば以下をご覧ください。

https://www.micropublication.org/expression-data.html

https://www.micropublication.org/genotype-data.html

査読者名も表示、非表示をレフリーが選べるようになっています。また公開したmicroPublicationにはDOI.が割り振られ、引用可能になります。オープンアクセスです(CC BY 4.0)Europe PubMed Centralにインデックスしてもらうようになるはずとのことです。
私も投稿してみようかと思っています。

テキストデータをどんどん蓄積していくソフトの紹介その3―詳しいTextclipperのclipfileツールの使い方です

前に紹介したTextClipperのクリップツールの一つclipfileを作者の吉村隆樹さんがバージョンアップしてくださいました(2018/11/28)。前のバージョンを使っている方は新しいバージョンにしてください。ここからバージョンアップ版をダウンロードして解凍してできたclipfile.ctaファイルをtextclip7962フォルダ中に上書き保存するだけです。以前のバージョンでは保存日時の年号が正しく入らなかったのですが、今回のバージョンアップで2018がちゃんと入るようになりました。吉村さんによると典型的な2000年問題だったそうです。バージョンアップをお願いして数時間で新バージョンを作ってアップロードしてくださいました。吉村さん、どうもありがとうございました。

以下では先日紹介したTextClipperのクリップツールclipfileの使い方をもうすこし詳しく紹介しておきます。
1)まずTextClipperをここからダウンロードしてダウンロードしたzipファイルを解凍してください。解凍してできたフォルダがtextclip7962という名前になります。このフォルダはProgram Filesのフォルダには入れないでください。入れると動きません。このプログラムを使用するには7-zip32.dllが必要です(バックアップ時)のでここから取得してください。

2)ここまでの作業でtextclip7962というフォルダができました。バージョン番号がフォルダ名になっていますね。TextClipper本体はこのフォルダの中にあるtextclip.exeです。これをダブルクリックするとTextClipperが起動します。このソフトの使い方については

http://www.hi-ho.ne.jp/makoto_watanabe/tc/index.html などをみてください。

では次にclipfileというクリップツール(TextClipperの機能拡張のようなものです)をインストールしましょう。これはブラウザにかぎらずMS WordやAcrobat Readerで表示しているpdfファイルなど、任意のソフトで表示しているテキストを選択し、それを規定の名前のテキストファイルTc_txt.txtに次々と保存できるツールです。
一つのテキストファイルに、保存日時と出典、および保存時に追加できる任意のキーワードとともに保存してくれます。新しくクリップしたテキストはもとのテキストファイルの末尾に追加されます。これを使うと、ネットサーフィンで見つけたテキストをキーワード付きでテキストファイルで保存できますので、あとで秀丸など適当なテキストエディタでgrep検索して簡単に探し出すことができます。保存するときに将来検索の時に思いつきそうな、選択したテキストには含まれないキーワードを追加しておけるので、後々の検索時に探しもれが少なくなるのもこのツールの便利な点です。

3)では、clipfileを使えるようにしましょう。
以下のurlからクリップツールのclipfileを選んでダウンロードします。
http://takaki.la.coocan.jp/freesoft/textclipper/
ここをクリックしてダウンロードしてもいいと思います。clipfile.zipがダウンロードできますので、前に紹介した7-Zipなどのソフトで解凍します。解凍してできたclipfile.ctaというファイルを上の2)でできたtextclip7962のフォルダにドラッグして移動させます。これでclipfileを使う準備ができました。

4)TextClipperを起動して、clipfileを使ってみましょう。
まずTextClipperを起動します。

上の図のヘルプの左にある、環境設定を選び、

開いてでてくるメニューでクリップツールキーをAlt+cなど好きなキーの組み合わせに設定します。

これでAlt+Cを押したらクリップツールが動くように設定できました。

5)では、実際にテキストを適当に選んでスクラップブックのようにテキストファイルに保存してみましょう。
まずTextClipperを起動しておいてください。そのあと、ブラウザなどで適当なサイトを訪れて、保存したいテキストを選択し、さっき決めておいたクリップツールキー(Altをおして同時にCを押す)を押します。すると下の画像のようにポップアップメニューが開いて一番上に「TextFileに追加」がありますのでこれを選択します。
するとキーワード入力のポップアップ画面が開きますので、あとで検索に便利なキーワードを入れます。複数入れても構いません。自由に入力しましょう。

保存ボタンをおして完了です。Tc_text.textという名前のファイルに上の選択した部分が出典の一部、日時、キーワードとともに保存されているはずです。

ではうまく保存できたかどうかをtextclip7962フォルダ内にできているTc_txt.textというファイルを開いて確認しましょう。出典、日付、キーワード、クリップしたテキストの順に保存されていたら成功です(下図参照)。

上の例では、私の去年の学会でのランチョンセミナーの講演動画がでているYouTubeのページにあるテキストをクリップしたテキストの後に、今しがたクリップした論文のテキストが追加されています。N型糖鎖、先天性グリコシル化異常症などとあるのは、さきほどつけたキーワードです。その下にクリップしたテキストが保存されているのがわかります。

このように、ちょっと気になったテキストを、どんどんクリップして蓄積しておき、あとで秀丸エディタなどのテキストエディタのgrep検索機能で検索します。grep機能についているタグジャンプ機能を使えば該当するクリップしたテキスト全文のある場所に容易にジャンプすることができます。テキストファイルのサイズが大きくなってきたら、Tc_text.textファイルの名称をTc_text1.txtなどすきな名前に変更します。次にclipfileツールでクリップしたら、自動的にまっさらなTc_txt.txtファイルができてそこに保存されますので、またゼロからクリップがはじめられます。

こうしてできた大量のクリップファイルを一斉に grep検索したら何年にもわたって蓄積したデータを一瞬で検索できて便利です。データはテキストファイルですので、加工も活用もきわめて簡単です。英語論文の例文集の作成、アイデアメモの作成などいろいろな用途につかえるすばらしいツールですので是非活用してみてください。

写真は福岡で撮影したイチョウです。とてもきれいに黄葉しています。秋も深まってきました。

 

AntConcの使い方と活用法その2―自分専用の英語論文例文集(コーパス)の作り方pdftotextの使い方

前回紹介した英語論文用の例文集に使えるAntConcはテキストファイルやhtmlファイルを扱いますが、最も身近な英語の例文集の素材はpdfファイルだと思います。そこで今回は英語の例文集の作成のために重宝する、「pdfファイルをテキストファイルに変換する方法」を紹介します。AcrobatやFoxit Readerなどでpdfを開いて、textファイルとして保存する方法は、pdfファイルが数百、数千ある場合は手作業では対応できません。こんな場合は、Acrobatなどで複数のpdfファイルを一つのpdfファイルに結合してからtextファイルに変換するという方法もありますが、そんなめんどうくさいことをしなくてもpdftotextという無料ソフトを使えば一括で複数のpdfファイルをそれぞれ別のテキストファイルに変換でますので、やってみましょう。

まずpopplerというpdfを扱うプログラミングライブラリ(その中にpdftotextが入っています)をお使いのWindows, Mac, linux用のものを選んでダウンロードしてインストールします。linuxではsudoコマンドでpopplerをダウンロードしてインストールできますし、Mac版もアプリストアからダウンロードできるはずです。私が使っているWindows 10やWindows 7のPCの場合については、ここに詳しいインストールの仕方が書いた記事がでているのを見つけました。大変丁寧に書いてありますのでそのよく読んでインストールしてください。私もこの記事のとおりにインストールして利用しています。

私はCドライブ直下にpoppler-0.68.0というフォルダ(ダウンロードしたPopplerの圧縮ファイルを解凍(解凍ソフトは註1をみてください)してできるフォルダ名のままコピーしただけです)を作り、その直下にあるbinフォルダ(binaryフォルダの意味で、実行ファイルが入っているフォルダのことです)に自分の必要なpdfファイルを集めてテキストファイルに変換しています。shareフォルダの下にはpopplerとrenameしたデータファイル(上述のホームページにあるリンク
https://poppler.freedesktop.org/poppler-data-0.4.9.tar.gz からダウンロードしたpoppler-data-0.4.9.tar.gzファイルを解凍したもの。註1参照)をおいてください。あとは以下のコマンドを記述したバッチファイルをテキストファイルエディタで作ることが必要です。

for %%i in (*.pdf) do (pdftotext %%i %%i.txt)

このコマンドをテキストファイルエディタにうちこみ、できたファイルに適当な名前(pdf2txt.batとかすきな名前)をつけて保存します。保存のときデフォルトではテキストファイルで保存されれウため、pdf2txt.txtになりますのでファイル名の変更でpdf2txt.batにするか、保存時に.batで保存してください。保存場所はpdftotextのあるフォルダ(上の例ではbinフォルダ)にします。

あとは、変換したいpdfファイルを上のbinフォルダにコピーして、コマンドプロンプトでpdf2txt.batファイルを実行するだけです。日本語のファイルも英語のファイルもともにテキストファイルに変換されます。(invalid font weightというエラーが出るかもしれませんが無視してよいようです。不都合があったら教えてください。)

以下はコマンドプロンプトが初めての人むけの簡単な説明です(註2参照)。

バッチファイルというのはwindowsのコマンドプロンプト(windows7では「すべてのプログラム」の部分をみていくと、アクセサリフォルダの下にあります。windows10では下の図の左端の写真ようにシステムツールの下にあります。)でファイル名を入力してエンターを押すと、ファイル内に書いてあるコマンドを逐次実行するというものです。

矢印のコマンドプロンプトをクリックして起動するとき右クリックで、管理者として実行を選んで起動しておくと管理者としてログインしていないときにおこるトラブルをさけられますので注意してください。

今回のバッチファイルは以下のような内容で動きました。

for %%i in (*.pdf) do (pdftotext %%i %%i.txt)

意味は、iという変数にpdfのファイル名をいれ、それにpdftotextコマンドを実行してpdfのファイル名(%%i)のついたテキストファイル(%%i,txt)を作るという操作をフォルダ内にあるすべてのpdfファイル(*.pdfというワイルドカード*を使っている部分で、任意のファイル名のpdfファイルを表しています) がなくなるまで一個ずつ繰り返す(for    doの部分)というものです。

コマンドプロンプトを上に説明したように起動すると、黒いバックに白い字の画面が開きます(上の真ん中の図)
自分の今いるディレクトリ(フォルダ)の名前が表示されています。これから目的のpopplerのフォルダを探すとき、たとえばCドライブの直下にpopplerのフォルダがあるなら、コマンドプロンプトでcd ..(cdとうって、ピリオドを二回うちます)というコマンド(これはディレクトリを上に登って行くコマンドです)を何回かうってディレクトリをC:¥>にします。上の図の右端の図。
dirとうつとディレクトリやファイルの一覧が表示されます。
popplerのフォルダへ移りたいのでcd poppくらいまでをタイプしてあとはタブキーを押してください。タブの自動補完機能でcd poppler-0.68.0と自動入力されます。(このタブ補完の機能はlinuxで重宝するのですがWindowsのコマンドプロンプトでも利用できますので活用してください。) enterキーを押すとC:¥poppler-0.68.0>と表示されてディレクトリを移動したのがわかります。ここでdirとうってenterを押すとディレクトリ内のファイルとフォルダが表示されます。プログラムファイルのあるbinのフォルダ(ディレクトリ)があるのを確認してください。cd binとうってenterを押すとbinのディレクトリに移動します。C:¥poppler-0.68.0\binとなっていたら成功です(上の右端の図)。再びdirとうってenterをおします。これでこのbinフォルダ内にあるすべてのファイルとフォルダが表示されます。あとはそこにコピーしてあるバッチファイルpdf2txt.batを実行する(コマンドラインにpdf2txtとうってenterを押す)と、自動的にファイル名のついたtxtファイルができあがります。

こうして一括でpdfファイルをテキストファイルに変換したら、あとはこれらのテキストファイルをAntConcに読み込んでコーパスとして論文を書くときに参照すればいいわけです。

もちろんテキストファイルですから、テキストファイルを一括検索して、検索結果にタグジャンプして参照できるgrepコマンドも使えます。適当な、grepコマンドが使えるエディタ(たとえば有料ですが秀逸なエディタでおすすめの秀丸エディタ)でpdfの内容を串刺し検索するのもよいですね。pdfgrepというソフトもあって、これを使えばpdfファイルのままでgrepができるそうです。これはまだ使っていません。windows版をダウンロードしてさきほどのbinファイルにコピーしておけば、コマンドプロンプトで使えるのですが、linux版とちがって検索語がハイライトしなかったりしてまだ使いこなせていません。興味のある方は使ってみてください。

註1:圧縮ファイルの解凍には私は7-zipを使っています。たいていの圧縮解凍はこれでできます。
註2:パスの通し方とかは説明しないでpdftotextを使う方法を説明していますので、良く知っている方はパスを通して適当な場所にpdftotextをおいて使ってください。

テキストデータをどんどん蓄積していくソフトの紹介―その2 TextClipperの紹介です。

HeartyLadder (ハーティー・ラダー)というソフトをご存知ですか?このソフトのサイトにある文章をそのまま引用させてもらいます。
だれでもみんな人に伝えたい「こころ」があります。
笑みで、言葉で、手紙で、そしてE-mailで・・・・

本ソフトウエアは手などが不自由なため、キーボードやマウスでの入力が出来ない方のために 開発した文章入力用のソフトウエアです。
 ハーティーラダーは、文章の作成やメール、そしてWindows操作を支援するソフトウェアです。キーボードやマウスが使えなくても、漢字交じりの文章を書けて  E-mailのやりとりができます。またホームページを見たり、ワードやエクセルなど一般のアプリケーションの操作もできます。  このソフトを使ってラブレターも書いてもらえたら素敵だなぁと思いながら、  私たちも心を込めて作っています。また、2011年に公開したマイボイスというソフトを使うことで、自分の声での読み上げができるようになっています。 このHeartyLadderがあなたの『心の架け橋(HeartyLadder)』になればうれしいです。

Xoops(註1参照)でつくられているHeartyLadder のサイト ハーティー・ラダー・サポーターのぺ―ジhttp://heartyladder.net/xoops/をみるとこれが、物凄いソフトだということがわかります。このソフトの開発改良が多くの方々の参画を得て、日々 着実に進んでいるのを拝見して頭がさがりました。たとえば以下をご覧ください。
http://heartyladder.net/xoops/modules/whatsnew/
ハーティー・ラダーの開発者は吉村隆樹さん。以下に紹介するTextClipperの開発者でもあります。吉村さんについてはご自身の本、パソコンがかなえてくれた夢 (高文研)や、吉村さんのホームページ まなつのみかんにある、ブログをご覧ください。なおこのまなつのみかんのHeartyLadderの記述は古いようなので、上にあるリンクをご覧ください。

HeartyLadderはキーボードやマウスが使えない方でもラブレターが書けるようにというコンセプトのソフトですが、どんどん改良を重ねておられて、今では視線入力装置と連携してALSの患者さんも使えるようになっているそうです。視線入力装置対応のHeartyLadderも無料で公開されています。昔は150万円くらいした視線入力装置が2014年に12000円くらいで入手できるようになったそうで、この視線入力装置を使うためのソフトHeartyAiと、このHeartyLadderと組み合わせるとよいとのことです。以下に説明のpdfがありますのでご覧ください。http://heartyladder.net//upload/takaki/hearty/HeartyAi.pdf
関連した新聞記事もリンクが切れるかもしれませんが、ご覧ください。
https://mainichi.jp/articles/20180331/k00/00m/020/106000c

さて、TextClipperです。これは以下のページにある吉村さんの説明を引用しますと、こんなソフトです。http://takaki.la.coocan.jp/freesoft/textclipper/

TextClipperについて
本プログラムはテキストのデータベースです。
某ユーザーさん曰く
  テキストのデータベースなんてかたぐるしく言わずに、「アイデアクリップ」とか
「アイデアメモ」なんて紹介するともっとユーザーが増えると思います。

と・・・・・
多くのテキストをツリー構造で管理します。
データーベースというと、データの入力が結構大変です。特にテキストのデータベースになると、テキストファイルを読み込んだり、ソフトを切り替えてコピー&ペーストを繰り返してと言うことになるでしょう。でもこのソフトではそういう作業は必要としません。
世はインターネットブーム。ネットサーフィンに興じている人も多いでしょう。
そこで得た情報はどうやって管理しておられるでしょうか。
この部分の文章はとっておきたいと思っても、すぐに簡単には保存できないと思います。
でもこのソフトを常駐させておくと、ネットスケープやインターネットエクスプローラで保存したい部分を反転して後はボタンを1つ押すだけです。
タイトルを付けたりする必要もいっさいありません。
プログラミングやネットサーフィンをしながら手間をかけることなく自然とデータベースにデータが蓄積されていく感じです。これより簡単な保存方法はないでしょう。
また、その逆のデータベース化したテキストを利用するときも、簡単に使用中のワープロやエディタ、通信ソフトにペーストできます。
本プログラムはいろんな場面で応用できると思います。」

私はこのソフトのクリップツールという機能拡張を主に使っています。ネットサーフインしていてこれはと思ったテキストをキーワードをつけて(つけなくてもいいです)、どんどん一つのテキストファイル(Tc_txt.txtという名前のテキストファイルです)に保存していくことができます。新しくクリップしたテキストはこのテキストファイルの最後尾にクリップした日時、簡単な出典表記、自分でつけたキーワード(なしでもOKです)とともに追記されていきます。こうしてテキストデータベースを構築しておけば、あれはなんだったっけと思いだせないときにも、保存したテキストファイルをgrepソフトなどで検索したら一発で該当テキストをみつけられます。キーワードを保存時に追加しておけばなおさら検索は容易になります。保存には自分で保存用キーを設定することもできます。私はたとえばshift+Cにして保存しています(12月1日追記:すみませんshift+Cでは大文字のCを入れる時にクリップツールが起動してしまいだめです。alt+Cとか、shiftのダブルクリック+Cとかにしてください。)が、キーコンビネーションは環境設定メニューの、キー割当から設定できます。

クリップボードに入ったテキストファイルが保存されますので、TextClipperを常駐させておけば、Microsoft Wordやpdfリーダー(Acrobatなど)、ブラウザで表示したテキストなど任意のソース中のテキストファイルを保存することができます。一つの決まったファイルにクリップするごとに付け足されていきますので、このクリップをどんどんつづけていけば、結構充実したテキストデータベースができます。このクリップツールは以前、吉村さんにお願いして作ってもらったものですが、大変便利です。
これはTextClipperのページにあるクリップツールのなかの、作者のところに木谷さん 野村さんとあるものをダウンロードして解凍してできたファイルclipfile.ctaを、TextClipperフォルダに入れると使えるようになります。私はこんなツールがあったら良いなぁとうお願いをしただけです。プログラムは木谷さんと吉村さんです。

私の去年のランチョンセミナーで、論文の例文集をつくっておいて、それをコンコーダンスソフトで検索して、英文執筆に役立てると言う話をしました。その例文集の作成にもピッタリのソフトですので、お試しください。その際、改行の処理とかが必要になるかもしれませんが、いろいろ工夫してみてください。とても便利なソフトですよ。

(12月2日追記:clipfileの使い方についてさらに詳しく説明しましたのでここを次にご覧ください。)

(註1:Xoopsはこのブログで使っているWordPressのような、コンテントマネジメントシステムCMSというもので、研究室の内部ホームページで必要な資料を共有する、連絡をするなどに活用していたこともあります。いろんなレンタルサーバーで使えるので活用するのもいいかもしれません。私達は、MicrosoftのOneNoteに変えてしまったので今は使っていません。OneNoteで各人の実験結果を毎日報告してもらい、進捗状況を把握しコメントする、通勤電車の中で各メンバーの進捗状況を確認してコメントする、情報を共有する、などの使い方をしていましたが、これは役立ちました。OneNoteは絶対おすすめのソフトです)

画面、動画、テキストなどデータをクリップするソフトの紹介―その1

今日は私が使っているいくつかのソフトを紹介します。まず画面の静止画像をキャプチャするソフトです。これはWinShotを使っています。昔からあるソフトですが私のwindows10環境、windows7環境で作動しています。(残念ながらwindows10ではヘルプはでません)。起動して範囲を指定してスクリーンキャプチャするには、デフォルトではAlt+PrintScreenを押します。範囲指定の十字が出てきますので、マウスを左クリックしてドラッグして範囲を決定してクリックするとクリップボードに範囲の画面がjpgで保存されます。もちろんビットマップ保存、jpeg保存などを、アクティブウインドウ、デスクトップ、台形範囲指定、などで保存できます。保存先のフォルダの指定ももちろんできます。このソフトは教材のスライドに資料として使いたい画像を挿入するのに使っていました。

一方、論文セミナーのスライド作りでは、論文のpdfを表示させておき、pdf表示ソフトの画像キャプチャ機能’(Adobe Acrobat Professionalならスナップショットツール)を利用して必要な図や表をクリップボードにコピーして、パワーポイントファイルにペーストします。図をコピーするときにはpdfの拡大表示(ズームインの拡大率)機能を活用して、表示倍率を100%ではなく300% 以上くらいにした上で、キャプチャしたい範囲を指定してキャプチャするのがいいです。100%でやると、できた画像はスクリーンに投影すると解像度が悪くてぎざぎざが目立って使い物になりません。パワーポイントで投影したときに図の画質が十分になるためには、pdfの表示倍率を高くしてキャプチャすると覚えておいてください。

話がそれましたが、上で紹介したソフトWinShotには、さらに定期実行キャプチャというのもあって、指定した秒の間隔で、デスクトップやアクティブウインドウ、指定した台形範囲などを定期的にキャプチャして一か所のフォルダにビットマップかjpegで保存してくれるモード(ファイルに自動ナンバリングもできる)もあります。これも重宝しています。定期的にキャプチャした画像をまとめてpdfにしたりするのも簡単にできますから、この機能の応用範囲は広いです。

あと、画面上で再生されている動画やカーソルの動きなどを動画で記録するためのソフトとしては、OBS Studioとかいうソフトが有名なようです。一度ダウンロードして使ってみようと思いますので次回に報告します。また次回にはクリップボードにコピーしたテキストファイルをどんどん集めていくソフトの紹介もしますのでお楽しみに。

写真は散歩コースの途中でみかけた萩の花です。秋も深まってきました。

 

プレプリントサーバーとその活用法の紹介4―最新情報の追加です

このブログではプレプリントサーバーの活用について紹介してきました。いつも多数のアクセスありがとうございます。写真は近所でみかけたくずの花です。秋も深まってきました。

何度もNIHのVideoCastを紹介していますが、数日前に米国のポスドクの現状とポスドクとしての能力、存在感をアピールするのにプレプリントを発表することが薦められるという講演があったので紹介しておきます。Jessica PolkaさんのNIHでの講演で、米国のポスドクの現状、最初のfirst author(筆頭著者)の論文を発表するのに要する期間が、これまでになく長くなっており、論文が少ないので研究費を獲得したり、次の職を得るのに困難を覚えるポスドクが増えているのに対する対策、そして査読する能力をどのように向上させるかなどを扱っている、興味深い講演でした。
講演のスライドはここをクリックするとダウンロードできます。Google documentに保存してあるのでFirefoxではうまくいかないので、Google のブラウザChromeかInternetExplorerでアクセスしてください。青字で閲覧のみとか書いてありますが、スライドはダウンロードできます(開いたページの「ファイル」をクリックして開き、「形式を指定してダウンロード」を選んで、Powerpointやpdfなど好きな形式でダウンロードしてください。講演は高画質でダウンロードできますので、たとえば1240kの高画質でダウンロードして、適当なメディアプレーヤーでみればゆっくり講演を聴講できますのでお試しください。ハイビジョンの高画質のムービーでもみられるメディアプレイヤーとして、私はMPC-BEというフリーソフトを使っています。

JessicaさんはASAPbio(エイサプバイオ)という組織―ASAPbio (Accelerating Science and Publication in biology) is a scientist-driven initiative to promote innovation and transparency in life sciences communication. We are a 501(c)3 nonprofit incorporated in the state of California―に属していてプレプリントの利用を推奨するとともに、ポスドクのキャリアパスについても研究している方です。

講演にもありますが、論文に要求されるデータ量が激増していいます。それで昔は4年の大学院(米国の例)の場合、平均3-4年で筆頭著者の論文first author paperがでたが今では平均4-5年と論文の出版が遅れるようになっているようです。これは論文として出版されるために必要な実験量が昔の倍以上になっていることも原因であり、以下の論文で具体的に実証されています。論文中の実験量は図のパネルの数―つまりFig. 1A, Fig. 1B,. Fig. 1Cなどどある場合のA,B,Cなどの数―を数えてそれにTableの数などを加えて算出してます(註1)。下の論文やこのビデオをみてもらうとデータがありますのでご覧ください。実験量が増えたことで、論文として完成するのに時間がかかり、ポスドクや院生が論文をだすのが遅くなってしまうわけです。これは日本で多い5年プロジェクトなどでも経験しますが、ポスドクや院生や研究者にとって深刻な問題です。それをどうして救うかというのがこの講演の内容です。プレプリントを活用できるというのがこの講演の一つのメッセージです。(註1:私見ですが、さらにグラフの場合、統計処理するためサンプルのサイズN=30とかになることがよくありますので、一つのパネルといってもそこには本当に多数の実験が繰り返されている場合があり、これをカウントするともっと実験量が増えると思います)。

Accelerating scientific publication in biology
Ronald D. Vale

プレプリントのメリットは、いろいろあります。
メリットその1) 去年あたりから、グラントの申請や業績報告書にプレプリントを掲載することができる組織が激増しています。つまり就職活動や研究報告、新しい研究費の申請のときに、業績としてプレプリントが使えるようになっているわけです。
日本の方に関係あるところでは
Human Frontiers Science Program (December 12, 2016)でもプレプリントが利用できます。“The Board of Trustees of the International Human Frontier Science Program Organization (HFSPO) has decided that for competitions starting in calendar year 2017, applicants may list preprint articles in the publication section of HFSP proposals. Current HFSP awardees are also permitted to cite publications which are deposited in freely available preprint repositories in interim and final reports to the Organization.”

といった具合です。Wellcome Trust , MRCやNIH, HMMIなど大手のグラント母体もそういう方針になっています。これもASAPbioのページにリストがあります。

プレプリントについては以下のページ(ここをクリック)がまとまっています。またpreprintについて投稿してみた人の経験がこのリンクに動画と画像で紹介されています。

プレプリントサーバーは以前にも紹介しましたが、最新のプレプリントサーバーのリストがありますのでご覧ください。Research Preprints:ServerListというページです。

ここにリンクがあります。

メリットその2) プレプリントを公開すると学会の講演のように、研究者の存在感を示すことができます。

メリットその3) フィートバックがくるので論文を改善できます。bioRxivの場合は10%ほどにコメントがつくようです。他の人にコメントをみられたくないという人も多くて、そんな人は著者にemailしてきたり、twitterやFacebookなどのSNSでコメントをくれるようです。プレプリントサーバーのコメントは公開前にチェックが入っているので炎上とかなないようです。

メリットその4) 雑誌の編集者はプレプリントをみていますので、プレプリントをみてうちの雑誌に投稿してくださいといってくることinvitationも結構あるそうです。(PLos GeneticsやProc. Royal Society Bなど)

メリットその5) 研究の早い段階でプレプリントをみて連絡してくる共同研究者が見かる例も多いそうです。

メリットその6) いつどんな研究をしたかを、公開のプレプリントサーバーに記録としてのこせる(doiもプレプリントに付与されますし、プレプリントの引用を許している雑誌も増えています)上に、バージョン管理もできる。

メリットその7) 就職や研究費(グラント)申請の時、研究者としての生産性を示すことができる。これは上にも述べました。今までは論文を投稿してからアクセプトされるまでは業績や研究成果に載せられないことが多かったのですが、プレプリントを業績として認める組織が増えているので大きなメリットです。

メリットその7) そしてなによりも発見を加速させることができるのが最大のメリットでしょう。

では不安点はというと:
I’m going to get scooped!というのが最大の不安なのではないでしょうか。しかしこれは簡単にはやれないと思われます。論文の内容をプレプリントでみて、それをもとにもっとよい論文を書くというのですが、これをやるのはほぼ不可能だと思います。アイデアとか実験とかはプレプリントに書かれており、投稿日もバージョンも公開されているので剽窃は困難です。アイデアや方法、結果のクレジットを早々ととって、研究成果を共有するメリットのほうがいまや大きくなってきているようです。物理とかコンピュータサイエンスの分野でのプレプリントの経験から、scoopするのが困難でリスクをともなうことは明らかなことだと思います。その他の考える不安点も講演で議論されていますのでご覧ください。

どの雑誌がプレプリントへの投稿前の掲載を許可しているかは、ここをごらんください。

またプレプリントの雑誌会というのもネット上にいろいろあるのでその紹介やレフリーのコメントなどを公開する動きが加速しているという話も講演にあります。

夏休みおすすめソフト(3)RstudioにR commanderとそのプラグインEZRを入れてみよう―EZRインストールのトラブルシューティング

前回はRとRstudioの紹介をしました。続いてRstudio上からRのプラグインであるR commanderと、RコマンダーのプラグインであるEZRをインストールする方法を紹介しようと、最新版のRを使って紹介記事を書いていたのですが何故かEZRのインストールがうまくいきませんでした。Rcmdr(R コマンダー)をRstudioからインストールしたあと、EZRをRstudioからインストールする時うまくいきませんでした。解決したのでうまくいったRコマンダーとEZRをインストール法を紹介しておきます。

前回紹介した方法でRをインストールし、次にRstudioをインストールします。
次にRstudioを起動してRcmdrをインストールします。やり方は、

Rコマンダーのインストール:
右下のpane(パネルのようなもの)からpackagesタブを選びます。boot, class, clusterなどのsystem libraryのパッケージがすでに存在するのがわかります。アルファベット順にならんでいるのでずっとリストをみていってもR commanderなどのパッケージ(Rcmdrなど)はありません。これをインストールするのが今回の作業です。 右下パネルのInstallタブをクリックします。すると新しいウインドウが開いてpackagesという部分にカーソルが点滅していますので、そこにrcmdrといれてみましょう。ポップアップがでてきてRcmdr以下、RcmdrMiscとかRcmdrPlugin.aRnovaなどがずらーっと一覧ででてきます。下ののほうにRcmrPlugin.EZRもありますね。まずRcmdrを選択します。install depencenciesのチェックがはいっているので、そのままにします。そしてInstallボタンを押します。すると左下のコンソールpaneにいろいろいろ赤字で表示がはじまり、packagesを次々と解凍してインストールしているのがわかります。結構な時間がかかると思いますが終わるまで気長に待ちましょう。赤字でいろいろ経過が表示され、その後、カーソルが点滅してすすまなくなったように見えますが、5分も放置しておくと次にすすむようでパッケージの解凍などに時間がかかるようです。コンソールパネルにThe downloaded binary packages are in どこそこ、というパッケージの保存場所の表示がでたら終わりです。終わると右下のPane{パネル)に前にはなかった様々なパッケージがあるのがわかります。パッケージの表示パネルにRcmdrとRcmdrMiscが表示されているのを確認してください。

次に、library(Rcmdr)とコンソールにうちこんでR commanderを起動。see ?effectsTheme for details.という赤字のメッセージでRstudioのコンソール画面は止まるので、Rstudioのウインドウを最小化して画面をみると、「Rcmdrが利用する次のパッケージがありません」というメッセージのでているポップアップウインドウがあり、「これらのパッケージをインストールしますか?」ときいてくるので、はいをクリック。すると、「ないパッケージをインストールする」という画面がでるので、CRANの指定でOKを押します。

Rstudioにもどって見ていると、つぎつぎと赤字でインストールがすすみます。そしてインストールが成功すると>の印がコンソールにでますので、インストール終了です。

コンソールにlibrary(Rcmdr) とうちこんでエンターを押すと、Rコマンダーのポップアップウインドウが自動で開きます(日本語です)。

EZRのインストール:
上の図のR コマンダーのメニューのツール(ヘルプの左)をクリックして、Rcmdrプラグインのロードをクリックします。(ここが大事なのですが、この段階で、Rstudioの右下のPackageのパネルでRcmdrPlugin.EZRにチェックが入っていないことを確認してください。つまりRにロードされていませんので注意してください。私は最初、Rcmdr, RcmdrPlugin.EZRの順にRstudioの右下パネルでチェックをいれて、Rコマンダーを立ちあげていました。そうするとEZRがこのプラグインのロードに表示されない=RコマンダーからEZRが使えないという不具合が起こります。必ずPackageのパネルでEZR pluginにチェックが入っていないことを確認してください。上の図のようにプラグインにEZRが選択されて表示されているので、OKをクリックします。するとRコマンダーを再起動しないとプラグインを利用できません、再起動しますか?(下図)ときいてくるので「はい」をクリックします。

再起動するとEZRの画面がでます(下図)。Rstudioとは別のウインドウに表示されるので注意してください。

メニューの一番右に「標準メニュー」というのがでていたら成功です。ここに本来のRコマンダーのメニューがあつまっていて、Rコマンダープラスアルファの機能がその他のメニューから使えます。解析結果のグラフなどはRstudioのplotパネルではなく独自のポップアップパネルにでてきます。

Rstudioにもどってみると、右下のパネルのPackageのところのRcmdrPlugin.EZRにチェックが入りました。

EZRを閉じるときには、Rコマンダーのメニューから閉じて、その後、Rstudioを閉じてください。

以上です。

その他のRstudioについての注意:
1)RstudioではLinuxとおなじようにTab補完機能が使えます。たとえばコンソールでlibrary(Rとうちこんでtabキーを押すと、RcmdrとかRcmdrPlugin.EZRとかの候補がポップアップしますので、適当なのを選んでエンターをおせば入力の手間がはぶけます。これは便利な機能です。

2)あとR commanderが起動している状態でRstudioを終了するときの注意。Rstudioでquitコマンドをいれても永遠に終わらないので困ります。これは、R commanderの終了画面でOKをおさないとR コマンダーが終了できないためです。RstudioのquitコマンドではRコマンダーはquitできず、quitting sessionsが永遠に続くのです。

3)インストールしたパッケージは、ドキュメントのフォルダにあります(windows7以上の場合)。まっさらにRをしたいときは、Rをアンインストールした後、このドキュメントフォルダ内の、Rフォルダを削除しないとパッケージは残ります。

4)Rstudioでは4つのpaneが表示されるといろんなところに書いてあります。でも一番左上のソースエディタが表示されていない人が多いのではないでしょうか。これを表示させるには、ToolsからGlobal Options、Pane LayoutとすすみEnvironment, History, connections, presentationsと並んである画面にあるViewerのチェックをいれると表示されるようになります。もう一つよくあるのは、ソースエディタが隠れていて見当たらないケースです。この場合は、sourceと書いてあるのでわかります。その部分をマウスでドラッグして拡げればソースエディタが見えるようになります。