テキストデータをどんどん蓄積していくソフトの紹介―その2 TextClipperの紹介です。

HeartyLadder (ハーティー・ラダー)というソフトをご存知ですか?このソフトのサイトにある文章をそのまま引用させてもらいます。
だれでもみんな人に伝えたい「こころ」があります。
笑みで、言葉で、手紙で、そしてE-mailで・・・・

本ソフトウエアは手などが不自由なため、キーボードやマウスでの入力が出来ない方のために 開発した文章入力用のソフトウエアです。
 ハーティーラダーは、文章の作成やメール、そしてWindows操作を支援するソフトウェアです。キーボードやマウスが使えなくても、漢字交じりの文章を書けて  E-mailのやりとりができます。またホームページを見たり、ワードやエクセルなど一般のアプリケーションの操作もできます。  このソフトを使ってラブレターも書いてもらえたら素敵だなぁと思いながら、  私たちも心を込めて作っています。また、2011年に公開したマイボイスというソフトを使うことで、自分の声での読み上げができるようになっています。 このHeartyLadderがあなたの『心の架け橋(HeartyLadder)』になればうれしいです。

Xoops(註1参照)でつくられているHeartyLadder のサイト ハーティー・ラダー・サポーターのぺ―ジhttp://heartyladder.net/xoops/をみるとこれが、物凄いソフトだということがわかります。です。このソフトの開発改良が多くの方々の参画を得て、日々 着実に進んでいるのを拝見して頭がさがりました。たとえば以下をご覧ください。
http://heartyladder.net/xoops/modules/whatsnew/
ハーティー・ラダーの開発者は吉村隆樹さん。以下に紹介するTextClipperの開発者でもあります。吉村さんについてはご自身の本、パソコンがかなえてくれた夢 (高文研)や、吉村さんのホームページ まなつのみかんにある、ブログをご覧ください。なおこのまなつのみかんのHeartyLadderの記述は古いようなので、上にあるリンクをご覧ください。

HeartyLadderはキーボードやマウスが使えない方でもラブレターが書けるようにというコンセプトのソフトですが、どんどん改良を重ねておられて、今では視線入力装置と連携してALSの患者さんも使えるようになっているそうです。視線入力装置対応のHeartyLadderも無料で公開されています。昔は150万円くらいした視線入力装置が2014年に12000円くらいで入手できるようになったそうで、この視線入力装置を使うためのソフトHeartyAiと、このHeartyLadderと組み合わせるとよいとのことです。以下に説明のpdfがありますのでご覧ください。http://heartyladder.net//upload/takaki/hearty/HeartyAi.pdf
関連した新聞記事もリンクが切れるかもしれませんが、ご覧ください。
https://mainichi.jp/articles/20180331/k00/00m/020/106000c

さて、TextClipperです。これは以下のページにある吉村さんの説明を引用しますと、こんなソフトです。http://takaki.la.coocan.jp/freesoft/textclipper/

TextClipperについて
本プログラムはテキストのデータベースです。
某ユーザーさん曰く
  テキストのデータベースなんてかたぐるしく言わずに、「アイデアクリップ」とか
「アイデアメモ」なんて紹介するともっとユーザーが増えると思います。

と・・・・・
多くのテキストをツリー構造で管理します。
データーベースというと、データの入力が結構大変です。特にテキストのデータベースになると、テキストファイルを読み込んだり、ソフトを切り替えてコピー&ペーストを繰り返してと言うことになるでしょう。でもこのソフトではそういう作業は必要としません。
世はインターネットブーム。ネットサーフィンに興じている人も多いでしょう。
そこで得た情報はどうやって管理しておられるでしょうか。
この部分の文章はとっておきたいと思っても、すぐに簡単には保存できないと思います。
でもこのソフトを常駐させておくと、ネットスケープやインターネットエクスプローラで保存したい部分を反転して後はボタンを1つ押すだけです。
タイトルを付けたりする必要もいっさいありません。
プログラミングやネットサーフィンをしながら手間をかけることなく自然とデータベースにデータが蓄積されていく感じです。これより簡単な保存方法はないでしょう。
また、その逆のデータベース化したテキストを利用するときも、簡単に使用中のワープロやエディタ、通信ソフトにペーストできます。
本プログラムはいろんな場面で応用できると思います。」

私はこのソフトのクリップツールという機能拡張を主に使っています。ネットサーフインしていてこれはと思ったテキストをキーワードをつけて(つけなくてもいいです)、どんどん一つのテキストファイル(Tc_txt.txtという名前のテキストファイルです)に保存していくことができます。新しくクリップしたテキストはこのテキストファイルの最後尾にクリップした日時、簡単な出典表記、自分でつけたキーワード(なしでもOKです)とともに追記されていきます。こうしてテキストデータベースを構築しておけば、あれはなんだったっけと思いだせないときにも、保存したテキストファイルをgrepソフトなどで検索したら一発で該当テキストをみつけられます。キーワードを保存時に追加しておけばなおさら検索は容易になります。保存には自分で保存用キーを設定することもできます。私はたとえばshift+Cにして保存していますが、キーコンビネーションは環境設定メニューの、キー割当から設定できます。

クリップボードに入ったテキストファイルが保存されますので、TextClipperを常駐させておけば、Microsoft Wordやpdfリーダー(Acrobatなど)、ブラウザで表示したテキストなど任意のソース中のテキストファイルを保存することができます。一つの決まったファイルにクリップするごとに付け足されていきますので、このクリップをどんどんつづけていけば、結構充実したテキストデータベースができます。このクリップツールは以前、吉村さんにお願いして作ってもらったものですが、大変便利です。
これはTextClipperのページにあるクリップツールのなかの、作者のところに木谷さん 野村さんとあるものをダウンロードして解凍してできたファイルclipfile.ctaを、TextClipperフォルダに入れると使えるようになります。私はこんなツールがあったら良いなぁとうお願いをしただけです。プログラムは木谷さんと吉村さんです。

私の去年のランチョンセミナーで、論文の例文集をつくっておいて、それをコンコーダンスソフトで検索して、英文執筆に役立てると言う話をしました。その例文集の作成にもピッタリのソフトですので、お試しください。その際、改行の処理とかが必要になるかもしれませんが、いろいろ工夫してみてください。とても便利なソフトですよ。

(註1:Xoopsはこのブログで使っているWordPressのような、コンテントマネジメントシステムCMSというもので、研究室の内部ホームページで必要な資料を共有する、連絡をするなどに活用していたこともあります。いろんなレンタルサーバーで使えるので活用するのもいいかもしれません。私達は、MicrosoftのOneNoteに変えてしまったので今は使っていません。OneNoteで各人の実験結果を毎日報告してもらい、進捗状況を把握しコメントする、通勤電車の中で各メンバーの進捗状況を確認してコメントする、情報を共有する、などの使い方をしていましたが、これは役立ちました。OneNoteは絶対おすすめのソフトです)

画面、動画、テキストなどデータをクリップするソフトの紹介―その1

今日は私が使っているいくつかのソフトを紹介します。まず画面の静止画像をキャプチャするソフトです。これはWinShotを使っています。昔からあるソフトですが私のwindows10環境、windows7環境で作動しています。(残念ながらwindows10ではヘルプはでません)。起動して範囲を指定してスクリーンキャプチャするには、デフォルトではAlt+PrintScreenを押します。範囲指定の十字が出てきますので、マウスを左クリックしてドラッグして範囲を決定してクリックするとクリップボードに範囲の画面がjpgで保存されます。もちろんビットマップ保存、jpeg保存などを、アクティブウインドウ、デスクトップ、台形範囲指定、などで保存できます。保存先のフォルダの指定ももちろんできます。このソフトは教材のスライドに資料として使いたい画像を挿入するのに使っていました。

一方、論文セミナーのスライド作りでは、論文のpdfを表示させておき、pdf表示ソフトの画像キャプチャ機能’(Adobe Acrobat Professionalならスナップショットツール)を利用して必要な図や表をクリップボードにコピーして、パワーポイントファイルにペーストします。図をコピーするときにはpdfの拡大表示(ズームインの拡大率)機能を活用して、表示倍率を100%ではなく300% 以上くらいにした上で、キャプチャしたい範囲を指定してキャプチャするのがいいです。100%でやると、できた画像はスクリーンに投影すると解像度が悪くてぎざぎざが目立って使い物になりません。パワーポイントで投影したときに図の画質が十分になるためには、pdfの表示倍率を高くしてキャプチャすると覚えておいてください。

話がそれましたが、上で紹介したソフトWinShotには、さらに定期実行キャプチャというのもあって、指定した秒の間隔で、デスクトップやアクティブウインドウ、指定した台形範囲などを定期的にキャプチャして一か所のフォルダにビットマップかjpegで保存してくれるモード(ファイルに自動ナンバリングもできる)もあります。これも重宝しています。定期的にキャプチャした画像をまとめてpdfにしたりするのも簡単にできますから、この機能の応用範囲は広いです。

あと、画面上で再生されている動画やカーソルの動きなどを動画で記録するためのソフトとしては、OBS Studioとかいうソフトが有名なようです。一度ダウンロードして使ってみようと思いますので次回に報告します。また次回にはクリップボードにコピーしたテキストファイルをどんどん集めていくソフトの紹介もしますのでお楽しみに。

写真は散歩コースの途中でみかけた萩の花です。秋も深まってきました。

 

プレプリントサーバーとその活用法の紹介4―最新情報の追加です

このブログではプレプリントサーバーの活用について紹介してきました。いつも多数のアクセスありがとうございます。写真は近所でみかけたくずの花です。秋も深まってきました。

何度もNIHのVideoCastを紹介していますが、数日前に米国のポスドクの現状とポスドクとしての能力、存在感をアピールするのにプレプリントを発表することが薦められるという講演があったので紹介しておきます。Jessica PolkaさんのNIHでの講演で、米国のポスドクの現状、最初のfirst author(筆頭著者)の論文を発表するのに要する期間が、これまでになく長くなっており、論文が少ないので研究費を獲得したり、次の職を得るのに困難を覚えるポスドクが増えているのに対する対策、そして査読する能力をどのように向上させるかなどを扱っている、興味深い講演でした。
講演のスライドはここをクリックするとダウンロードできます。Google documentに保存してあるのでFirefoxではうまくいかないので、Google のブラウザChromeかInternetExplorerでアクセスしてください。青字で閲覧のみとか書いてありますが、スライドはダウンロードできます(開いたページの「ファイル」をクリックして開き、「形式を指定してダウンロード」を選んで、Powerpointやpdfなど好きな形式でダウンロードしてください。講演は高画質でダウンロードできますので、たとえば1240kの高画質でダウンロードして、適当なメディアプレーヤーでみればゆっくり講演を聴講できますのでお試しください。ハイビジョンの高画質のムービーでもみられるメディアプレイヤーとして、私はMPC-BEというフリーソフトを使っています。

JessicaさんはASAPbio(エイサプバイオ)という組織―ASAPbio (Accelerating Science and Publication in biology) is a scientist-driven initiative to promote innovation and transparency in life sciences communication. We are a 501(c)3 nonprofit incorporated in the state of California―に属していてプレプリントの利用を推奨するとともに、ポスドクのキャリアパスについても研究している方です。

講演にもありますが、論文に要求されるデータ量が激増していいます。それで昔は4年の大学院(米国の例)の場合、平均3-4年で筆頭著者の論文first author paperがでたが今では平均4-5年と論文の出版が遅れるようになっているようです。これは論文として出版されるために必要な実験量が昔の倍以上になっていることも原因であり、以下の論文で具体的に実証されています。論文中の実験量は図のパネルの数―つまりFig. 1A, Fig. 1B,. Fig. 1Cなどどある場合のA,B,Cなどの数―を数えてそれにTableの数などを加えて算出してます(註1)。下の論文やこのビデオをみてもらうとデータがありますのでご覧ください。実験量が増えたことで、論文として完成するのに時間がかかり、ポスドクや院生が論文をだすのが遅くなってしまうわけです。これは日本で多い5年プロジェクトなどでも経験しますが、ポスドクや院生や研究者にとって深刻な問題です。それをどうして救うかというのがこの講演の内容です。プレプリントを活用できるというのがこの講演の一つのメッセージです。(註1:私見ですが、さらにグラフの場合、統計処理するためサンプルのサイズN=30とかになることがよくありますので、一つのパネルといってもそこには本当に多数の実験が繰り返されている場合があり、これをカウントするともっと実験量が増えると思います)。

Accelerating scientific publication in biology
Ronald D. Vale

プレプリントのメリットは、いろいろあります。
メリットその1) 去年あたりから、グラントの申請や業績報告書にプレプリントを掲載することができる組織が激増しています。つまり就職活動や研究報告、新しい研究費の申請のときに、業績としてプレプリントが使えるようになっているわけです。
日本の方に関係あるところでは
Human Frontiers Science Program (December 12, 2016)でもプレプリントが利用できます。“The Board of Trustees of the International Human Frontier Science Program Organization (HFSPO) has decided that for competitions starting in calendar year 2017, applicants may list preprint articles in the publication section of HFSP proposals. Current HFSP awardees are also permitted to cite publications which are deposited in freely available preprint repositories in interim and final reports to the Organization.”

といった具合です。Wellcome Trust , MRCやNIH, HMMIなど大手のグラント母体もそういう方針になっています。これもASAPbioのページにリストがあります。

プレプリントについては以下のページ(ここをクリック)がまとまっています。またpreprintについて投稿してみた人の経験がこのリンクに動画と画像で紹介されています。

プレプリントサーバーは以前にも紹介しましたが、最新のプレプリントサーバーのリストがありますのでご覧ください。Research Preprints:ServerListというページです。

ここにリンクがあります。

メリットその2) プレプリントを公開すると学会の講演のように、研究者の存在感を示すことができます。

メリットその3) フィートバックがくるので論文を改善できます。bioRxivの場合は10%ほどにコメントがつくようです。他の人にコメントをみられたくないという人も多くて、そんな人は著者にemailしてきたり、twitterやFacebookなどのSNSでコメントをくれるようです。プレプリントサーバーのコメントは公開前にチェックが入っているので炎上とかなないようです。

メリットその4) 雑誌の編集者はプレプリントをみていますので、プレプリントをみてうちの雑誌に投稿してくださいといってくることinvitationも結構あるそうです。(PLos GeneticsやProc. Royal Society Bなど)

メリットその5) 研究の早い段階でプレプリントをみて連絡してくる共同研究者が見かる例も多いそうです。

メリットその6) いつどんな研究をしたかを、公開のプレプリントサーバーに記録としてのこせる(doiもプレプリントに付与されますし、プレプリントの引用を許している雑誌も増えています)上に、バージョン管理もできる。

メリットその7) 就職や研究費(グラント)申請の時、研究者としての生産性を示すことができる。これは上にも述べました。今までは論文を投稿してからアクセプトされるまでは業績や研究成果に載せられないことが多かったのですが、プレプリントを業績として認める組織が増えているので大きなメリットです。

メリットその7) そしてなによりも発見を加速させることができるのが最大のメリットでしょう。

では不安点はというと:
I’m going to get scooped!というのが最大の不安なのではないでしょうか。しかしこれは簡単にはやれないと思われます。論文の内容をプレプリントでみて、それをもとにもっとよい論文を書くというのですが、これをやるのはほぼ不可能だと思います。アイデアとか実験とかはプレプリントに書かれており、投稿日もバージョンも公開されているので剽窃は困難です。アイデアや方法、結果のクレジットを早々ととって、研究成果を共有するメリットのほうがいまや大きくなってきているようです。物理とかコンピュータサイエンスの分野でのプレプリントの経験から、scoopするのが困難でリスクをともなうことは明らかなことだと思います。その他の考える不安点も講演で議論されていますのでご覧ください。

どの雑誌がプレプリントへの投稿前の掲載を許可しているかは、ここをごらんください。

またプレプリントの雑誌会というのもネット上にいろいろあるのでその紹介やレフリーのコメントなどを公開する動きが加速しているという話も講演にあります。

夏休みおすすめソフト(3)RstudioにR commanderとそのプラグインEZRを入れてみよう―EZRインストールのトラブルシューティング

前回はRとRstudioの紹介をしました。続いてRstudio上からRのプラグインであるR commanderと、RコマンダーのプラグインであるEZRをインストールする方法を紹介しようと、最新版のRを使って紹介記事を書いていたのですが何故かEZRのインストールがうまくいきませんでした。Rcmdr(R コマンダー)をRstudioからインストールしたあと、EZRをRstudioからインストールする時うまくいきませんでした。解決したのでうまくいったRコマンダーとEZRをインストール法を紹介しておきます。

前回紹介した方法でRをインストールし、次にRstudioをインストールします。
次にRstudioを起動してRcmdrをインストールします。やり方は、

Rコマンダーのインストール:
右下のpane(パネルのようなもの)からpackagesタブを選びます。boot, class, clusterなどのsystem libraryのパッケージがすでに存在するのがわかります。アルファベット順にならんでいるのでずっとリストをみていってもR commanderなどのパッケージ(Rcmdrなど)はありません。これをインストールするのが今回の作業です。 右下パネルのInstallタブをクリックします。すると新しいウインドウが開いてpackagesという部分にカーソルが点滅していますので、そこにrcmdrといれてみましょう。ポップアップがでてきてRcmdr以下、RcmdrMiscとかRcmdrPlugin.aRnovaなどがずらーっと一覧ででてきます。下ののほうにRcmrPlugin.EZRもありますね。まずRcmdrを選択します。install depencenciesのチェックがはいっているので、そのままにします。そしてInstallボタンを押します。すると左下のコンソールpaneにいろいろいろ赤字で表示がはじまり、packagesを次々と解凍してインストールしているのがわかります。結構な時間がかかると思いますが終わるまで気長に待ちましょう。赤字でいろいろ経過が表示され、その後、カーソルが点滅してすすまなくなったように見えますが、5分も放置しておくと次にすすむようでパッケージの解凍などに時間がかかるようです。コンソールパネルにThe downloaded binary packages are in どこそこ、というパッケージの保存場所の表示がでたら終わりです。終わると右下のPane{パネル)に前にはなかった様々なパッケージがあるのがわかります。パッケージの表示パネルにRcmdrとRcmdrMiscが表示されているのを確認してください。

次に、library(Rcmdr)とコンソールにうちこんでR commanderを起動。see ?effectsTheme for details.という赤字のメッセージでRstudioのコンソール画面は止まるので、Rstudioのウインドウを最小化して画面をみると、「Rcmdrが利用する次のパッケージがありません」というメッセージのでているポップアップウインドウがあり、「これらのパッケージをインストールしますか?」ときいてくるので、はいをクリック。すると、「ないパッケージをインストールする」という画面がでるので、CRANの指定でOKを押します。

Rstudioにもどって見ていると、つぎつぎと赤字でインストールがすすみます。そしてインストールが成功すると>の印がコンソールにでますので、インストール終了です。

コンソールにlibrary(Rcmdr) とうちこんでエンターを押すと、Rコマンダーのポップアップウインドウが自動で開きます(日本語です)。

EZRのインストール:
上の図のR コマンダーのメニューのツール(ヘルプの左)をクリックして、Rcmdrプラグインのロードをクリックします。(ここが大事なのですが、この段階で、Rstudioの右下のPackageのパネルでRcmdrPlugin.EZRにチェックが入っていないことを確認してください。つまりRにロードされていませんので注意してください。私は最初、Rcmdr, RcmdrPlugin.EZRの順にRstudioの右下パネルでチェックをいれて、Rコマンダーを立ちあげていました。そうするとEZRがこのプラグインのロードに表示されない=RコマンダーからEZRが使えないという不具合が起こります。必ずPackageのパネルでEZR pluginにチェックが入っていないことを確認してください。上の図のようにプラグインにEZRが選択されて表示されているので、OKをクリックします。するとRコマンダーを再起動しないとプラグインを利用できません、再起動しますか?(下図)ときいてくるので「はい」をクリックします。

再起動するとEZRの画面がでます(下図)。Rstudioとは別のウインドウに表示されるので注意してください。

メニューの一番右に「標準メニュー」というのがでていたら成功です。ここに本来のRコマンダーのメニューがあつまっていて、Rコマンダープラスアルファの機能がその他のメニューから使えます。解析結果のグラフなどはRstudioのplotパネルではなく独自のポップアップパネルにでてきます。

Rstudioにもどってみると、右下のパネルのPackageのところのRcmdrPlugin.EZRにチェックが入りました。

EZRを閉じるときには、Rコマンダーのメニューから閉じて、その後、Rstudioを閉じてください。

以上です。

その他のRstudioについての注意:
1)RstudioではLinuxとおなじようにTab補完機能が使えます。たとえばコンソールでlibrary(Rとうちこんでtabキーを押すと、RcmdrとかRcmdrPlugin.EZRとかの候補がポップアップしますので、適当なのを選んでエンターをおせば入力の手間がはぶけます。これは便利な機能です。

2)あとR commanderが起動している状態でRstudioを終了するときの注意。Rstudioでquitコマンドをいれても永遠に終わらないので困ります。これは、R commanderの終了画面でOKをおさないとR コマンダーが終了できないためです。RstudioのquitコマンドではRコマンダーはquitできず、quitting sessionsが永遠に続くのです。

3)インストールしたパッケージは、ドキュメントのフォルダにあります(windows7以上の場合)。まっさらにRをしたいときは、Rをアンインストールした後、このドキュメントフォルダ内の、Rフォルダを削除しないとパッケージは残ります。

4)Rstudioでは4つのpaneが表示されるといろんなところに書いてあります。でも一番左上のソースエディタが表示されていない人が多いのではないでしょうか。これを表示させるには、ToolsからGlobal Options、Pane LayoutとすすみEnvironment, History, connections, presentationsと並んである画面にあるViewerのチェックをいれると表示されるようになります。もう一つよくあるのは、ソースエディタが隠れていて見当たらないケースです。この場合は、sourceと書いてあるのでわかります。その部分をマウスでドラッグして拡げればソースエディタが見えるようになります。

夏休みおすすめソフト(1):無料で最強の統計ソフト RやRStudioを使ってみよう!インストール法とパッケージがインストールできないとき。

夏休みのおすすめソフトを紹介します。統計学の重要性は「統計学が最強の学問である」(西内啓 著)という本をきっかけに、ビジネスの世界にも広く認識されたようです。この本で、はじめて一般化線形モデルという言葉がひろく紹介されたと思います。本屋にいってみるとR(アール)という統計ソフトの入門書や専門書がたくさんならんでいて、このソフト(無料で、統計解析では最強のソフトです)が広く使われていることがわかります。MacでもLinuxでもWindowsでも動くソフトで、有料の統計ソフトをしのぐソフトですので、ますますこれからも使われていくと思います。私も学生さんにRとPythonとLinuxを勉強しておくと将来絶対必要になるので早めに学ぶことをすすめていました。生物系では統計学は必須ですし、バイオインフォマティクスや次世代シークエンサーのデータ解析にもRは大活躍しています。今ではRのパッケージのR commanderや日本の神田善伸先生(自治医科大学)が開発されたEZR(これも大評判になってRのパッケージになりました)がありますので、グラフィカルインターフェースでRを使うことができて、初心者にもやさしいソフトとなりました (これらはRをインストールしたあと、パッケージとして追加インストールして使います。EZRはR commanderの追加プラグインになっています。インストールするとどちらも日本語で使えます。EZRを中心に使いたい場合は開発者の神田先生のサイトからダウンロードして使うのもおすすめです)。また、RStudioというRの統合開発環境ソフトを使えば、Rをもっと便利にスムーズに利用することができるようになったので、Rはますます便利で使いやすくなっています。

Rをインストールするのは簡単で、まずCRANというサイトにいって、ダウンロードサイトから自分のコンピュータに応じたRのインストーラーをダウンロードします。Mac版、Linux版もありますし、Windowsの場合はここから、最新版のR 3.5.1をダウンロードして、インストールできます。
Download R 3.5.1 for Windows (62 megabytes, 32/64 bit)という部分をクリックしてダウンロードして、インストールしてください。インストールする場所はデフォルトでよいですが、空きの多いドライブにするのもよいでしょう。インストールが終わったら、とりあえず起動ができることを確認してください。

Rのインストールが無事終わったら、続いて、RStudioをインストールしましょう。ダウンロードページをひらいて、Rstudio Desktop Open Source LicenceのDownloadボタンを選んでダウンロードします。windows版、Mac版、ubuntuやfedra用のlinux版があります。自分のOSにあったものをダウンロードしますインストールは簡単ですぐ終わるので終わったらRstudioを起動してください。RStudioを使ってRを使い始めるのも良いと思います。
Rstudioの使い方については、統合TVのビデオ
あるいはそのYouTube版をみてください。

とてもわかりやすいです。
もっと新しいMac版のRStudioの使い方ビデオもあります。Windows版でもほとんど同じですのでこれも参考になります。

その他、RやRstudioの使い方については、YouTubeで検索するといろいろなサイトがでてきます。後日、いくつかサイトを紹介する予定です。(9月17日追記、RstudioにRコマンダーとEZRをインストールする方法については続きの記事→ここをご覧ください!)

さて、昨日からRでの統計解析をしようとパッケージのダウンロードをRStudioで行おうとしたのですが、うまくいきませんでした。以下はその解決法です。

症状エラーメッセージ(以下を参照)がでて、R やRStudioはちゃんと起動しているが、あらたにパッケージがインストールできない。RstudioからでもR本体(64ビット版でも32ビット版でも)からでも同じことでエラーがでてパッケージのインストールができない。Rのメニューの「パッケージ」から「CRANミラーサイトの設定」を選んでTokyoなどのミラーサイトを選ぶと、コンソールに以下のようなメッセージがでてパッケージがインストールできない。ネットにはつながっているようで、httpsでなくhttpのミラーを選べば、ちゃんとサイトに接続できて、パッケージをインストールできることがわかった。一台のパソコンだけでこの症状がでているので、たぶんネット関係の設定がおかしいのだろうとは思いましたが、原因は不明でした。以下がエラーメッセージです。
> chooseCRANmirror()
警告: failed to download mirrors file ( URL ‘https://cran.r-project.org/CRAN_mirrors.csv’ を開けません ); using local file ‘C:/PROGRA~1/R/R-3.5.1/doc/CRAN_mirrors.csv’
警告メッセージ:
download.file(url, destfile = f, quiet = TRUE) で:
InternetOpenUrl の失敗: ‘失効サーバーに接続できなかったか、最終応答を取得できませんで(以下略)

解決策を探す:
Google検索を、failed to download mirrors file ( URL ‘https://cran.r-project.org/CRAN_mirrors.csv’ でやってみると、たとえばここのペーに同じようなトラブルに見舞われた人が質問していて、それに対する解決策がでていた。症状もhttpならOKでhttpsではだめだというので同じ。R consoleからネットにつながるのも同じだが、どうやらproxy設定とかが問題らしい。Firefoxの設定をInternet Explorerに反映させれば解決すると書いてあるだけで、あと一歩、親切に書いてない。プロキシは使っていないし、ファイアウオールを切っても症状はかわらないし、もちろん Rをクリーンインストールしてもだめだったし…。ちょっと途方にくてしまいました。

解決策がみつかった:
気分を変えて、今度はエラーメッセージの後半
「InternetOpenUrl の失敗: ‘失効サーバーに接続できなかったか、最終応答を取得できませんで」を使って検索すると12057エラーというのが起こっていることがわかりました。その対策はここの記述によると「Internet Explorerで「ツール」→「インターネットオプション」→[詳細設定] タブ の中にあるセキュリティセクションにある- “サーバーの証明書失効を確認する” と “発行元証明書の取り消しを確認する” のチェックを外します。 Internet Explorer を再起動し、上記変更が反映されているか確認します。」(野村がわかりやすいように一部を追記改変) だそうで、このとおりすると解決しました。

上の二つのチェックボックスうち、最初の“サーバーの証明書失効を確認する” のチェックを外すだけでよさそうで、これでパッケージが無事インストールできるようになりました。また同様のことが起こった時の解決用のメモとして記事にしておきます。

写真は前と同じところで撮影したアメンボです。まだ元気に何匹も泳ぎ回っています。

プレプリントサーバーとその活用法の紹介―bioRxivの利用法3

プレプリントサーバーbioRxivの利用法の第3回です。前回紹介したように大学や大学院、そして研究室での論文ゼミでbioRxivを活用しているところが増えています。出版される前に論文を読めるというメリットの他に、その論文を査読(レフリーをする)することを体験できますし、その論文がその後どのように印刷出版されるかをたどっていくと、レフリーとのやりとりなども追跡できるので研究者の卵にもとても勉強になります。以下のサイトをみるととても役立つと思いますのでご覧ください。

まず一番のおすすめは、preLights A というサイトです。これはプレプリントのハイライトサービスで、雑誌Journal of Cell ScienceとかDevelopmentとかを出版しているThe Company of Biologistsがスポンサーになっているサービスです。生物関係のおすすめのプレプリントを教えてくれるサービスですので是非使ってください。今日みてみるとテントウムシの模様のできるメカニズムのゲノムからの解明などの研究がハイライトされています。ハイライトの一覧は、ここにハイライトされているプレプリントへのリンクがありますのでブックマークしてください。

biOverlay はプレプリントサーバーにある論文を、独自に(勝手に)選んで勝手に査読してその結果を公開しています。こういうのをoverlay journalというのだそうです。査読の仕方の勉強にもなりそうですね。ご覧ください。

Peer Community Inというのも面白いアイデアです。著者はプレプリントサーバに原稿をアップロードした後、こちらのサイトにも原稿を読んでもらうよう依頼します。こちらのサイトが原稿を独自に査読にまわすかどうか決めて、査読にまわされれば匿名のレフリーが査読します。査読がOKになったらこのサイトで推薦の辞つきで公開されるというわけです。これで著者が得心したら論文としてdoiもわりふられて業績になるという仕組みです。著者がちゃんとしたjournalに投稿するのも問題ありません(このへんの仕組みの図と詳しい説明がここにあります)。推薦の辞はプレプリントだけではなく、すでに公開されている論文についても書かれることがあるようです。
投稿できる分野は進化生物学、生態学、古生物学となっています。以下にリンクがあります。

 Peer Community in Evolutionary Biology, Peer Community in Ecology or Peer Community in Paleontology

写真は、散歩の途中で写真をとってくれと、せがんでいるように声をかけてきたスズメの子です。人を怖がらず、写真をとっている間ずっとポーズしていろんな方向をむいたりしてくれていました。数日前からヒグラシも鳴きはじめ季節が進んでいます。

 

 

プレプリントサーバーを利用した論文紹介ゼミのすすめ―bioRxivの利用法2

土曜日にサイトのテーマを携帯対応のものに変えました。携帯でアクセスする方は、携帯を横にしてみてもらうと見やすいと思います。

If you want to be one year behind, don’t read bioRxiv– Jeff Leek

今日は5月23日のプレプリントサーバーの紹介に続く記事です。上の言葉は生物統計学などで多くの論文を出しているJeff Leek先生の言葉だそうです。論文投稿前のプレプリントをプレプリントサーバーに投稿していろんな人に読んでもらい、同時に引用できるようなdoiも取得した上で改訂して適当な雑誌に投稿するという人が増えています。また大学や研究室の論文セミナーで、雑誌にでた論文を選ぶのではなく、プレプリントサーバーにアップロードされた論文を選んで紹介するという新しいスタイルの論文紹介ゼミも盛んになっているようです。雑誌に出る論文より一年以上早く最新の成果を把握できることも多いので、PubMed検索だけではなく、プレプリントサーバーの検索も習慣にすることをお奨めします。

論文紹介ゼミでは、プレプリントサーバーにアップロードされた論文を読んで紹介し、論文のレフリー(査読者)になったつもりで内容を批判し吟味します。皆で検討した結果を著者にメールなどで連絡して原稿の改善に役立ててもらうというわけです。
こうしたプレプリントのゼミをやると、研究生活の早い時期に論文のレフリーの役割を学べます。著者への連絡がとても役立ったということで、論文を雑誌に投稿するときに謝辞に名前を書いてもらった学生もいるそうです。
今までレフリーになるのは、博士課程の学生で先生のお手伝いで協力するとか、査読を依頼されたときにレフリーの経験の多い先生に教えてもらうなどしかチャンスがなかったのですが、プレプリントサーバーで原稿が読めるようになったおかげで、学部学生や修士の学生でもレフリーの勉強ができるようになったわけです。米国ではプレプリントをつかったレフリーの練習も盛んになっているとのことです。皆さんも是非お試しください。これはpreprint reviewといいますが、これについてはこのリンクも参考になります。

線虫C. elegansの最近のプレプリントで面白そうなのにこんなのがあります。 配偶子幹細胞ニッチについてのKimbleラボの論文と、ノーベル賞をとったMelloさんのところのCRISPRを用いたゲノム編集の新手法の論文です。

C. elegans germ cells divide and differentiate along a folded epithelium

Hannah S Seidel, Tilmira A Smith, Jessica K Evans, Jarred Q Stamper, Thomas G Mast, Judith Kimble

最新の論文を探してみよう プレプリントサーバー bioRxivの利用法1

最新の論文を探すのには、PubMedやGoogle検索を使う方法が良く知られています。今回は、投稿前の論文、査読中の論文の探し方を紹介します。

論文を投稿する前に、完成した論文をプレプリントのかたちで公開サーバーにアップロードして皆に読んでもらい、プライオリティの取得もかねて意見を求めるというのは、昔から物理などで盛んな ならわしでした。現在では生命科学の論文用のプレプリントサーバーbioRxiv(バイオアーカイブと読みます)が盛んに利用されています。このサーバーを検索すれば最新の査読されていない またはここに公開と同時に査読中の論文を読むことができます。

bioRxivはCold Spring Harbor Laboratoryが維持しているプレプリントサーバーで、投稿すると内容をチェックした上で(非科学的な内容ではないか、テロに用いられるような危険な知識を提供するものではないか、剽窃した内容でないかなどのチェックです。査読してくれるわけではありません)翌日には公開されます。利用は無料です。

このサーバーはほとんどの著名な生命科学系の学術雑誌(ここに今日、ダウンロードした提携雑誌のリストがあります。投稿前に必ずこちらhttps://www.biorxiv.org/about-biorxivで確認してください。)と提携しており、bioRxivに いったん投稿しておけば、提携雑誌へ投稿する際は自動的にデータがその雑誌に移動できるようになっていて、投稿時にもう一回著者のリストを入れたりする手間はないのでおすすめのサービスです。投稿してしまえば引用可能になりますので、取り下げることはできません。利用法としては、査読のある雑誌への投稿と同時にこのサービスで投稿原稿を公開したり、bioRxivのサーバーで公開して皆にすぐ読んでもらった後で、査読のある雑誌に投稿することができます。またbioRxivに公開した後、コメントなどを参考に改訂してバージョンアップした後、投稿することも可能です。下の紹介動画をご覧ください。

私の良く知っている線虫の研究者、Josh Bembenekさんも盛んにこのサービスを利用しており、最近もこんな論文のプレプリントを公開しています。
https://www.biorxiv.org/content/early/2018/05/10/319657

線虫の細胞系譜にそって細胞質分裂の仕方が変化するという面白い内容です。

皆さんもbioRxivの検索画面で自分の好きなキーワードでいろいろ検索してプリプリントを探してみてください。最新の研究成果がいろいろ見つかると思います。

多くの雑誌ではプレプリントサーバーにアップロードして公開した論文は、投稿前のもの
prior to submissionとみなされます。中には投稿前にbioRxivでの公開を許さない雑誌もありますので、投稿前に十分調べてから投稿してください。Oxford Journal系の雑誌のように、公開プレプリントサーバーに公開しているものが投稿後にアクセプトされて掲載されるときには、すでに公開していたのだからといって、オープンアクセスの料金を払わねばならないところもありますので注意してください。各雑誌のポリシーは
https://en.wikipedia.org/wiki/List_of_academic_journals_by_preprint_policy
などにまとまっています。

他の分野でのプレプリントサーバーには、物理関係(経済分野も含む)のものや、は科学哲学関係のものなどもありますので、興味ある方は訪問してみてください。

ライフサイエンス辞書のコーパスを使った英語の書き方

ライフサイエンス辞書Life Science Dictionaryのサイトで、コーパス (corpus)を検索できます。先日紹介した広島大の河本健先生のページにある動画では、コーパス検索のデフォルトとしては、詳細検索を使うのがよいとのことでした。今回お伝えしたいのは、次の点です。

ひょっとしたらコーパス corpusの検索窓に、いつも一つの単語だけをいれていませんか?それはもったいないです!

コーパスの検索窓には、複数の単語の並びをいれることができます。たとえば、今論文を書いていて、 「GPIアンカー型タンパク質は、アーキアからヒトまで保存されいる」という英文が書きたいとします。アーキア(archaea)というのは古細菌ともいいます。
「アーキアからヒトまで保存されている」というのはどう書いたらいいでしょう?

まずライフサイエンス辞書のページのコーパスタブを開きます。でフルトの簡単検索画面がでますので、それにfrom archaeaといれてみましょう。

詳細検索をクリックして、表示数などを調整します。
最大1000 行表示にして、設定を記憶。冠詞や前置詞を文章内のリストに含めるなどにしています。
検索ボタンを押すと、from archaeaの部分の前後が表示されます。(表示されないときは、スペリングミスか、あるいは入力した句を含むコンコーダンスの例がみあたらないことを示します。たとえばfrom archeaとしてみてください。archeaでも正しいはずですが、用例がありません。)

上の図のコンコーダンスをみていくと、from archaea to humansという用例があるのがわかります。保存されているconservedという単語を使っている用例がないかなぁ、と詳しくみていくと(conservedという単語を画面で検索しただけですが)、ありました!
35番の文に古細菌からヒトまで保存されているという用例がでていました。

あとは、文の番号35をクリックすると、新しいタブが開いてこのように

PubMedの画面がでてきて要約Abstractの部分にある例文が容易にみつけられます(ブラウザ画面でhumansなどの単語で検索してハイライトさせてみました)。

これで目的の作文ができました。
こんな感じで、コーパスの検索窓にいろんな句を入力して用例を探すと、英文作成がずいぶんはかどりますので試してみてください。
コーパスはphrase 検索でつかわないともったいないです。

 

ライフサイエンス辞書のコーパス活用法の動画がでています

ライフサイエンスディクショナリーのページに、「ライフサイエンス辞書・英語共起表現の活用法(広島大学ライティングセンター・河本健」が紹介されていました。まだみていませんが、とても役立ちそうです。こちらには河本先生のコーパスについての解説もあります。

近所のキンランは、合計5株花が咲いています。すこし画質のいい写真をならべておきます。