野村一也 「科学を学ぶ人のために」 九大野村研ホームページの拡張版です
デスクトップでの操作の記録や、ビデオデータの記録方法―OBS studioの使い方
(2019/2/05に追記した部分は青字で表示してあります。参考にしてください。)
勉強や研究をしているとデータベースの使い方を説明する時にマウスカーソルの動きやクリックの様子などをビデオで記録して見せたいときがよくあります。また講演会などでストリーミング放送されているものなどを記録しておきたいこともあると思います。こんな時にはいろいろ有料のスクリーンレコーダーというジャンルのソフトウエアがあるのですが、インストールするときに使用許諾がいろいろ書いてあって、このソフト、信用できるのか?裏で妙なことをしていないのか?などと不透明な部分もあって、使用に不安を覚えます。前に名前だけ紹介しましたが、OBS studio というオープンソースの無料のソフト(Windows, Mac, Linux対応版があります)を使えば無料で使えて、わりに手軽に作業ができます。OBSはOpen Broadcaster Softwareの略です。
OBS Studio – Free and open source software for live streaming and screen recordingと題して、Githubにソースコードも公開されています。
ゲームの画面を録画してYouTubeなどにアップロードするために良く使われているソフトですが、十分高解像度で画面の動きなどを逐一記録できるソフトです。ゲームをやる人のための日本語の解説は多いのですが、あまりデスクトップやウインドウの録画についての日本語の解説がないみたいですので、簡単に紹介したいと思います。
OBS Studioのソフトのインストール:
https://obsproject.com/ja/download
からLinux, Mac, Windows版をダウンロードしてインストールします。私はwindows10 なのでWindows版の解説となりますが、他のOSでも大差ないはずです。
ページのウインドウズ、マック、リナックスのロゴをクリックすると右下にダウンロードインストーラが表示されるのでクリックしてダウンロードします。インストールするときにゲームの記録画面の配信モードにするか、単に録画だけにするかと聞いてきますので録画だけにするのがいいと思います。また管理者モードで実行するように設定できると思うので、そのように設定します。言語には日本語を選ぶといいでしょう。メニューなどすべて日本語になります。
ウインドウを録画してみよう:
インストールして起動すると下のギャラリーの一行目、一番左の図のような画面になります。(ギャラリーは、一番上の行の左から右へと図をみて、次は下の行にうつって左から右へとみてください。)中央の黒い枠の部分に表示されている中身が録画されます。この枠内にブラウザの画面とかデスクトップとかを表示し、録画したい部分をaltキーを押しながら枠の周りの囲み線をドラッグして選択します。選択がおわったら、shiftキーを押しながらドラッグして枠内にぴったりはいるようにしたら録画準備完了です。これから以下に詳しく説明します。(追記:2019/11/12― ウインドウの表示が「合わせ鏡のようになってしまった場合」もあるかもしれません。対策としてはwindows7では個人設定のテーマをAeroのものに変えてください。classicでは合わせ鏡のような表示になってしまってうまく録画できません。windows10ではそういうことはないようです。)
ウインドウ画面の録画をやってみましょう。まずFirefoxなどのブラウザの画面からキャプチャしてみましょう。Firefoxなどを先に起動してキャプチャしたい画面を表示しておいてください。
つぎにOBS studioを起動します。ウインドウキャプチャによる録画にはシーン、ソース、ミキサー、シーントランジション、コントロールとある下のほうの画面から、ソースの部分でプラスの記号をクリックします(ギャラリーの一行目左の図)。
するとウインドウキャプチャ、ゲームキャプチャなどがならぶプルダウンメニューがでますので(ギャラリー一行目真ん中の図)、ウインドウキャプチャを選んでみてください(一行目左から真ん中そして右の図)。ウインドウキャプチャのプロパティという画面がでて(二行目左の図)、カーソルをキャプチャするかどうかなどを設定できます。OKを押してとじてください(二行目真ん中の図)。Firefoxなどが起動していると、黒い画面の中にFirefoxのウインドウが表示されると思います。
黒い背景画面にうまく録画したい場面が全部がはいっていないと思います(二行目右の図)。黒い背景画面いっぱいの部分が録画されるので、録画する画面(クリックすると四隅と上下左右の各辺の中央に赤い丸印のある部分がハイライトされますのでその画面)を黒い画面いっぱいにあわせましょう。Firefoxの表示画面を選択する方法を例に紹介します。
表示されているFirefoxの画面をクリックして、画面の四隅と、左右、上下の辺の中央にある赤い丸を押します(二行目右から三行目左の図)。この赤丸の辺で囲まれた領域が現在録画されるようになっている範囲です。これを広げて全部が入るようにします。
Altボタンをおしながら赤丸がついている画面の赤丸をドラッグすると、記録したい画面を調節することができて、録画範囲を上下左右に広くしたり、狭くしたりして変更することができます。記録したい画面が決定できたら、altキーを離し、今度はshiftキーを押しながらドラッグして、選択した録画範囲の画面を後ろの黒い画面の隅に移動します(三行目左と真ん中の図)。大きすぎて黒い画面からはみだしていたら、右隅の赤丸を選択して、shiftキーを押しながらドラッグしてやると小さくできます。右隅の赤丸をクリックして、 shiftキーを押しながらドラッグして、一番大きな黒枠のなか(この部分が録画されます)にぴったり録画したい画面があてはまるように調節します(三行目右の図)。
あとは録画条件を次に説明するように設定し、録画ボタンをおすと録画開始です。録画開始と終了をたとえばウインドウズキーぷらすF12とかにきめることも設定でできますので、ボタンをおさずにキーコンビネーションで録画することも可能です。
OBS studioの録画条件の設定
配信をしないので以下では配信の設定は行いません。必要なら設定してみてください。
では録画条件の設定法を解説します。
一番簡単な録画条件の設定法を紹介します(2019年2月5日追記)
ファイル、編集、表示などと並んでいる項目メニューから、ツールを選びます。プルダウンメニューが開き、一番上に自動校正ウイザードというのがありますのでこれを選んでください。
デフォルトでは「配信のために最適化し、録画は二次的なものにする」にチェックがはいっています。チェックを外して「録画のために最適化し、配信はしない」にチェックを入れてください。次へをクリックすると、映像設定メニューがでてきて、基本(キャンバス)解像度―現在の値を使用というプルダウンメニュー、そしてFPS―60または30のいずれか、可能なら60を優先というメニューがでます、これらは変えてもいいですが普通はこのままで、次へを押します。するとテストがはじまって、プログラムがあなたのパソコンに最適の設定を選んでくれます。録画エンコードとか、品質などが選ばれて表示されますので設定を適用のボタンを押して終了です。この自動校正ウイザードを使えば、一番録画失敗の少ない設定になるのでおすすめです。自分でいろいろ設定したい人は以下もご覧ください。録画したムービーをどこに保存するかや、録画フォーマットなどは以下を読んで設定してください。(2019年2月5日追記終了)
手動での録画条件の設定方法;
ファイル、編集、表示…などと並んでいるメニューから、
ファイル→設定→出力とすすんで、出力モードをプルダウンで「詳細」にします。
左から配信、録画、音声、リプレイバッファーというタブがありますので、録画を選びます。
種別は標準、
録画ファイルのパスは、できた録画ファイルをいれるフォルダの場所を決める部分です。右の参照ボタンなどを使って、自分の好きなフォルダを選んで設定します。
録画フォーマットは プルダウンからいろいろ選べますが、私が試行錯誤した結果は、ts やmkvがおすすめです。(ほかに動画の形式としてはflv,mp4, mov,m3u8が選べます。flvがデフォルトになっています。) 動画の形式ではmp4やmkvなども試しましたが、私のパソコンでは、録画してできたファイルを再生すると うまく録画できておらず、音声は進むのに画面が止まったままの部分があちこちにできてしまうこともありました。私のパソコンで試した時は、ts形式を選ぶとCPUへの負担が少なくなるのでエラーが回避できました。mp4などでエラーがでるときは試してください。たしかOBS Studioはマルチプロセッサーを利用していないはずです。できあがったtsファイルやmkvファイル、flvファイル、mp4ファイル、movファイルなどは前に紹介した動画プレイヤーのMPC-BE x64で再生可能です。
以下は私の使っている録画の部分の設定です。
録画フォーマットはts、
エンコーダは私はQuickSync H.264を選んでいます。プルダウンメニューで表示される
(ストリームエンコーダを使用)(QuickSync H.264), x264などから素材に応じて選択します。利用できるハードウエアエンコーダがパソコンにないときはストリームエンコーダとx264しか表示されません。
出力をリスケールするにはチェックはいれていません。
カスタムマルチプレクサ―の設定もなし。
ターゲットの使用法は、qualityをプルダウンから選択。(balanced,speedも選べますのでうまく録画できないときは試してみてください。自動設定では私のパソコンではbalancedが選ばれていました―2019/2/05追記)
プロファイルはbaselineにしています。他にhigh, mainも選べます。
キーフレーム間隔は3、
非同期深度は4、
レート制御はCBR、
ビットレートは2500としています。
次は映像です。設定画面の左側、一般、配信、出力、音声、映像、ホットキー、詳細設定というアイコンの中にある、映像アイコンをクリックしてください。
基本(キャンバス)解像度は、1366×768などご自分のパソコンのモニタの解像度に設定します。この数値はカーソルをあわせてクリックした後適当な値に変更できます。
出力(スケーリング)解像度は、基本解像度と同じでもいいですが、CPUが追い付かずに録画に不具合がでるときは、小さめに設定するといいと思います。1280×720とか、ご自分のモニタの解像度の選択枝から選ぶのがいいでしょう。(910×512が自動設定ウイザードでは設定されていました―2019/2/05追記)
縮小フィルタはバイキュービック、ランチョス、バイリニアから選びます。ランチョスが解像度がよくて、バイリニアが一番悪いのでランチョスから試してみてください。
FPS共通値は毎秒のフレーム数ですので、プルダウンから選ぶか直接入力して30とか29.97とかでいいでしょう。
あとは録画のホットキーを設定しましょう。
映像アイコンの下にある、ホットキーアイコンをクリック、開く画面で、録画開始と録画終了のキーをきめます。私はWindowsキー+F12にしています。
以上で録画の設定が終わりです。他の設定はデフォルトのままにしておいていいでしょう。右上のx印をおしてウインドウを閉じる時に「保存していない変更があります。変更を保存しますか」ときいてくるので「はい」をクリックして終わりです。
Firefoxなどでムービーを再生しておき、録画したい部分を設定して、メニューの録画開始、あるいは設定したホットキーをおしたら録画が始まり、もう一回同じキーをおすと録画終了します。カーソル操作を記録したいときは、ソースのウインドウキャプチャを右クリックし、プロパティでカーソルをキャプチャにチェックをいれます。
参考:
この条件でも録画に失敗することがあります。そこで他の録画条件設定についても簡単に触れておきます:エンコーダをソフトウエアエンコーダである、x264に設定した場合(これでもだめならストリームエンコーダにするとうまくいく時もあるかもしれません)下のほうにレート制御、ビットレートなどの選択画面がでてきます。
CPU使用のプレセットは、デフォルトがveryfastですが、CPU使用率を下げるにはsuperfastやultrafastを選ぶといいようで、私は一番CPU使用率の低いultrafastを使っています。
動画のことは素人ですので、もっとうまい設定があるかもしれません。いろいろ試してみてもっとうまくいく方法があれば教えてください。
福岡は暖冬のようです。例年になく早く水仙、椿が咲きはじめ、梅の開花も例年より随分早かったそうです。夜になるとオリオン座が昇ってきてとても綺麗な冬です。写真はiPhoneでオリオン座を撮影して、画像処理で見えるようにしたものです。結構感度がいいんですね。周辺の星々もちゃんと写っていました。
最近、こんな雑誌から査読依頼がきました。microPublicationといいます。
これはWormbaseのDaniela Raciti, Karen Yook,Todd Harrisさんたちが始めた研究成果の全く新しい形式での発表の場です。
”As you may know, WormBase recently launched a novel publication platform microPublication, that allows researchers to share high quality but traditionally unpublished stand-alone data and datasets.”
とDanielaさんからいただいたメールにありました。今までは論文にうまく入れ込めなずに発表できなかった研究成果、単一の論文にできなかったような優れた研究成果(データやデータセット)や取得した変異体などについても発表できて、引用できるようになるというものです。モデル生物の線虫C. elegans、ショウジョウバエ、カエルXenopusのコーナーがあり、もうすぐゼブラフィッシュやGene modelというのも追加されるようです。
Expression data, Genotype Data, Phenotype data, Genetic screens, New Methods, Software, Database updates, Integrationsなどのカテゴリーで投稿しますが、これにうまくはいらないカテゴリーのデータでもOKです。
単独では論文にできないけれど発表しておきたい研究成果があれば、図か表の一枚分くらいの程度で引用論文を含めて公開できます。
FAQのページには以下のように書いてあります。
How do you differ from traditional journals?
The major goal of microPublication Biology is to rapidly place research findings into the public domain. Thus unlike other journal platforms, we publish single high quality research results, independent of perceived impact, which can be new research findings, negative results, reproduced/replicated results or “unpublished observations” from prior publications. Single results can stand alone, and do not require a narrative story to placate editors. Placing such findings into the public domain not only advances the scientific endeavor, but also gives credit to the individual(s) that did the work.
このjournalの主な目的は、研究成果をすばやくpublic domainに入れることだとあります。現在のところarticle processing feeは無料、将来もsubmissionは無料だそうです。microPublicationでは、いままで雑誌に掲載できなかった否定的な結果negative resultsや、追試結果、以前の論文でunpublished resultsと書いた実験結果などの投稿もOK で、普通の論文のようにストーリーの中にいれることなく、単独で独立して発表できるという、大変チャレンジングな試みです。データを独占せず共有するという線虫コミュニティの気概を感じさせるこころみですね。同じようなものにPLosCurrentsというのがあったそうですが、これは立ち消えてしまいました。
公開例は、たとえば以下をご覧ください。
https://www.micropublication.org/expression-data.html
https://www.micropublication.org/genotype-data.html
査読者名も表示、非表示をレフリーが選べるようになっています。また公開したmicroPublicationにはDOI.が割り振られ、引用可能になります。オープンアクセスです(CC BY 4.0)。Europe PubMed Centralにインデックスしてもらうようになるはずとのことです。
私も投稿してみようかと思っています。
2020年6月19日追記:PubMedやPubMed Centralにも掲載されるようになったというメールが今日とどきました。PMID もPMCIDも割り振られるそうです!
We are happy to announce that we are now in PubMed!
Articles will now be getting DOIs, PMCIDs, and PMIDs. Feel free to update your citations!
Indexing is retroactive for all past articles.
You can browse our entire index in PubMedCentral here: https://www.ncbi.nlm.nih.gov/pmc/journals/3859/
Or just do a normal search for an article in PubMedCentral or PubMed.ということです。
Firefoxの更新をした後、タブを開いてしばらくすると
とかいうメッセージがタブを開くたびにクラッシュしました。古いESR版から最新のFirefox Quantumに移行しようとしたのにこれではうまく移行できません。いろいろ解決策をネット検索してみました。私の場合、Firefoxをセーフモードで起動してもなおらず、Firefoxを新しくインストールしなおしてもだめでした。 古いバージョンにもどすとクラッシュは起こりません。ネットに書いてあるhardware acceleration を切るというのも効果なしでした。ネット検索しても以上のような解決策ばかりでしたが、さらにねばってネット検索してみると、Firefoxのurlをいれるところに、about:configとうちこみ、 動作保証対象外になりますという警告がでても危険性を承知の上で使用すると選び(下のギャラリーの左の写真をクリックしてください)、開く画面で、webgl.disabledのところ、falseになっているいのを右クリックで「切り替え」(toggle)をクリックしてtrueになおすとよいことがわかりました(下のギャラリーの写真の右側をクリックしてください)。私は最新版のFirefoxを使っていますがこれでタブを開くたびにクラッシュしなくなって無事、古いバージョンから最新バージョンに移行できました。トラブルで困っている方の参考になれば幸いです。
福岡はすっかり冬らしくなり小雪がちらつく年末でした。ただ寒さはそんなにひどくなく大みそかは快晴で近くの丘で凧揚げなどを楽しめました。今日の元旦の朝には卒業生の方たちから結婚のお知らせの年賀状や、嬉しい知らせの電話などをいただきました。年賀状もいろんな方からとどいていてゆっくり読ませていただきました。旧年中は本当にお世話になりました。本年もどうぞよろしくお願いいたします。
本年も皆様にとってすばらしい一年でありますように!
OUMUAMUAというのを聞いたことがありますか?昨年発見された、人類がはじめて確認した太陽系外からの侵入してきた物体で、宇宙人がつくった宇宙探査機ではないかという説がささやかれていたものです。これに関する多くのプレプリントがプレプリントサーバーにアップロードされていますので、興味のある方は読んでみるのをおすすめします。Cornell大学のプレプリントサーバーarXiv.orgにアクセスして、oumuamuaで検索してみてください。50ほどのプレプリントがヒットします。
2017年10月にみつかったOumuamuaは、見つかった時すでに地球からは遠ざかっており、毎秒26 km/sという高速で太陽系に侵入して通過していったのですが、形がみえるほどの高解像度の望遠鏡はなかったので、望遠鏡ではその姿はとらえられておらず、光りかたなどからは幅:長さの比が1-5~10とみつもられているそうです。その起源は太陽系のオールトの雲由来ではなく、また近くの恒星系の外辺にある星(たとえばαケンタウリ)なの周辺にあるオールトの雲由来とも考えられないそうです。とても遠い宇宙からの来訪者のようでこれが彗星か小惑星かなど皆が注目して観測したそうです。光の反射などから推定されたその形は通常の小惑星や彗星のものではなく、とても明るい表面をもつ物体のようで宇宙人のつくった探査機かもしれないとうわさされていました。形の想像図はヨーロッパ南天天文台(ヨーロッパなんてんてんもんだい、European Southern Observatory、略称:ESO)の機関誌The Messenger の173に載っているRendezvous with `Oumuamuaという記事のp15をご覧ください。プレプリントサーバーの論文にもありますが、探査機なら電波を出しているのではないかということで、FM波長で電波が放出されていないかの観測がつづけられたそうですが、電波は検出できなかったとのことです。ただ面白いのは、太陽の重力だけでは説明できない、異常な加速がみられたとのことで、これがもし彗星などなら太陽の熱で氷がとけて尾をひいて加速したと思われるのですが、尾の形成もなくただ原因不明の加速がみられたのでした。このブログで紹介しているプレプリントサーバーをご覧になるとそれを説明する論文がだいぶ前に掲載されていたのがわかります。ハーバード大学のLoeb先生たちの論文で、Oumuamuaの加速は、日本のイカロスで実用化されたsolar sail(太陽帆)によって引き起こされたとすると説明が容易であるというのです。このプレプリントは最近、査読にとおってAstrophysical Journal Lettersという雑誌に発表されて、最近新聞やネットニュースで大きくとりあげられました。
著者はさらに多くのプレプリントをアップロードしていますが、その中で最近Scientific Americanのブログにも公開されたプレプリントは著者の考えをわかりやすく書いていておすすめです。
ブログには埋め込みできないようですが、以下の動画に Loeb先生のインタビューがあります。
https://www.youtube.com/watch?v=WBekHr6nrU8
もしOumuamuaが宇宙人の探査機のようなものだったとしたら、それを追いかけて確認するというのも将来可能になるかもしれません。しかしもっと簡単なのは太陽と木星の重力にとらえられている宇宙人の作った人工物を探すことではないだろうかと書いています。太陽と木星の重力場は宇宙に張られた網のようなもので、この重力網にとらえられているであろう人工物(宇宙人の作った探査機など)を探すのが、電波で宇宙人からのメッセージを探すより手っ取り早いのかもしれないというわけです。Loeb先生たちはそのような物体の頻度を見積もる論文も最近プレプリントサーバーにアップしているようです。みなさんもプレプリントサーバーをいろいろ見て、活用してみてください。
Oumuamuaの論文は、アーサー・クラークの書いたRendezvous with Ramaという作品(「宇宙のランデヴー」という題で邦訳がでています)のラストシーンが思い起こさせます。またScientific Americanの記事のプレプリントを読むと、野尻抱介さんの「沈黙のフライバイ」のラストも思い起こされました。
前に紹介したTextClipperのクリップツールの一つclipfileを作者の吉村隆樹さんがバージョンアップしてくださいました(2018/11/28)。前のバージョンを使っている方は新しいバージョンにしてください。ここからバージョンアップ版をダウンロードして解凍してできたclipfile.ctaファイルをtextclip7962フォルダ中に上書き保存するだけです。以前のバージョンでは保存日時の年号が正しく入らなかったのですが、今回のバージョンアップで2018がちゃんと入るようになりました。吉村さんによると典型的な2000年問題だったそうです。バージョンアップをお願いして数時間で新バージョンを作ってアップロードしてくださいました。吉村さん、どうもありがとうございました。
以下では先日紹介したTextClipperのクリップツールclipfileの使い方をもうすこし詳しく紹介しておきます。
1)まずTextClipperをここからダウンロードしてダウンロードしたzipファイルを解凍してください。解凍してできたフォルダがtextclip7962という名前になります。このフォルダはProgram Filesのフォルダには入れないでください。入れると動きません。このプログラムを使用するには7-zip32.dllが必要です(バックアップ時)のでここから取得してください。
2)ここまでの作業でtextclip7962というフォルダができました。バージョン番号がフォルダ名になっていますね。TextClipper本体はこのフォルダの中にあるtextclip.exeです。これをダブルクリックするとTextClipperが起動します。このソフトの使い方については
http://www.hi-ho.ne.jp/makoto_watanabe/tc/index.html などをみてください。
では次にclipfileというクリップツール(TextClipperの機能拡張のようなものです)をインストールしましょう。これはブラウザにかぎらずMS WordやAcrobat Readerで表示しているpdfファイルなど、任意のソフトで表示しているテキストを選択し、それを規定の名前のテキストファイルTc_txt.txtに次々と保存できるツールです。
一つのテキストファイルに、保存日時と出典、および保存時に追加できる任意のキーワードとともに保存してくれます。新しくクリップしたテキストはもとのテキストファイルの末尾に追加されます。これを使うと、ネットサーフィンで見つけたテキストをキーワード付きでテキストファイルで保存できますので、あとで秀丸など適当なテキストエディタでgrep検索して簡単に探し出すことができます。保存するときに将来検索の時に思いつきそうな、「選択したテキストには含まれないキーワード」を追加しておけるので、後々の検索時に探しもれが少なくなるのもこのツールの便利な点です。
3)では、clipfileを使えるようにしましょう。
以下のurlからクリップツールのclipfileを選んでダウンロードします。
http://takaki.la.coocan.jp/freesoft/textclipper/
ここをクリックしてダウンロードしてもいいと思います。clipfile.zipがダウンロードできますので、前に紹介した7-Zipなどのソフトで解凍します。解凍してできたclipfile.ctaというファイルを上の2)でできたtextclip7962のフォルダにドラッグして移動させます。これでclipfileを使う準備ができました。
4)TextClipperを起動して、clipfileを使ってみましょう。
まずTextClipperを起動します。
上の図のヘルプの左にある、環境設定を選び、
開いてでてくるメニューでクリップツールキーをAlt+cなど好きなキーの組み合わせに設定します。
これでAlt+Cを押したらクリップツールが動くように設定できました。
5)では、実際にテキストを適当に選んでスクラップブックのようにテキストファイルに保存してみましょう。
まずTextClipperを起動しておいてください。そのあと、ブラウザなどで適当なサイトを訪れて、保存したいテキストを選択し、さっき決めておいたクリップツールキー(Altをおして同時にCを押す)を押します。すると下の画像のようにポップアップメニューが開いて一番上に「TextFileに追加」がありますのでこれを選択します。
するとキーワード入力のポップアップ画面が開きますので、あとで検索に便利なキーワードを入れます。複数入れても構いません。自由に入力しましょう。
保存ボタンをおして完了です。Tc_text.textという名前のファイルに上の選択した部分が出典の一部、日時、キーワードとともに保存されているはずです。
ではうまく保存できたかどうかをtextclip7962フォルダ内にできているTc_txt.textというファイルを開いて確認しましょう。出典、日付、キーワード、クリップしたテキストの順に保存されていたら成功です(下図参照)。
上の例では、私の去年の学会でのランチョンセミナーの講演動画がでているYouTubeのページにあるテキストをクリップしたテキストの後に、今しがたクリップした論文のテキストが追加されています。N型糖鎖、先天性グリコシル化異常症などとあるのは、さきほどつけたキーワードです。その下にクリップしたテキストが保存されているのがわかります。
このように、ちょっと気になったテキストを、どんどんクリップして蓄積しておき、あとで秀丸エディタなどのテキストエディタのgrep検索機能で検索します。grep機能についているタグジャンプ機能を使えば該当するクリップしたテキスト全文のある場所に容易にジャンプすることができます。テキストファイルのサイズが大きくなってきたら、Tc_text.textファイルの名称をTc_text1.txtなどすきな名前に変更します。次にclipfileツールでクリップしたら、自動的にまっさらなTc_txt.txtファイルができてそこに保存されますので、またゼロからクリップがはじめられます。
こうしてできた大量のクリップファイルを一斉に grep検索したら何年にもわたって蓄積したデータを一瞬で検索できて便利です。データはテキストファイルですので、加工も活用もきわめて簡単です。英語論文の例文集の作成、アイデアメモの作成などいろいろな用途につかえるすばらしいツールですので是非活用してみてください。
写真は福岡で撮影したイチョウです。とてもきれいに黄葉しています。秋も深まってきました。
先月投稿していた論文がアクセプトされて原稿がオンラインに掲載されました。Kanakiさんの修士論文の内容を主とした論文で、私達のCREST研究の成果を含めた論文です。Dejima君Matsudaさん、Murata君、Nomuraさん他 沢山の方々との共同研究の成果です。Oxford University Press発行の雑誌Glycobiologyを購読している方は是非ご覧ください。アブストラクトへのリンクは以下の論文のタイトルをクリックしてください。
糖鎖遺伝子の異常というのはアメリカ合衆国の人口の20%程度でみられるとされており、なんか具合が悪いと病院を訪れる患者さんや、100件近くの医療機関を訪れても原因がわからなかった患者さんのゲノム配列やmRNA配列をシークエンサーで調べてみると、糖鎖遺伝子の異常が原因であるということがわかったという例が頻出しています。それでアメリカでは糖鎖生物学者は病院、j研究所でひっぱりだこになっているということです。
今回の研究は先天性グリコシル化異常症CDG(congenital disorders of glycosylation)の原因遺伝子の一つでCDG-IjあるいはDPAGT1-CDGと呼ばれる病気の原因遺伝子DPAGT1の線虫での研究成果です。線虫でわかった結果をヒトの病気の解明に役立てようとする研究手法の実施例でもありますので是非ご覧ください。
先天性グリコシル化異常症についてはGoogle検索で「先天性グリコシル化異常症」といれてすぐにヒットする和田芳直先生の論文「先天性グリコシル化異常症CDGの分子診断」 (Proteomics Letters, 2017, 2, 1-6)をご覧ください。
私達の今回発表した論文ではヒトのN型糖鎖合成の第一段階ではたらく酵素DPAGT1の線虫版遺伝子algn-7を線虫で初めて同定し、遺伝子産物の酵素活性を確認、その遺伝子algn-7を阻害すると幼虫致死、卵母細胞形成異常、卵母細胞から胚への遷移(oocyte-to-embryo transition)が異常となることなどを報告しています。このDPAGT1遺伝子のノックアウトはマウスでは胚発生の初期での致死を引き起こしますが、お母さんマウスの体内でおこる死亡で詳しいことはなかなかわかりません。そこで線虫の登場となるわけです。
線虫は体が透明なので、発生していく卵母細胞などの様子が生きたまま観察できます。そこでこの研究では、この遺伝子の生殖巣での役割(幹細胞ニッチの形成から卵母細胞形成、そして受精)と初期胚分裂と幼虫期での役割を詳しく調べてみました。この遺伝子産物DPAGT1は従来日本で発見されてこの酵素を阻害する定番の薬であるツニカマイシンのターゲットとされてきましたが、ツニカマイシンはN型糖鎖の合成以外にも様々な副作用があります。実際 線虫で調べてみると、線虫でツニカマイシンを与えたときと、DPAGT1遺伝子を阻害したときとでは少々違った結果がでるのがわかりました。ツニカマイシンを使うより遺伝子そのものを阻害するのが一番確実です。線虫ではこの遺伝子の阻害がRNAiで強力かつ安定的に実施できます。そこで今回の研究ではDPAGT1遺伝子の機能をRNAiや遺伝子破壊で阻害したらどうなるかを詳しく調べた研究にもなっています。
このalgn-7遺伝子を阻害するとたしかにN型糖鎖の合成が抑えられることも確認できたので、さらに一歩すすめて生殖巣で発現しているどの「N型糖鎖がついているタンパク質」の阻害がalgn-7遺伝子の阻害でおこるのと同じ異常をひきおこすかも調べてみました。生殖系列で発現している遺伝子のリストとはすでに公開されています(RNA-Seqでの結果がすでに公開されています)。また線虫でN型糖鎖が付加されていることが実験的に確認されている遺伝子のリストもすでに公開されています(これもデータベースGlycoProtDBが公開されています。線虫、ヒト、マウスのデータがあります)、この二つのデータの胸痛部分456個の遺伝子をデータベース検索で選び出し、その遺伝子機能をRNAiで阻害した結果を調べてみました。その結果、同定できた5つの遺伝子は、algn-7の遺伝子阻害と同様の異常を引き起こします。これらの5つの遺伝子には、従来のCDGの原因遺伝子のほか、ごく最近にCDG遺伝子と同定されたもの、およびおそらくCDGでの異常症状の原因となる遺伝子ネットワークに関与していると推定されるものが含まれていることがわかりました。
今まではN型糖鎖を阻害すると糖鎖付加が不十分なタンパク質が蓄積して小胞体ストレスが引き起こされてその結果、様々な表現型がでると漫然と考えられていましたが、小胞体ストレスはたいした影響は与えておらず、実はpatched遺伝子ネットワークなどいくつかの重要な遺伝子の機能阻害がCDGでの異常を引き起こしているのではないかと考察しています。是非、ご一読ください。
写真は先日 福岡市動物園に行ったときに撮影したお猿の子供たちの写真です。左上でブランコに上り初め、右で上まで到達。左下で下へとジャンプして落下し、右下で回転楕円体のような黄色の部分にのって遊んでいる一連の動きの写真です。朝早くでしたが元気にあそびまわっていて、子ザルの元気さがとてもよかったです。
前回紹介した英語論文用の例文集に使えるAntConcはテキストファイルやhtmlファイルを扱いますが、最も身近な英語の例文集の素材はpdfファイルだと思います。そこで今回は英語の例文集の作成のために重宝する、「pdfファイルをテキストファイルに変換する方法」を紹介します。AcrobatやFoxit Readerなどでpdfを開いて、textファイルとして保存する方法は、pdfファイルが数百、数千ある場合は手作業では対応できません。こんな場合は、Acrobatなどで複数のpdfファイルを一つのpdfファイルに結合してからtextファイルに変換するという方法もありますが、そんなめんどうくさいことをしなくてもpdftotextという無料ソフトを使えば一括で複数のpdfファイルをそれぞれ別のテキストファイルに変換でますので、やってみましょう。
まずpopplerというpdfを扱うプログラミングライブラリ(その中にpdftotextが入っています)をお使いのWindows, Mac, linux用のものを選んでダウンロードしてインストールします。linuxではsudoコマンドでpopplerをダウンロードしてインストールできますし、Mac版もアプリストアからダウンロードできるはずです。私が使っているWindows 10やWindows 7のPCの場合については、ここに詳しいインストールの仕方が書いた記事がでているのを見つけました。大変丁寧に書いてありますのでそのよく読んでインストールしてください。私もこの記事のとおりにインストールして利用しています。
私はCドライブ直下にpoppler-0.68.0というフォルダ(ダウンロードしたPopplerの圧縮ファイルを解凍(解凍ソフトは註1をみてください)してできるフォルダ名のままコピーしただけです)を作り、その直下にあるbinフォルダ(binaryフォルダの意味で、実行ファイルが入っているフォルダのことです)に自分の必要なpdfファイルを集めてテキストファイルに変換しています。shareフォルダの下にはpopplerとrenameしたデータファイル(上述のホームページにあるリンク
https://poppler.freedesktop.org/poppler-data-0.4.9.tar.gz からダウンロードしたpoppler-data-0.4.9.tar.gzファイルを解凍したもの。註1参照)をおいてください。あとは以下のコマンドを記述したバッチファイルをテキストファイルエディタで作ることが必要です。
for %%i in (*.pdf) do (pdftotext %%i %%i.txt)
このコマンドをテキストファイルエディタにうちこみ、できたファイルに適当な名前(pdf2txt.batとかすきな名前)をつけて保存します。保存のときデフォルトではテキストファイルで保存されれウため、pdf2txt.txtになりますのでファイル名の変更でpdf2txt.batにするか、保存時に.batで保存してください。保存場所はpdftotextのあるフォルダ(上の例ではbinフォルダ)にします。
あとは、変換したいpdfファイルを上のbinフォルダにコピーして、コマンドプロンプトでpdf2txt.batファイルを実行するだけです。日本語のファイルも英語のファイルもともにテキストファイルに変換されます。(invalid font weightというエラーが出るかもしれませんが無視してよいようです。不都合があったら教えてください。)
以下はコマンドプロンプトが初めての人むけの簡単な説明です(註2参照)。
バッチファイルというのはwindowsのコマンドプロンプト(windows7では「すべてのプログラム」の部分をみていくと、アクセサリフォルダの下にあります。windows10では下の図の左端の写真ようにシステムツールの下にあります。)でファイル名を入力してエンターを押すと、ファイル内に書いてあるコマンドを逐次実行するというものです。
矢印のコマンドプロンプトをクリックして起動するとき右クリックで、管理者として実行を選んで起動しておくと管理者としてログインしていないときにおこるトラブルをさけられますので注意してください。
今回のバッチファイルは以下のような内容で動きました。
for %%i in (*.pdf) do (pdftotext %%i %%i.txt)
意味は、iという変数にpdfのファイル名をいれ、それにpdftotextコマンドを実行してpdfのファイル名(%%i)のついたテキストファイル(%%i,txt)を作るという操作をフォルダ内にあるすべてのpdfファイル(*.pdfというワイルドカード*を使っている部分で、任意のファイル名のpdfファイルを表しています) がなくなるまで一個ずつ繰り返す(for doの部分)というものです。
コマンドプロンプトを上に説明したように起動すると、黒いバックに白い字の画面が開きます(上の真ん中の図)
自分の今いるディレクトリ(フォルダ)の名前が表示されています。これから目的のpopplerのフォルダを探すとき、たとえばCドライブの直下にpopplerのフォルダがあるなら、コマンドプロンプトでcd ..(cdとうって、ピリオドを二回うちます)というコマンド(これはディレクトリを上に登って行くコマンドです)を何回かうってディレクトリをC:¥>にします。上の図の右端の図。
dirとうつとディレクトリやファイルの一覧が表示されます。
popplerのフォルダへ移りたいのでcd poppくらいまでをタイプしてあとはタブキーを押してください。タブの自動補完機能でcd poppler-0.68.0と自動入力されます。(このタブ補完の機能はlinuxで重宝するのですがWindowsのコマンドプロンプトでも利用できますので活用してください。) enterキーを押すとC:¥poppler-0.68.0>と表示されてディレクトリを移動したのがわかります。ここでdirとうってenterを押すとディレクトリ内のファイルとフォルダが表示されます。プログラムファイルのあるbinのフォルダ(ディレクトリ)があるのを確認してください。cd binとうってenterを押すとbinのディレクトリに移動します。C:¥poppler-0.68.0\binとなっていたら成功です(上の右端の図)。再びdirとうってenterをおします。これでこのbinフォルダ内にあるすべてのファイルとフォルダが表示されます。あとはそこにコピーしてあるバッチファイルpdf2txt.batを実行する(コマンドラインにpdf2txtとうってenterを押す)と、自動的にファイル名のついたtxtファイルができあがります。
こうして一括でpdfファイルをテキストファイルに変換したら、あとはこれらのテキストファイルをAntConcに読み込んでコーパスとして論文を書くときに参照すればいいわけです。
もちろんテキストファイルですから、テキストファイルを一括検索して、検索結果にタグジャンプして参照できるgrepコマンドも使えます。適当な、grepコマンドが使えるエディタ(たとえば有料ですが秀逸なエディタでおすすめの秀丸エディタ)でpdfの内容を串刺し検索するのもよいですね。pdfgrepというソフトもあって、これを使えばpdfファイルのままでgrepができるそうです。これはまだ使っていません。windows版をダウンロードしてさきほどのbinファイルにコピーしておけば、コマンドプロンプトで使えるのですが、linux版とちがって検索語がハイライトしなかったりしてまだ使いこなせていません。興味のある方は使ってみてください。
註1:圧縮ファイルの解凍には私は7-zipを使っています。たいていの圧縮解凍はこれでできます。
註2:パスの通し方とかは説明しないでpdftotextを使う方法を説明していますので、良く知っている方はパスを通して適当な場所にpdftotextをおいて使ってください。
京都でひらかれた大学の同窓会にでかけたりして更新が遅くなりました。京都は快晴で、まだもみじの季節ではなかったですが美しかったです。しかし観光客が多いこと多いこと。スペイン語や中国語、韓国語、さらにはノルウエーの旗を立てた団体もみかけました。
さて、昨年の分子生物学会のランチョンセミナーの中でAntConcというフリーソフトウエアの紹介をしました。英文を書くときに自分専用の例文集を作っておいて、それが簡単に検索できればとても役立ちます。前回紹介したTextClipperで役にたちそうな例文をテキストファイルに集めておいて、AntConcというフリーウエアでコンコーダンス検索してヒットした例文を参考に英語を書く方法を紹介します。もちろん自分の関係分野の論文のpdfをテキストファイルに変換して集めておき、それをAntConcで検索してもいいわけです。pdfをテキスト化するには、pdfをAcrobatなどで開いておいてtextファイル形式で保存するのも一つのやり方ですが、一斉にpdfをテキスト化するならLinuxやWindows、macなどにあるpdftotextといったソフトを使うのが便利です。ウインドウズにもこれが含まれているLooperというソフトがありますのでそれを使うといいでしょう。これについては次回紹介します。
それではAntConcの使い方の解説をはじめます。AntConcはコンコーダンスソフトウエアという種類のソフトウエアで、検索語を入力するとテキストファイルからその単語を拾い出し、文中に含まれるその単語の前後をふくめて表示してくれるソフトです。単語の文中での出現頻度などその他の様々な情報もわかります。まず早稲田大学のLaurence Anthony先生ホームページから自分のパソコンのOS(mac, windows, linux)にあったソフト(無料です)をダウンロードします。ここのリンクをご覧ください。
AntConcのホームページには、YouTubeの解説動画や日本語の解説pdf(バージョン3.2,2の解説ですがとても参考になります)などへのリンクもありますので適宜参照するといいでしょう。
ダウンロードしたファイルは実行ファイルなのでダブルクリックして起動します。詳細な使い方は先生のhelpファイルのpdfがあるのでダウンロードしてみてください。
写真はダブルクリックして起動した直後の画面です。起動時にはConcordanceタブが開いています。 Fileメニューが上にあります。Fileメニューをクリックするとプルダウンメニューが開き、その一番上にあるOpen File(s)を選んで検索したいファイル(複数選択可能です)を読み込みます。(下の図)
複数のファイルを読み込んで串刺し検索もできます。またOpen Filesの下のOpen Dirを選ぶと、フォルダ(あるいはDirectory)内にあるすべてのテキストファイル(とかhtmlファイル)を検索してくれます。こうして必要なファイルを開いてやると以下のような画面になります。
下の写真は私達の論文(AkiyoshiさんのCGGDBデータベースについての論文をpdfからテキストファイルにしたものでcggdb.txtという名称にしました)を開いたところです。
Current Filesというところに検索するファイル名が表示されます。複数選択した時は選択したすべてのファイルが列挙されます。
では検索してみましょう。resultという単語を検索することにします。Search Termの部分にresultといれて検索窓の下にあるStartボタンを押して検索してみましょう。(このとき右にあるwordsにチェックをいれています(下図参照)。単語としてのresultが検索されます。Caseにもチェックをいれると大文字小文字の区別をして検索できますし、Regexにチェックを入れると正規表現(Perlタイプのもの)が検索に利用できます)ヒット数は上のほうのConcordance Hits に表示されます。
6個ヒットしています。注意したいのはWordsにチェックを入れた状態で、resultを検索するとresultsは検索されないことです。Wordsのチェックを外してresultとして検索すると、resultだけでなくresultsもresultedもresultingもひっかかってきます。(下図)
ヒット数が57となっているのがわかると思います。
Concordanceメニュ―では、resultというキーワード(Key Words)が文のコンテクストの中で(In Context)どのように使われているかが表示されています。この表示を略してKWIC表示といいます。結果の表示法は、いろいろ下のメニューで変更可能です。たとえばSearch Window Sizeはデフォルトで50文字(腱索キーワードの前後50文字ずつ)となっていますが、これは増やしたり減らしたりできます。ちょっと表示を左右に広げてみるとよくわかります。
Search Termの検索窓の下のほうにKwic Sortとあるのは、検索結果のソートボタンです。
図ではLevel 1が1R(キーワードresultの右の語でアルファベット順にソート)、Level 2が同じ右の単語の場合は、キーワードの二番目の単語でさらにソートします。それがLevel 2 2Rという部分です。Level 3は三番目の単語でさらにソートとなります。もしresultの左の単語でソートしたいときは、Level 1以下の部分を下向きの矢印ボタンを何回かクリックして、下の図のようにかえて、Sortボタンを押してください。
すると検索キーワードの左の単語で再ソートされますので、resultの前にくる単語がわかります。
次にKWIC画面で表示されている原文をみてみましょう。みたいヒット行の青字で表示されているキーワードをクリックしてみましょう。クリックした文を含む原文がFile Viewタブが開いてそこに表示されます。
Hit Locationという部分の上下の矢印をクリックすると、前や後のresultを含む原文が表示されます。カーソルをFile View画面で動かせるようにしておくと、マウスの中央ホイールをくるくるまわして前後のresultを表視することもできます。
皆さんもご自分でつくったテキストファイルやテキストファイル群をこのソフトで開いて遊んでみてください。大変有用なソフトです。ちょっと長くなったので今回はここで止めます。次回はAntConcのその他の機能と、どうやってpdfからtextファイルを作るかについてpdftotextの使い方を紹介したいと思います。
写真は元寇のとき筥崎宮が避難していた場所を訪れたときのものです。とてもいい天気で気持ちがよかったです。バス停をおりると案内板があって、650mほどのぼりの道を行くと古い社があって記念碑がたっていました。人はだれもいません。一番最後の写真は帰りの川面です。波紋がきらきらと川底に映えてハヤも泳いでいました。このへんはホタルも初夏には見られます。