お知らせ―サイトを常時SSL化しました!(5/27日追記有)常時SSL化の手順

昨日、WordPressで作っているこのサイトをSSL化しました(SSLはSecure Sockets Layerの略だそうです)。具体的にはサイトにアクセスしてもらったとき、ブラウザのサイトのurl表示のところが鍵マークになり、ブラウザとサイトのサーバー間の接続が暗号化されるようになるということです。最近のブラウザではhttpsでアクセスしないと警告表示がでたりしますので多くのサイトが常時SSL化をしています。昨日やってみましたが以外に簡単にできました。今後はアクセスするときのurlがhttp://glycostationx.orgからhttps://glycostationx.orgにかわるというわけです。

以下は覚書をかねたSSL化したときの手順です。各自ご自分のサイトに合わせて読み替えてみてください。(写真はひと月ほど前に咲いていたリンゴの花です。今年は去年より沢山花が開きました。意外かもしれませんが、九州ではリンゴも栽培されています。)

1.最初にSSL化の失敗に備えて、サイトhttp://glycostationx.orgを丸ごとバックアップしました。サイト自体をAll-in-One WP Migration というWordPressのプラグインでバックアップして保存しておきます。やり方は簡単で、このプラグインをインストールしたあと起動し、エクスポートを選びます。画面がエクスポート用画面に変わるので、エクスポート先をクリックして出てきたメニューから、ファイルを選びます(クラウドを選ぶこともできます)。するとサイト名であるglycostationx.orgをダウンロード、サイズ:何メガバイトなどと表示されるので、拡大収縮表示されている部分をクリックして、保存先をパソコンの適当な場所に指定してダウンロードしたらOKです。この作業は以下を参考にして実施しました。
https://smakoma.com/wordpress-backup-restore.html
(もちろんこのようなプラグインを使わず、ftpなどでサイトのファイルを丸ごとダウンロードすることもできます。こちらのほうがギガバイト以上あるようなサイトの場合は早くて確実だと思います。)

2. サイトのバックアップができたら、次に私の使っているレンタルサーバーで無料のSSL証明書を発行してもらってSSL化を申請して、http://glycostationx.orgをhttps;//glycostationx.orgに変えました。これはレンタルサーバーごとに手順があるのでお使いのサーバーのマニュアルなどで調べるか、Google検索などでレンタルサーバー名とSSL化などのキーワードで探してみてください。エックスサーバーでのやり方を解説している以下のページはとても参考になりました。https://nelog.jp/wordpress-ssl
私の使っているレンタルサーバーでは、SSL化を申請後、1時間もかからずにサイトにhttps://glycostationx.orgでアクセスできるようになりました。

3.次に、WordPressのダッシュボードで、設定―一般とすすみ、WordPressアドレス(URL)とサイトアドレス(URL)の項目(どちらもhttp://glycostationx.orgになっている)をhttps://glycostationx.orgへと変更して変更を保存します。

4.次に、http://glycostationx.orgをブックマークしてある方などをhttps://glycostationx.orgへと自動で誘導するように設定する作業を行います(これはサーバー側での301HTTPリダイレクトというそうです。)。これには.htaccessのファイル(ドットエッチティーアクセスファイル)を編集します。とても簡単な作業で、
サイトの”.htaccess”ファイルの先頭に以下を追加しておくだけでOKです。
RewriteEngine On
RewriteCond %{HTTPS} !on
RewriteRule ^(.*)$ https://%{HTTP_HOST}%{REQUEST_URI} [R=301,L]

.htaccessファイルの編集には、自分のドメインのフォルダの下にあるpublic_htmlの中にある.htaccessファイルを編集します。レンタルサーバーが.htaccessファイルを編集する手段を提供している場合はレンタルサーバーのツールで編集するのもよいですが、安全のため、いちどftpなどで.htaccessファイルをダウンロードして、保存しておき、テキストファイルエディタで開いてみて中身をよくみてから編集するのをすすめます。

今回、サイトでの.htaccessファイルのありかを確認してftpでダウンロードし、編集してアップロードするには、WinSCPというファイル転送ソフトを使いました。
https://winscp.net/eng/docs/lang:jp
このソフトはデフォルトではドットが先頭についている隠しファイルは表示しないので、ソフトを起動して環境設定―パネルを選び、「一般」にある「隠しファイルを表示する」にチェックを入れるのを忘れないようにしてください。こうすると.htaccessファイルが表示され、ダウンロード、アップロードができるようになります。編集が終わったら、編集済みファイルをWinSCPでアップロードしてもとあった.htaccessファイルに上書きしたら完了です。http://のサイトurlでアクセスしてhttps://のサイトへ飛ぶことを確認してください。
WinSCPは九大での旧ホームページ作りにも使っていたとても便利なFTP/SFTP/SCPクライアントソフトです。他にもiPadへのWindowsからの電子ブック転送とかにも使って重宝しています。

5.次に、自分のサイト内での画像やpdfへのリンクなどにhttp://glycostationx.orgではじまるurlを使っているので、これらをすべてhttps://に変える必要があります。1.でバックアップができていることを確認した上で、サイト内のhttp://glycostationx.orgの記述(画像やpdf, サイト内の別のページへのリンクなど)をhttps://glycostationx.orgへ一括で変更します。一括変更には、WordPressのプラグインSearch Regexを使います。このプラグインでブログ内の記述でhttp://glycostationx.orgで始まるものを検索、これをhttps://glycostationx.orgに一括で変更できるので大変便利です。検索にはプラグインのタイトルどおり正規表現も使えますが、単なる文字列でも検索・置換ができます。

注意:このプラグインは更新が3年ほどなされていないため、最新のWordPress(バージョン5.2)で使うと、エラーのメールがとどきます。ブログ名のあとに「サイトで技術的な問題が発生しています」というタイトルのメールがとどいて驚いたのですが、内容は、
”エラータイプ E_ERROR が ブログサイトのwp-content/plugins/search-regex/view/results.php ファイルの 26 行目で発生しました”などというものでした。
Google検索で以下のキーワードで調べてみると、
「”search regex” wordpress 技術的な問題が発生しました」
次のような解決策のページがありました。
https://smakoma.com/search-regex-error.html
このページのとおり、WordPressのダッシュボードからプラグインを選び、プラグインエディターを開いて、該当のエラー行を削除したら完了です。この作業後はもうエラーのメールはこなくなりました。

エラーがでなくなったところで、プラグインをインストールしてあれば、ツールメニューにSearch Regexがありますので、クリックして起動します。SourceにはPost Contentをまず選びます。Limit toとOrder Byはデフォルトのままでよいです。http://glycostationx.orgを検索して、https://glycostationx.orgへと置換したいので、Search patternと書いてある検索窓にhttp://glycostationx.org、Replace patternと書いてある置換窓にhttps://glycostationx.orgといれて、Replaceボタンを押します。するとサイト内のhtml記述中のhttp://glycostationx.orgで始まる部分が全部表示され、https://glycostationx.orgで置換された表現も併せて表示されます。この段階では置換は行われていません。ちゃんと置換すべき部分が表示されているかどうか、全部確認した上でOKならReplace & Saveボタンを押せば全部置換してくれます。このボタンの操作は戻せないので確認は慎重にしてください。終わったら他にhttp://glycostationx.orgの記述がないかを、SourceをPost excerptにして再確認します。あれば確認して置換します。他のSourceについても順次作業を繰り返し、終わったら置換終了です。

6.最終確認です。ChromeとかFirefoxとかでサイトにアクセスしてちゃんと鍵マークが表示されるか試してください。トップページや固定ページごとに試してみて全部鍵マークが表示されればOKです。私の場合は、論文と研究概要の固定ページでエラーになり、鍵マークが表示されませんでした。その部分をクリックすると画像が疑わしいというようなメッセージがでました。そこで、ブラウザのChromeで問題のあるページを表示して、右クリックしメニューの中の検証をクリックします。表示されるページでConsoleをクリックすると、問題のある画像がどれか教えてくれるので修正することになります。私の場合は、画像を九大の旧サイトを参照することで表示しており、このサイトへのリンクがhttpsではなかったからエラーになったのがわかりました。訂正すると無事、全部鍵マークになりました。

7. あとはGoogle Search ConsoleやGoogle Analyticsへの登録が必要になったりするサイトもあるかもしれませんので、その場合は、各自検索して調べてみてください。

私はGoogle Search Consoleを使っていますが、その場合はプロパティの追加で、URLプレフィックスではなくて、ドメインのほうを選びます。ドメイン名を入れて続行ボタンを押すと、「DNSレコードでのドメイン所有権の確認」という画面に変わり、テキストレコードが発行されます。このテキスト(特定のドメインの同定用の文字列です)をコピーして、サイトのサーバーのDNS編集画面から、このテキストを内容とするTXT タイプの新しいDNSレコードを作成します。DNSレコードの追加が終わったら、あとはGoogle Search Consoleの「DNSレコードでのドメイン所有権の確認」画面で確認ボタンをおして所有権を確認します。確認がまだですというような画面がでたら10分ほどおいて再度確認すると確認が終わると思います。この方法を使えば、http://glycostationx.orgの時のデータもそのまま移行されるので便利です。http://glycostationx.org, https://glycostationx.org, http://www.glycostationx.org, https://www.glycostationx.orgそれぞれについてプロパティをGoogle Search Consoleで作成して所有権を確認‥‥という面倒な手順は不要です。

この方法は、「サーバー名 dns レコードでのドメイン所有権の確認」という検索キーワードで見つけました。

Sydney Brenner先生がなくなられました―検索エンジンSemantic Scholarを使ってみよう

分子生物学の開拓者であり、モデル生物C. elegans(線虫シー エレガンス)を世に送Sydeny Brenner先生が先日(4月5日)なくなりました。RIP to a scientific hero.などとtwitterでも惜しむ声が多かったようです。雑誌Natureの追悼記事はこちらにあります。写真はOIST(沖縄科学技術大学院大学)提供のものです。(RIP というのはラテン語のrequiescat in paceの頭文字をとったもので、may he rest in peace, may she rest in peace, may they rest in peaceの意味だそうです。安らかにお眠りくださいという意味ですね。)
Brenner先生は分子生物学の開拓者の一人で、電子顕微鏡のネガティブ染色法の開発者でもあります。突然変異のメカニズムの研究で大きな業績をあげ、それを使ってアミノ酸をコードしている遺伝暗号が3つの塩基の並びからなる(あるいはありそうもないが3の倍数)ことを証明したり、トランスファーRNAの存在を予言、あるいはmRNAの存在をJacobとの共著論文で証明したりしています。これだけでもノーベル賞級の発見ですね。今まで分子生物学で大いに役立ったファージのように使いやすい多細胞生物で、発生や神経の問題を調べるために理想的なモデル生物を探した結果、線虫C. elegansを導入し、プログラムされた細胞死の研究でノーベル賞を授賞されています。私も英国ケンブリッジにいたときに先生のセミナーにでたことがありますが、理論面からの実験への鋭い切り口が印象的なセミナーでした。新しい技術は新しい発見を生むという先生の言葉は特に記憶に残っています。

Brenner先生の自伝的回想のインタビュー(発生生物学者で位置情報の三色旗モデルで有名なLewis Wolpertに語っています)をまとめた、「エレガンスに魅せられて」という本も前に買ってもっていますが、今は中古本でしか入手できないようですね。

YouTubeにはBrenner先生の動画が色々ありますので、適当なのを選んでご覧になるといいと思います。上に載せている動画は2017年に四日間にわたってシンガポールで行われたBrenner先生の講義の動画です。四日分がアップロードされていますのでご覧ください。この講義はIn the Spirit of Science: Lectures by Sydney Brenner on DNA, Worms and Brains という題で、本になっているようです。私はまだ入手していませんが英語が聞き取れない人は買ってみるのも良いと思います。Kindle版は安く入手できるようです。
この動画、まだ最初のあたりしか見ていませんが、 Turingとvon Neumannの話からはじまっています。Brenner先生はSchrodingerのWhat is Life?には全く興味をもてなかったと、上の自叙伝の本で述べていますが、かわりにNeumannの自己増殖オートマトンの理論に深い興味をもたれたようです。このYouTubeの講演でいっている自己増殖オートマトンの本というのは、たぶんノイマンが1948年にHixsonシンポジュウムというシンポジュウムで、THE GENERAL AND LOGICAL THEORY OF AUTOMATAという題で講演した論文で、後に出版されたこの本Theory of Self-Reproducing Automataではないと思います。Hixson symposiumのNeumannの論文は、中央公論社からでた世界の名著66 現代の科学IIに品川嘉也先生の訳で「人工頭脳と自己増殖」という題で邦訳されています。図書館や古本で探して見られると読めると思います。詳しい注釈がついているので翻訳版はおすすめです。英語の論文はここにあります。これはSemantic Scholarという検索エンジンを使って探しました。これは、工学系、生命科学系にかかわらずとても有用な検索エンジンのように思われます。この検索エンジンはマイクロソフトの創設者の一人Paul Allenが設立したAllen Institute for Artificial Intelligenceが作成しているAIベースの検索エンジンです。コンピュータ科学や生命医科学の論文が収録されており、たとえばC. elegans, chondroitin synthaseで検索すると、私達の論文がトップにでてきます。

遺伝暗号の解読をBrenner先生やCrickたちが進めていたとき、モスクワの学会で全く無名の研究者が遺伝暗号の解読の成功を発表しました。その時、彼の発表会場はほとんど空で人がいなかったそうです。遺伝暗号の最初の解読結果が発表されたというのを友人のMatt Meselsonから聞いたCrickは、その無名のアメリカの科学者Marshall Nirenbergにもう一回、1000人以上が集まるシンポジュウムで同じ話をしてくれと依頼したそうです。シンポジュウムのプログラムにNierenbergの名前を手書きで書き加えたものが残っています。その場でNirenbergは二番目の遺伝暗号の解読の成功も発表したそうです。聴衆は電撃を受けたようなショックを感じたそうです。
これは、私がケンブリッジのMRC LMBのWhite先生のラボに入ったその日に、同時にポスドクにやってきたBob Goldsteinさんが書いているBrenner先生から聞いた話のまとめに載っている話です。自分の研究が抜きさられた(scoopedといいます)時のCrickの態度には学ぶべきところが多いです。Brenner先生の話を聞きに行ったときの別れの際にBrenner先生がGoldsteinさんに語った以下の言葉が印象的です。
As Brenner told me by way of parting advice: “Do the best experiments you can, and always tell the truth. That’s all.”

その他、Brenner先生に関する資料のリンクもGoldsteinさんの以下のページにありますのでご覧ください。

https://goldsteinlab.weebly.com/resources.html

 

私の口演動画の紹介を含むページを作っていただきました

以前、分子生物学会・生化学会の合同大会2017でランチョンセミナーをさせていただきました。その動画は以前紹介したようにYouTubeにでていますが、このたび、シュプリンガー・ネイチャーが電子ブックに関するインタビューや動画をまとめたページを作成してくださったと連絡を受けたので紹介しておきます。

「著者、利用者が語るその魅力 ― イーブック体験談」というページです。私の動画紹介だけのページはこちらです。他にもいろいろ面白い動画がありますのでご覧ください。

写真は近所の公園で一昨日撮影した桜です。桜がはらはらと散る光景も目につくようになり、そろそろ散った桜の花びらが道路をおおうようになってきました。

糖鎖生物学入門―2

糖鎖生物学入門―2

新元号が令和に決まりましたね。漢和辞典でという字を調べてみると、令日は「よき日」の意味ですし、令人は「よき人、美しい人」の意味、令嬢とか令徳など、の次に来る字が「よきものであり、うやまう」という用例が多いようです。平和や なごみがよきものになりますようにという意味になる、よい元号だと思いました。
今これを九大医学部図書館で書いていますが、九大医学部の桜も満開です。写真は今日の医学部キャンパスで撮影した満開の桜と、

3月26日に撮影した医学部キャンパスの桜です。

さて、糖鎖生物学入門の二回目です。九州大学で同名の講義をした時の資料をもとに全く新しく書いていきます。

糖鎖の構成要素(単糖):
糖鎖sugar chainというのは、単糖とよばれる糖がつながってできる鎖(枝分れするものも多い)です。糖鎖というのは例えばこんなものです。

この図には9種類の糖鎖があげてあります。色のついた丸や四角が単糖monosaccharideを表しており、単糖が様々につながって糖鎖ができるのです。枝分れしたりしていますので、糖鎖はとても多彩な分子構造をとることができそうですね。

単糖というのは、グルコース(ブドウ糖です)とかガラクトースとか、フコースとかN-アセチルグルコサミン(エヌアセチルグルコサミン)とかいう糖で、色々な種類があります。糖鎖について学び始めるときに最初に学ぶべき単糖の名前を下の図にのせておきます。こんな単糖があって、糖鎖をつくっているのだというのをみるのに最適な、入門者むけの単糖だけを選んであります(註1参照)。
この図にのっている単糖の名前や、記号を全部覚える必要はありません。その都度、参照することにしたらいいです。図にある単糖の中でN-アセチルグルコサミンGlcNAc(N-アセチルグルコサミンです。糖鎖生物の研究者は普通、グルックナックと読みます)とか、マンノースMan、グルコースGlc、ガラクトースGalなどの名前はサプリメントの広告とか、日常生活でよく耳にするのではないでしょうか?図には15個の単糖が並んでいますが、たいていの糖鎖はこの図の中の数種類だけを使ってつくられています。単糖の具体的な構造は以下で紹介します。

さて単糖の表記には図にみられるような、カラフルな記号表記が良く用いられています。昔はもっとごちゃごちゃした表記しかなかったのですが、パッと見て糖鎖の構造や類似性がみやすいカラフルな表記が普及しつつあります。Symbol Nomenclature for Glycans (SNFG)と呼ばれる記号表記で、以下のページにまとめられているので参照に便利です。
https://www.ncbi.nlm.nih.gov/glycans/snfg.html

リンクをクリックしてもらって図をご覧になればわかりますが、ものすごい数の単糖がならんでいます。これを全部覚える必要はありません。この図には様々な糖鎖を記述できるようにと、ヒトなどではあまり見かけない単糖も入っているからごちゃごちゃしているのです。そこで次の表には私の独断と偏見で選んだ、入門者に必要な単糖のみを残して後は消したものをあげてあります。(バクテリアにみられる糖とか、希少糖などめずらしい糖―いろんな生理機能も知られて重要性が叫ばれています―を除外しています。)上の図よりちょっと増えて20個ありますが必要に応じて参照していただければと思います。リンク付のpdfファイルもここにありますので参考にしてください。

Glc  Man  Gal 
グルコース マンノース ガラクトース
GlcNAc  ManNAc  GalNAc 
N-アセチルグルコサミン N-アセチルマンノサミン N-アセチルガラクトサミン
GlcN  ManN  GalN 
グルコサミン マンノサミン ガラクトサミン
GlcA  ManA  GalA  IdoA 
グルクロン酸 マンヌロン酸 ガラクツロン酸 イズロン酸
  Xyl  Fuc 
キシロース フコース
Kdn  Neu5Ac  Neu5Gc  Neu  Sia
ケーディーネヌ N-アセチルノイラミン酸 N-グリコリルノイラミン酸 ノイラミン酸 シアル酸(左の単糖から合成される単糖の分子ファミリー名)

青字の単糖にはリンクがはってありますので、クリックすると単糖の構造式や立体構造が表示されるページにとびます。
こうしたカラフルなSNFG表記の記号は、糖鎖科学の標準的教科書Essentials of Glycobiology 3rd editionでも使われています。https://www.ncbi.nlm.nih.gov/books/NBK310274/ 書籍版は有料ですが最新版が無料で上のリンクで公開されています。この本の図を全部パワーポイント形式にまとめたスライドも前の記事に書いたように無料で公開されていいます。糖鎖生物学の入門者には、この教科書の通読は必要ありません。せっかくネットにアップロードされていて、本の中身の検索もオンラインで自由にできます(このリンクのSearch this bookボタンを使います)ので、糖鎖学習のハンドブックとして是非活用してください。第二版の日本語訳も出ています。

単糖の構造を立体表示してみよう:PubChemによる表示
PubChemというのをご存知ですか?PubChemはNIHが公開しているオープンデータベースです(だれでも研究データをアップロードできて、だれもが利用できるというのがオープンの意味です)。PubChemを使うと様々な化学物質の情報、生理機能、特許、文献、構造式、立体構造そのほかが無料で調べられ利用できます。糖鎖を構成している単糖の構造を立体表示するにも最適のサイトですので、使ってみましょう。

SNFGのページを開いて以下のリンクから単糖のリストのパワーポイントファイルをダウンロードすると、

https://www.ncbi.nlm.nih.gov/glycans/docs/SymbolNomenclatureForGlycans_SNFG_Slides_UpdateJun2017.pptx

全部の単糖が入ったファイルがみられます。上で物凄い数の単糖のリストといったものです。各単糖にはPubChemへのリンクが張られており、スライド表示にして単糖の名前をクリックするとPubCemへのリンクがブラウザで開いて、化学式や立体構造がPubChemで表示されるのでとても便利です。いろいろPubChemで単糖を表示して遊んでみるのが入門にはよい経験になります。グルコースやガラクトースを立体表示してくるくる回して分子模型を手にとってみているように学べます。

注1:図は糖鎖構造を書くソフトGlycoEditorの入力画面をスクリーンショットしたものです。無料の糖鎖構造作図ソフトですので自分で使えそうな人は、ちょっと使ってみるのをお勧めします。詳しい使い方は次回以降に説明します。

 

京都大学の動画サイトの紹介です―福岡では桜が本日開花しました

今朝 散歩しているとき、桜の花が開花しているのを見つけて写真にとりました。福岡市近郊での写真ですが、福岡市でも桜が開花したそうです。つくしもずいぶん大きくなっていて、近所の奥さんから どっさりいただいて先週おいしくいただきました。春のはじまりです。

今日は京都大学の動画サイトを紹介します。
京都大学OCW (Open Course Ware) というサイトです。理学部や医学部、医学研究科など京都大学の様々な講義、講演のビデオやシラバスが集められて公開されています。

上のリンクからいろいろ探してごらんになるといいですが、たとえば
聴講コース 臨床研究者のための生物統計学 (AMED生物統計家育成支援事業
聴講コース 臨床研究者のための生物統計学)という医学研究科のコースには、ここをコピペしただけですが以下のような講義のビデオがならんでいます。
宇宙怪人しまりす医療統計を学ぶ」(岩波科学ライブラリーに二冊あります)の著者の佐藤先生や挿絵を描いておられるという奥様の講義もみられますので是非ご覧ください。

第1回 2017年5月25日 なぜランダム化が必要なのか?
(日本語字幕あり)
田中 司朗 特定教授 Video
第2回 2017年7月20日 リスクの指標と治療効果の指標
(日本語字幕あり)
田中 司朗 特定教授 Video
第3回 2017年10月19日 仮説検定とP値の誤解
(日本語字幕あり)
佐藤 俊哉 教授 Video
第4回 2017年12月21日 生存時間解析の基礎
(日本語字幕あり)
米本 直裕 助教 Video
第5回 2018年2月1日 メタアナリシス
(日本語字幕あり)
田中 司朗 特定教授 Video
第6回 2018年5月17日 統計家の行動基準
この臨床試験できますか?

(日本語字幕あり)
佐藤 恵子 特任准教授 Video
第7回 2018年7月12日 データマネジメントとは
(日本語字幕あり)
多田 春江 特定准教授 Video
第8回 2018年10月25日 ランダム化ができないとき
(日本語字幕あり)
佐藤 俊哉 教授 Video
第9回 2018年12月20日 交絡とその調整
(日本語字幕あり)
佐藤 俊哉 教授 Video
第10回 2019年2月21日 回帰モデルと傾向スコア 佐藤 俊哉 教授 Video

そのほか、理学部をみると、細胞内情報発信学という講義が掲載されおり森 和俊 先生(理学研究科教授)の講義がみられます。3年生向けの講義ですが、面白そうです。

その他いろいろ探して各人の興味にあった講義を聴講してみてください。

画面、動画、テキストなどデータをクリップするソフトの紹介―その2 OBS studioの使い方

デスクトップでの操作の記録や、ビデオデータの記録方法―OBS studioの使い方

(2019/2/05に追記した部分は青字で表示してあります。参考にしてください。)
勉強や研究をしているとデータベースの使い方を説明する時にマウスカーソルの動きやクリックの様子などをビデオで記録して見せたいときがよくあります。また講演会などでストリーミング放送されているものなどを記録しておきたいこともあると思います。こんな時にはいろいろ有料のスクリーンレコーダーというジャンルのソフトウエアがあるのですが、インストールするときに使用許諾がいろいろ書いてあって、このソフト、信用できるのか?裏で妙なことをしていないのか?などと不透明な部分もあって、使用に不安を覚えます。前に名前だけ紹介しましたが、OBS studio というオープンソースの無料のソフト(Windows, Mac, Linux対応版があります)を使えば無料で使えて、わりに手軽に作業ができます。OBSはOpen Broadcaster Softwareの略です。
OBS Studio – Free and open source software for live streaming and screen recordingと題して、Githubにソースコードも公開されています
ゲームの画面を録画してYouTubeなどにアップロードするために良く使われているソフトですが、十分高解像度で画面の動きなどを逐一記録できるソフトです。ゲームをやる人のための日本語の解説は多いのですが、あまりデスクトップやウインドウの録画についての日本語の解説がないみたいですので、簡単に紹介したいと思います

OBS Studioのソフトのインストール:
https://obsproject.com/ja/download
からLinux, Mac, Windows版をダウンロードしてインストールします。私はwindows10 なのでWindows版の解説となりますが、他のOSでも大差ないはずです。

ページのウインドウズ、マック、リナックスのロゴをクリックすると右下にダウンロードインストーラが表示されるのでクリックしてダウンロードします。インストールするときにゲームの記録画面の配信モードにするか、単に録画だけにするかと聞いてきますので録画だけにするのがいいと思います。また管理者モードで実行するように設定できると思うので、そのように設定します。言語には日本語を選ぶといいでしょう。メニューなどすべて日本語になります。

ウインドウを録画してみよう:
インストールして起動すると下のギャラリーの一行目、一番左の図のような画面になります。(ギャラリーは、一番上の行の左から右へと図をみて、次は下の行にうつって左から右へとみてください。)中央の黒い枠の部分に表示されている中身が録画されます。この枠内にブラウザの画面とかデスクトップとかを表示し、録画したい部分をaltキーを押しながら枠の周りの囲み線をドラッグして選択します。選択がおわったら、shiftキーを押しながらドラッグして枠内にぴったりはいるようにしたら録画準備完了です。これから以下に詳しく説明します。

ウインドウ画面の録画をやってみましょう。まずFirefoxなどのブラウザの画面からキャプチャしてみましょう。Firefoxなどを先に起動してキャプチャしたい画面を表示しておいてください。

つぎにOBS studioを起動します。ウインドウキャプチャによる録画にはシーン、ソース、ミキサー、シーントランジション、コントロールとある下のほうの画面から、ソースの部分でプラスの記号をクリックします(ギャラリーの一行目左の図)。

するとウインドウキャプチャ、ゲームキャプチャなどがならぶプルダウンメニューがでますので(ギャラリー一行目真ん中の図)、ウインドウキャプチャを選んでみてください(一行目左から真ん中そして右の図)。ウインドウキャプチャのプロパティという画面がでて(二行目左の図)、カーソルをキャプチャするかどうかなどを設定できます。OKを押してとじてください(二行目真ん中の図)。Firefoxなどが起動していると、黒い画面の中にFirefoxのウインドウが表示されると思います。

黒い背景画面にうまく録画したい場面が全部がはいっていないと思います(二行目右の図)。黒い背景画面いっぱいの部分が録画されるので、録画する画面(クリックすると四隅と上下左右の各辺の中央に赤い丸印のある部分がハイライトされますのでその画面)を黒い画面いっぱいにあわせましょう。Firefoxの表示画面を選択する方法を例に紹介します。

表示されているFirefoxの画面をクリックして、画面の四隅と、左右、上下の辺の中央にある赤い丸を押します(二行目右から三行目左の図)。この赤丸の辺で囲まれた領域が現在録画されるようになっている範囲です。これを広げて全部が入るようにします。

Altボタンをおしながら赤丸がついている画面の赤丸をドラッグすると、記録したい画面を調節することができて、録画範囲を上下左右に広くしたり、狭くしたりして変更することができます。記録したい画面が決定できたら、altキーを離し、今度はshiftキーを押しながらドラッグして、選択した録画範囲の画面を後ろの黒い画面の隅に移動します(三行目左と真ん中の図)。大きすぎて黒い画面からはみだしていたら、右隅の赤丸を選択して、shiftキーを押しながらドラッグしてやると小さくできます。右隅の赤丸をクリックして、 shiftキーを押しながらドラッグして、一番大きな黒枠のなか(この部分が録画されます)にぴったり録画したい画面があてはまるように調節します(三行目右の図)。

あとは録画条件を次に説明するように設定し、録画ボタンをおすと録画開始です。録画開始と終了をたとえばウインドウズキーぷらすF12とかにきめることも設定でできますので、ボタンをおさずにキーコンビネーションで録画することも可能です。

OBS studioの録画条件の設定
配信をしないので以下では配信の設定は行いません。必要なら設定してみてください。
では録画条件の設定法を解説します。

一番簡単な録画条件の設定法を紹介します(2019年2月5日追記)
ファイル、編集、表示などと並んでいる項目メニューから、ツールを選びます。プルダウンメニューが開き、一番上に自動校正ウイザードというのがありますのでこれを選んでください。
デフォルトでは「配信のために最適化し、録画は二次的なものにする」にチェックがはいっています。チェックを外して「録画のために最適化し、配信はしない」にチェックを入れてください。次へをクリックすると、映像設定メニューがでてきて、基本(キャンバス)解像度―現在の値を使用というプルダウンメニュー、そしてFPS―60または30のいずれか、可能なら60を優先というメニューがでます、これらは変えてもいいですが普通はこのままで、次へを押します。するとテストがはじまって、プログラムがあなたのパソコンに最適の設定を選んでくれます。録画エンコードとか、品質などが選ばれて表示されますので設定を適用のボタンを押して終了です。この自動校正ウイザードを使えば、一番録画失敗の少ない設定になるのでおすすめです。自分でいろいろ設定したい人は以下もご覧ください。録画したムービーをどこに保存するかや、録画フォーマットなどは以下を読んで設定してください。(2019年2月5日追記終了)

手動での録画条件の設定方法;
ファイル、編集、表示…などと並んでいるメニューから、
ファイル→設定→出力とすすんで、出力モードをプルダウンで「詳細」にします。
左から配信、録画、音声、リプレイバッファーというタブがありますので、録画を選びます。
種別は標準
録画ファイルのパスは、できた録画ファイルをいれるフォルダの場所を決める部分です。右の参照ボタンなどを使って、自分の好きなフォルダを選んで設定します。
録画フォーマットは プルダウンからいろいろ選べますが、私が試行錯誤した結果は、ts やmkvがおすすめです。(ほかに動画の形式としてはflv,mp4, mov,m3u8が選べます。flvがデフォルトになっています。) 動画の形式ではmp4やmkvなども試しましたが、私のパソコンでは、録画してできたファイルを再生すると うまく録画できておらず、音声は進むのに画面が止まったままの部分があちこちにできてしまうこともありました。私のパソコンで試した時は、ts形式を選ぶとCPUへの負担が少なくなるのでエラーが回避できました。mp4などでエラーがでるときは試してください。たしかOBS Studioはマルチプロセッサーを利用していないはずです。できあがったtsファイルやmkvファイル、flvファイル、mp4ファイル、movファイルなどは前に紹介した動画プレイヤーのMPC-BE x64で再生可能です。

以下は私の使っている録画の部分の設定です。


録画フォーマットはts、
エンコーダは私はQuickSync H.264を選んでいます。プルダウンメニューで表示される
(ストリームエンコーダを使用)(QuickSync H.264), x264などから素材に応じて選択します。利用できるハードウエアエンコーダがパソコンにないときはストリームエンコーダとx264しか表示されません。
出力をリスケールするにはチェックはいれていません。
カスタムマルチプレクサ―の設定もなし。

ターゲットの使用法は、qualityをプルダウンから選択。(balanced,speedも選べますのでうまく録画できないときは試してみてください。自動設定では私のパソコンではbalancedが選ばれていました―2019/2/05追記)
プロファイルはbaselineにしています。他にhigh, mainも選べます。
キーフレーム間隔は3、
非同期深度は4、
レート制御はCBR、
ビットレートは2500としています。

次は映像です。設定画面の左側、一般、配信、出力、音声、映像、ホットキー、詳細設定というアイコンの中にある、映像アイコンをクリックしてください。
基本(キャンバス)解像度は、1366×768などご自分のパソコンのモニタの解像度に設定します。この数値はカーソルをあわせてクリックした後適当な値に変更できます。
出力(スケーリング)解像度は、基本解像度と同じでもいいですが、CPUが追い付かずに録画に不具合がでるときは、小さめに設定するといいと思います。1280×720とか、ご自分のモニタの解像度の選択枝から選ぶのがいいでしょう。(910×512が自動設定ウイザードでは設定されていました―2019/2/05追記)
縮小フィルタはバイキュービック、ランチョス、バイリニアから選びます。ランチョスが解像度がよくて、バイリニアが一番悪いのでランチョスから試してみてください。

FPS共通値は毎秒のフレーム数ですので、プルダウンから選ぶか直接入力して30とか29.97とかでいいでしょう。


あとは録画のホットキーを設定しましょう。
映像アイコンの下にある、ホットキーアイコンをクリック、開く画面で、録画開始と録画終了のキーをきめます。私はWindowsキー+F12にしています。

以上で録画の設定が終わりです。他の設定はデフォルトのままにしておいていいでしょう。右上のx印をおしてウインドウを閉じる時に「保存していない変更があります。変更を保存しますか」ときいてくるので「はい」をクリックして終わりです。

Firefoxなどでムービーを再生しておき、録画したい部分を設定して、メニューの録画開始、あるいは設定したホットキーをおしたら録画が始まり、もう一回同じキーをおすと録画終了します。カーソル操作を記録したいときは、ソースのウインドウキャプチャを右クリックし、プロパティでカーソルをキャプチャにチェックをいれます。

参考:
この条件でも録画に失敗することがあります。そこで他の録画条件設定についても簡単に触れておきます:エンコーダをソフトウエアエンコーダである、x264に設定した場合(これでもだめならストリームエンコーダにするとうまくいく時もあるかもしれません)下のほうにレート制御、ビットレートなどの選択画面がでてきます。
CPU使用のプレセットは、デフォルトがveryfastですが、CPU使用率を下げるにはsuperfastやultrafastを選ぶといいようで、私は一番CPU使用率の低いultrafastを使っています。

動画のことは素人ですので、もっとうまい設定があるかもしれません。いろいろ試してみてもっとうまくいく方法があれば教えてください。

新しい研究成果の発表の場ができています―microPublication Biologyの紹介です

福岡は暖冬のようです。例年になく早く水仙、椿が咲きはじめ、梅の開花も例年より随分早かったそうです。夜になるとオリオン座が昇ってきてとても綺麗な冬です。写真はiPhoneでオリオン座を撮影して、画像処理で見えるようにしたものです。結構感度がいいんですね。周辺の星々もちゃんと写っていました。

最近、こんな雑誌から査読依頼がきました。microPublicationといいます。

これはWormbaseのDaniela Raciti, Karen Yook,Todd Harrisさんたちが始めた研究成果の全く新しい形式での発表の場です。
”As you may know, WormBase recently launched a novel publication platform microPublication, that allows researchers to share high quality but traditionally unpublished stand-alone data and datasets.”

とDanielaさんからいただいたメールにありました。今までは論文にうまく入れ込めなずに発表できなかった研究成果、単一の論文にできなかったような優れた研究成果(データやデータセット)や取得した変異体などについても発表できて、引用できるようになるというものです。モデル生物の線虫C. elegans、ショウジョウバエ、カエルXenopusのコーナーがあり、もうすぐゼブラフィッシュやGene modelというのも追加されるようです。
Expression data, Genotype Data, Phenotype data, Genetic screens, New Methods, Software, Database updates, Integrationsなどのカテゴリーで投稿しますが、これにうまくはいらないカテゴリーのデータでもOKです。

単独では論文にできないけれど発表しておきたい研究成果があれば、図か表の一枚分くらいの程度で引用論文を含めて公開できます。

FAQのページには以下のように書いてあります。
How do you differ from traditional journals?
The major goal of microPublication Biology is to rapidly place research findings into the public domain.  Thus unlike other journal platforms, we publish single high quality research results, independent of perceived impact, which can be new research findings, negative results, reproduced/replicated results or “unpublished observations” from prior publications.  Single results can stand alone, and do not require a narrative story to placate editors. Placing such findings into the public domain not only advances the scientific endeavor, but also gives credit to the individual(s) that did the work.

このjournalの主な目的は、研究成果をすばやくpublic domainに入れることだとあります。現在のところarticle processing feeは無料、将来もsubmissionは無料だそうです。microPublicationでは、いままで雑誌に掲載できなかった否定的な結果negative resultsや、追試結果、以前の論文でunpublished resultsと書いた実験結果などの投稿もOK で、普通の論文のようにストーリーの中にいれることなく、単独で独立して発表できるという、大変チャレンジングな試みです。データを独占せず共有するという線虫コミュニティの気概を感じさせるこころみですね。同じようなものにPLosCurrentsというのがあったそうですが、これは立ち消えてしまいました。
公開例は、たとえば以下をご覧ください。

https://www.micropublication.org/expression-data.html

https://www.micropublication.org/genotype-data.html

査読者名も表示、非表示をレフリーが選べるようになっています。また公開したmicroPublicationにはDOI.が割り振られ、引用可能になります。オープンアクセスです(CC BY 4.0)Europe PubMed Centralにインデックスしてもらうようになるはずとのことです。
私も投稿してみようかと思っています。

Oumuamuaは宇宙人の探査機か?プレプリントサーバーとその活用法の紹介その5

OUMUAMUAというのを聞いたことがありますか?昨年発見された、人類がはじめて確認した太陽系外からの侵入してきた物体で、宇宙人がつくった宇宙探査機ではないかという説がささやかれていたものです。これに関する多くのプレプリントがプレプリントサーバーにアップロードされていますので、興味のある方は読んでみるのをおすすめします。Cornell大学のプレプリントサーバーarXiv.orgにアクセスして、oumuamuaで検索してみてください。50ほどのプレプリントがヒットします。

2017年10月にみつかったOumuamuaは、見つかった時すでに地球からは遠ざかっており、毎秒26 km/sという高速で太陽系に侵入して通過していったのですが、形がみえるほどの高解像度の望遠鏡はなかったので、望遠鏡ではその姿はとらえられておらず、光りかたなどからは幅:長さの比が1-5~10とみつもられているそうです。その起源は太陽系のオールトの雲由来ではなく、また近くの恒星系の外辺にある星(たとえばαケンタウリ)なの周辺にあるオールトの雲由来とも考えられないそうです。とても遠い宇宙からの来訪者のようでこれが彗星か小惑星かなど皆が注目して観測したそうです。光の反射などから推定されたその形は通常の小惑星や彗星のものではなく、とても明るい表面をもつ物体のようで宇宙人のつくった探査機かもしれないとうわさされていました。形の想像図はヨーロッパ南天天文台(ヨーロッパなんてんてんもんだい、European Southern Observatory、略称:ESO)の機関誌The Messenger の173に載っているRendezvous with `Oumuamuaという記事のp15をご覧ください。プレプリントサーバーの論文にもありますが、探査機なら電波を出しているのではないかということで、FM波長で電波が放出されていないかの観測がつづけられたそうですが、電波は検出できなかったとのことです。ただ面白いのは、太陽の重力だけでは説明できない、異常な加速がみられたとのことで、これがもし彗星などなら太陽の熱で氷がとけて尾をひいて加速したと思われるのですが、尾の形成もなくただ原因不明の加速がみられたのでした。このブログで紹介しているプレプリントサーバーをご覧になるとそれを説明する論文がだいぶ前に掲載されていたのがわかります。ハーバード大学のLoeb先生たちの論文で、Oumuamuaの加速は、日本のイカロスで実用化されたsolar sail(太陽帆)によって引き起こされたとすると説明が容易であるというのです。このプレプリントは最近、査読にとおってAstrophysical Journal Lettersという雑誌に発表されて、最近新聞やネットニュースで大きくとりあげられました。
著者はさらに多くのプレプリントをアップロードしていますが、その中で最近Scientific Americanのブログにも公開されたプレプリントは著者の考えをわかりやすく書いていておすすめです。

ブログには埋め込みできないようですが、以下の動画に Loeb先生のインタビューがあります。
https://www.youtube.com/watch?v=WBekHr6nrU8

もしOumuamuaが宇宙人の探査機のようなものだったとしたら、それを追いかけて確認するというのも将来可能になるかもしれません。しかしもっと簡単なのは太陽と木星の重力にとらえられている宇宙人の作った人工物を探すことではないだろうかと書いています。太陽と木星の重力場は宇宙に張られた網のようなもので、この重力網にとらえられているであろう人工物(宇宙人の作った探査機など)を探すのが、電波で宇宙人からのメッセージを探すより手っ取り早いのかもしれないというわけです。Loeb先生たちはそのような物体の頻度を見積もる論文も最近プレプリントサーバーにアップしているようです。みなさんもプレプリントサーバーをいろいろ見て、活用してみてください。

Oumuamuaの論文は、アーサー・クラークの書いたRendezvous with Ramaという作品(「宇宙のランデヴー」という題で邦訳がでています)のラストシーンが思い起こさせます。またScientific Americanの記事のプレプリントを読むと、野尻抱介さんの「沈黙のフライバイ」のラストも思い起こされました。

テキストデータをどんどん蓄積していくソフトの紹介その3―詳しいTextclipperのclipfileツールの使い方です

前に紹介したTextClipperのクリップツールの一つclipfileを作者の吉村隆樹さんがバージョンアップしてくださいました(2018/11/28)。前のバージョンを使っている方は新しいバージョンにしてください。ここからバージョンアップ版をダウンロードして解凍してできたclipfile.ctaファイルをtextclip7962フォルダ中に上書き保存するだけです。以前のバージョンでは保存日時の年号が正しく入らなかったのですが、今回のバージョンアップで2018がちゃんと入るようになりました。吉村さんによると典型的な2000年問題だったそうです。バージョンアップをお願いして数時間で新バージョンを作ってアップロードしてくださいました。吉村さん、どうもありがとうございました。

以下では先日紹介したTextClipperのクリップツールclipfileの使い方をもうすこし詳しく紹介しておきます。
1)まずTextClipperをここからダウンロードしてダウンロードしたzipファイルを解凍してください。解凍してできたフォルダがtextclip7962という名前になります。このフォルダはProgram Filesのフォルダには入れないでください。入れると動きません。このプログラムを使用するには7-zip32.dllが必要です(バックアップ時)のでここから取得してください。

2)ここまでの作業でtextclip7962というフォルダができました。バージョン番号がフォルダ名になっていますね。TextClipper本体はこのフォルダの中にあるtextclip.exeです。これをダブルクリックするとTextClipperが起動します。このソフトの使い方については

http://www.hi-ho.ne.jp/makoto_watanabe/tc/index.html などをみてください。

では次にclipfileというクリップツール(TextClipperの機能拡張のようなものです)をインストールしましょう。これはブラウザにかぎらずMS WordやAcrobat Readerで表示しているpdfファイルなど、任意のソフトで表示しているテキストを選択し、それを規定の名前のテキストファイルTc_txt.txtに次々と保存できるツールです。
一つのテキストファイルに、保存日時と出典、および保存時に追加できる任意のキーワードとともに保存してくれます。新しくクリップしたテキストはもとのテキストファイルの末尾に追加されます。これを使うと、ネットサーフィンで見つけたテキストをキーワード付きでテキストファイルで保存できますので、あとで秀丸など適当なテキストエディタでgrep検索して簡単に探し出すことができます。保存するときに将来検索の時に思いつきそうな、選択したテキストには含まれないキーワードを追加しておけるので、後々の検索時に探しもれが少なくなるのもこのツールの便利な点です。

3)では、clipfileを使えるようにしましょう。
以下のurlからクリップツールのclipfileを選んでダウンロードします。
http://takaki.la.coocan.jp/freesoft/textclipper/
ここをクリックしてダウンロードしてもいいと思います。clipfile.zipがダウンロードできますので、前に紹介した7-Zipなどのソフトで解凍します。解凍してできたclipfile.ctaというファイルを上の2)でできたtextclip7962のフォルダにドラッグして移動させます。これでclipfileを使う準備ができました。

4)TextClipperを起動して、clipfileを使ってみましょう。
まずTextClipperを起動します。

上の図のヘルプの左にある、環境設定を選び、

開いてでてくるメニューでクリップツールキーをAlt+cなど好きなキーの組み合わせに設定します。

これでAlt+Cを押したらクリップツールが動くように設定できました。

5)では、実際にテキストを適当に選んでスクラップブックのようにテキストファイルに保存してみましょう。
まずTextClipperを起動しておいてください。そのあと、ブラウザなどで適当なサイトを訪れて、保存したいテキストを選択し、さっき決めておいたクリップツールキー(Altをおして同時にCを押す)を押します。すると下の画像のようにポップアップメニューが開いて一番上に「TextFileに追加」がありますのでこれを選択します。
するとキーワード入力のポップアップ画面が開きますので、あとで検索に便利なキーワードを入れます。複数入れても構いません。自由に入力しましょう。

保存ボタンをおして完了です。Tc_text.textという名前のファイルに上の選択した部分が出典の一部、日時、キーワードとともに保存されているはずです。

ではうまく保存できたかどうかをtextclip7962フォルダ内にできているTc_txt.textというファイルを開いて確認しましょう。出典、日付、キーワード、クリップしたテキストの順に保存されていたら成功です(下図参照)。

上の例では、私の去年の学会でのランチョンセミナーの講演動画がでているYouTubeのページにあるテキストをクリップしたテキストの後に、今しがたクリップした論文のテキストが追加されています。N型糖鎖、先天性グリコシル化異常症などとあるのは、さきほどつけたキーワードです。その下にクリップしたテキストが保存されているのがわかります。

このように、ちょっと気になったテキストを、どんどんクリップして蓄積しておき、あとで秀丸エディタなどのテキストエディタのgrep検索機能で検索します。grep機能についているタグジャンプ機能を使えば該当するクリップしたテキスト全文のある場所に容易にジャンプすることができます。テキストファイルのサイズが大きくなってきたら、Tc_text.textファイルの名称をTc_text1.txtなどすきな名前に変更します。次にclipfileツールでクリップしたら、自動的にまっさらなTc_txt.txtファイルができてそこに保存されますので、またゼロからクリップがはじめられます。

こうしてできた大量のクリップファイルを一斉に grep検索したら何年にもわたって蓄積したデータを一瞬で検索できて便利です。データはテキストファイルですので、加工も活用もきわめて簡単です。英語論文の例文集の作成、アイデアメモの作成などいろいろな用途につかえるすばらしいツールですので是非活用してみてください。

写真は福岡で撮影したイチョウです。とてもきれいに黄葉しています。秋も深まってきました。

 

AntConcの使い方と活用法その2―自分専用の英語論文例文集(コーパス)の作り方pdftotextの使い方

前回紹介した英語論文用の例文集に使えるAntConcはテキストファイルやhtmlファイルを扱いますが、最も身近な英語の例文集の素材はpdfファイルだと思います。そこで今回は英語の例文集の作成のために重宝する、「pdfファイルをテキストファイルに変換する方法」を紹介します。AcrobatやFoxit Readerなどでpdfを開いて、textファイルとして保存する方法は、pdfファイルが数百、数千ある場合は手作業では対応できません。こんな場合は、Acrobatなどで複数のpdfファイルを一つのpdfファイルに結合してからtextファイルに変換するという方法もありますが、そんなめんどうくさいことをしなくてもpdftotextという無料ソフトを使えば一括で複数のpdfファイルをそれぞれ別のテキストファイルに変換でますので、やってみましょう。

まずpopplerというpdfを扱うプログラミングライブラリ(その中にpdftotextが入っています)をお使いのWindows, Mac, linux用のものを選んでダウンロードしてインストールします。linuxではsudoコマンドでpopplerをダウンロードしてインストールできますし、Mac版もアプリストアからダウンロードできるはずです。私が使っているWindows 10やWindows 7のPCの場合については、ここに詳しいインストールの仕方が書いた記事がでているのを見つけました。大変丁寧に書いてありますのでそのよく読んでインストールしてください。私もこの記事のとおりにインストールして利用しています。

私はCドライブ直下にpoppler-0.68.0というフォルダ(ダウンロードしたPopplerの圧縮ファイルを解凍(解凍ソフトは註1をみてください)してできるフォルダ名のままコピーしただけです)を作り、その直下にあるbinフォルダ(binaryフォルダの意味で、実行ファイルが入っているフォルダのことです)に自分の必要なpdfファイルを集めてテキストファイルに変換しています。shareフォルダの下にはpopplerとrenameしたデータファイル(上述のホームページにあるリンク
https://poppler.freedesktop.org/poppler-data-0.4.9.tar.gz からダウンロードしたpoppler-data-0.4.9.tar.gzファイルを解凍したもの。註1参照)をおいてください。あとは以下のコマンドを記述したバッチファイルをテキストファイルエディタで作ることが必要です。

for %%i in (*.pdf) do (pdftotext %%i %%i.txt)

このコマンドをテキストファイルエディタにうちこみ、できたファイルに適当な名前(pdf2txt.batとかすきな名前)をつけて保存します。保存のときデフォルトではテキストファイルで保存されれウため、pdf2txt.txtになりますのでファイル名の変更でpdf2txt.batにするか、保存時に.batで保存してください。保存場所はpdftotextのあるフォルダ(上の例ではbinフォルダ)にします。

あとは、変換したいpdfファイルを上のbinフォルダにコピーして、コマンドプロンプトでpdf2txt.batファイルを実行するだけです。日本語のファイルも英語のファイルもともにテキストファイルに変換されます。(invalid font weightというエラーが出るかもしれませんが無視してよいようです。不都合があったら教えてください。)

以下はコマンドプロンプトが初めての人むけの簡単な説明です(註2参照)。

バッチファイルというのはwindowsのコマンドプロンプト(windows7では「すべてのプログラム」の部分をみていくと、アクセサリフォルダの下にあります。windows10では下の図の左端の写真ようにシステムツールの下にあります。)でファイル名を入力してエンターを押すと、ファイル内に書いてあるコマンドを逐次実行するというものです。

矢印のコマンドプロンプトをクリックして起動するとき右クリックで、管理者として実行を選んで起動しておくと管理者としてログインしていないときにおこるトラブルをさけられますので注意してください。

今回のバッチファイルは以下のような内容で動きました。

for %%i in (*.pdf) do (pdftotext %%i %%i.txt)

意味は、iという変数にpdfのファイル名をいれ、それにpdftotextコマンドを実行してpdfのファイル名(%%i)のついたテキストファイル(%%i,txt)を作るという操作をフォルダ内にあるすべてのpdfファイル(*.pdfというワイルドカード*を使っている部分で、任意のファイル名のpdfファイルを表しています) がなくなるまで一個ずつ繰り返す(for    doの部分)というものです。

コマンドプロンプトを上に説明したように起動すると、黒いバックに白い字の画面が開きます(上の真ん中の図)
自分の今いるディレクトリ(フォルダ)の名前が表示されています。これから目的のpopplerのフォルダを探すとき、たとえばCドライブの直下にpopplerのフォルダがあるなら、コマンドプロンプトでcd ..(cdとうって、ピリオドを二回うちます)というコマンド(これはディレクトリを上に登って行くコマンドです)を何回かうってディレクトリをC:¥>にします。上の図の右端の図。
dirとうつとディレクトリやファイルの一覧が表示されます。
popplerのフォルダへ移りたいのでcd poppくらいまでをタイプしてあとはタブキーを押してください。タブの自動補完機能でcd poppler-0.68.0と自動入力されます。(このタブ補完の機能はlinuxで重宝するのですがWindowsのコマンドプロンプトでも利用できますので活用してください。) enterキーを押すとC:¥poppler-0.68.0>と表示されてディレクトリを移動したのがわかります。ここでdirとうってenterを押すとディレクトリ内のファイルとフォルダが表示されます。プログラムファイルのあるbinのフォルダ(ディレクトリ)があるのを確認してください。cd binとうってenterを押すとbinのディレクトリに移動します。C:¥poppler-0.68.0\binとなっていたら成功です(上の右端の図)。再びdirとうってenterをおします。これでこのbinフォルダ内にあるすべてのファイルとフォルダが表示されます。あとはそこにコピーしてあるバッチファイルpdf2txt.batを実行する(コマンドラインにpdf2txtとうってenterを押す)と、自動的にファイル名のついたtxtファイルができあがります。

こうして一括でpdfファイルをテキストファイルに変換したら、あとはこれらのテキストファイルをAntConcに読み込んでコーパスとして論文を書くときに参照すればいいわけです。

もちろんテキストファイルですから、テキストファイルを一括検索して、検索結果にタグジャンプして参照できるgrepコマンドも使えます。適当な、grepコマンドが使えるエディタ(たとえば有料ですが秀逸なエディタでおすすめの秀丸エディタ)でpdfの内容を串刺し検索するのもよいですね。pdfgrepというソフトもあって、これを使えばpdfファイルのままでgrepができるそうです。これはまだ使っていません。windows版をダウンロードしてさきほどのbinファイルにコピーしておけば、コマンドプロンプトで使えるのですが、linux版とちがって検索語がハイライトしなかったりしてまだ使いこなせていません。興味のある方は使ってみてください。

註1:圧縮ファイルの解凍には私は7-zipを使っています。たいていの圧縮解凍はこれでできます。
註2:パスの通し方とかは説明しないでpdftotextを使う方法を説明していますので、良く知っている方はパスを通して適当な場所にpdftotextをおいて使ってください。