夏のおすすめ本2020―その1 Rに関するおすすめ本2冊

毎日猛暑がつづきますが皆さんお元気の事と思います。今日から数回にわたって、面白そうな本、役に立つ本などを紹介していきたいと思います。第一回目はR(アール)の本です。今や統計解析にソフトの定番のプログラミング言語Rは無料で使える素晴らしいソフトですが、統計解析だけではなくゲノム解析にも活躍しているソフトです。昔はグラフィカルインターフェースがなかったのですが、今ではRのパッケージのR commanderや日本の神田善伸先生(自治医科大学)が開発されたEZR(イージーアールと読みます。これも大評判になってRのパッケージになりました)がありますので、グラフィカルインターフェースでRを使うことができて、初心者にもやさしいソフトとなりました R commanderはRをインストールしたあと、パッケージとして追加インストールして使います。EZRはR commanderの追加プラグインになっています。インストールするとどちらも日本語で使えます。EZRを中心に使いたい場合は開発者の神田先生のサイトからダウンロードして使うのもおすすめです)。また、RStudioというRの統合開発環境ソフトを使えば、Rをもっと便利にスムーズに利用することができるようになったので、Rはますます便利で使いやすくなっています。インストール法については以前の記事二つがありますので、ここここを参照してください。

今日紹介するのは、EZRの使い方を、その開発者の神田先生が解説した本です。

EZRでやさしく学ぶ統計学 改訂2版〜EBMの実践から臨床研究まで〜神田善伸 著

これ一冊あれば、生物系医学系の普通の統計解析はすべて日本語のプルダウンメニューを使ってできます。私も論文のデータ解析にはこの本を主に参照しています。大変役立つ本ですので、是非一冊購入して統計解析の勉強や研究に活用してください。私は第一版を購入して使っていますが、すでに第二版がでているほどに売れている本のようです。これがちょっと難しそうという方むけに、神田先生はもうすこしやさしい初心者向けマニュアルも書かれています。

初心者でもすぐにできるフリー統計ソフトEZR(Easy R)で誰でも簡単統計解析 という本です。立ち読みしてみて、まずこちらを買うのもありかもしれません。

Rはバイオインフォマティクスや次世代シークエンサーのデータ解析、ゲノム解析にも大活躍しているソフトです。最近英語の本ですが、こんな本が公開されています。
Computational Genomics with Rという本です。
紙の本や電子ブックはこの秋にでるようですが、Rをつかって出力されたhtml版が上のリンクから無料で読めます。バイオインフォマティクスの専門家による本ですので、役立ちそうです。
著者は日本にもいたことがある人で、Rのバイオインフォマティクス解析用のBioconductorの多くのパッケージを開発している方たちです。著者紹介によると、この本のほとんどを書いた方は、Dr. Altuna Akalin wrote most of the book and edited the rest. Altuna is a bioinformatics scientist and the head of Bioinformatics and Omics Data Science Platform at the Berlin Institute of Medical Systems Biology, Max Delbrück Center in Berlin.(以下略)ということで、ドイツのベルリンにあるバイオインフォマティクスとオミックスデータセンターのヘッドだそうです。まだ私も読んでいないのですが、勉強してみたい本ですので紹介しておきます。

写真は、散歩の途中で撮影した山百合と葛の花です。山百合の間によくみると葛の花が咲いているのがわかります。

オープンアクセスの電子ブックをダウンロードしてみよう―Pythonや制御理論や統計学の教科書、力学の教科書やFelix Kleinについての本などなど

以前の記事に書きましたが、分子生物学会のランチョンセミナーでオープンアクセスの電子ブック(無料で読める電子ブック)を探せるサイトDOAB(Directory of Open Access Book)を紹介しました。リンク集にもリンクをのせてあります。今日、ちょっとのぞいてみるといろいろオープンアクセスの本が新しく公開されていました。検索窓にPythonと入れて検索してみると、Pythonに関連した本がずらずらとでてきます。本のLicenseの下にある
Abstract | Keywords | Free access | Buy the book |の部分のFree accessのリンクをクリックすると本がダウンロードできます。いろいろな本がありますがPythonを学ぶにはIntroduction to Scientific Programming with Python
Authors: Dr. Joakim Sundnes in Simula SpringerBriefs on Computing。Springer Nature (2020) とか
Programming for Computations – Python
Authors: Linge, Svein — Langtangen, Hans Petter
Book Series: Texts in Computational Science and Engineering, Springer Nature (2020) などは面白そうです。
また神経科学へのPythonの応用を紹介している本で
Python in Neuroscience
Authors: Eilif Muller — James A. Bednar — Markus Diesmann — Marc-Oliver Gewaltig
Book Series: Frontiers Research (2015)Publisher: Frontiers Media SA
も神経科学に興味がある人には面白いのではないでしょうか。

検索窓にソフトウエアのMathematicaをいれて検索すると、こんどは制御理論の教科書がでてきました。Mathematicaを使って制御理論を学ぶ教科書のようです。
Control Theory Tutorial: Basic Concepts Illustrated by Software Examples
Author: Steven A. Frank Book Series: SpringerBriefs in Applied Sciences and Technology, Springer Nature (2018)

ほかにもいろいろ面白そうなオープンアクセスの本があります。Browseボタンを押して色んな本をタイトル、分野、そして出版社別にながめることもできます。Publisherで検索すると、各出版社から何冊くらいオープンアクセス本がでているかがわかります。とても多くのオープンアクセス本をだしているSpringer Nature社の面白そうなタイトル(2019-2020年発行)を以下にならべておきますので、検索してみてください(直リンクははってないので、上のサイトでタイトルで検索するなどしてみてください)。科学だけではなくて哲学、社会学の本とかもあります。たとえば王陽明の紹介本とかもありました。

Make Life Visible
Prof. Yoshiaki Toyama, Ph.D. Atsushi Miyawaki… (2020) 生物科学の可視化の技術の本のようです。

Statistical Population Genomics
Julien Y. Dutheil in Methods in Molecular Biology (2020)

Gene Drives at Tipping Points
Precautionary Technology Assessment and Governance of New Approaches to Genetically Modify Animal and Plant Populations
Prof. Dr. Arnim von Gleich… (2020) ジーンドライブについての本

Data Journeys in the Sciences
Dr. Sabina Leonelli, Dr. Niccolo Tempini (2020)

The Amazing Journey of Reason
from DNA to Artificial Intelligence
Mario Alemi in SpringerBriefs in Computer Science (2020)

Introduction to Scientific Programming with Python
Dr. Joakim Sundnes in Simula SpringerBriefs on Computing (2020) これは最初に紹介した本です。

The Pangenome
Diversity, Dynamics and Evolution of Genomes
Dr. Herve Tettelin, Duccio Medini (2020)

Bioimage Data Analysis Workflows
Dr. Kota Miura, Dr. Nata?a Sladoje in Learning Materials in Biosciences (2020)

Good Research Practice in Non-Clinical Pharmacology and Biomedicine
Editors :Anton BespalovMartin C. MichelThomas Steckler 薬学や医学での研究の再現性、正しいサンプリング、実験デザインなどを教えてくれる本です。

The Everyday Life of an Algorithm
Authors: Daniel Neyland アルゴリズムのやさしい紹介の本。

Principles of Mechanics
Fundamental University Physics
Salma Alrasheed in Advances in Science, Technology & Innovation (2019) 物理の力学の本

The Ethics of Vaccination
Dr. Alberto Giubilini in Palgrave Studies in Ethics and Public Policy (2019) ワクチン接種の必要性を議論している本

Understanding Statistics and Experimental Design
How to Not Lie with Statistics
Prof. Dr. Michael H. Herzog… in Learning Materials in Biosciences (2019) 統計学と実験計画法の教科書

The Legacy of Felix Klein 数学者フェリックス・クラインについての本
Prof. Dr. Hans-Georg Weigand… in ICME-13 Monographs (2019)

The Brownian Motion
A Rigorous but Gentle Introduction for Economists
Authors;Andreas Loffler, Lutz Kruschwitz 経済学者のためのブラウン運動の理論の教科書。

写真は5月ごろに撮影したバラの花をホテルにしているアマガエルです。昼間はこのバラの花の部屋の中でじっと休憩していますが、夜になると外にでかけて大きな声で鳴きます。今も外はカエルの声がにぎやかです。

コロナ感染拡大にともない公開されている無料で使えるサービスのいろいろ(4/18追記あり)

今日はコロナで外出できなくなっている人のために公開されている、面白そうな無料サービスをいくつか紹介します。

Ohmshaからマンガでわかる免疫学という本その他が無料公開されています。4月19日まで無料公開ということなので急いでご覧ください。(無料公開は終了しています)自然免疫とは何かとか、コロナウイルス感染の報道を理解する上での基礎知識です。(九大の人はMaruzen eBook Libraryにログインしたら読めますし、50ページづつのダウンロードも可能です。)同じサイトに公開されている本には、算数の本とかコスプレ入門とかもあって面白そうです。

英語で書かれた線形代数の教科書Linear Algebra Done Right (Sheldon Axler著、Springer)が演習問題解答やスライドなども含めて無料でダウンロードできます。本はSpringerのコロナ感染拡大にともなう無料公開措置で7月末までここからダウンロードできるそうです。https://link.springer.com/book/10.1007/978-3-319-11080-6 また、スライドやビデオは、ここにあります数学のお好きな方はこの本はおすすめです。物理や化学の人にはこんなのはどうでしょうか。Linear Algebra and Analytic Geometry for Physical Sciences (Giovanni LandiとAlessandro Zampiniの共著。)これもSpringerが公開してくれている本です。もっといろいろな本がコロナ流行にともないSpringerから公開されています。リストは下のほうに載せてある九大の公開しているリンク集からダウンロードできます ( 九大図書館のリンクは今日ー4/18ーみたところ消えていたので下のほうにあるリンクあるいは、こちらをご覧ください。日本語でのアナウンスはここです。リンク集のExcelファイル中に本の名前とダウンロード用urlなどがのっています)。

私は一昨日、下のリンク集にあるサービスで大図書館にログインして使えるサービスAcademic Video Online(授業や自学自習に役立つ質の良いビデオコンテンツを61,000件以上収録している、ストリーミングビデオのデータベースです。2020年6月30日まで特別トライアル)というのを試してみました。いろんな教育関係のビデオがあるのですが、BBCの番組が多いのに気づき、では昔BBCのHorizonという番組でやっていたというドラマLife Storyがないかなと探してみました。ありました!これはDNAの二重らせん構造を解明した科学者たちの競争と研究の様子をかなり忠実にたどった感動のドラマです。昔、数万円でビデオが売られていたのですが高くで買えませんでした。無料トライアルの今ならその番組が英語字幕付きでみられます。契約している大学も多いと思いますので、アクセスできる方は是非ごらんください。舞台はLondonとCambridgeですが、私がいたCambridge大学の研究室は昔Watson, Crickが研究していた旧キャベンディッシュ研究所の隣にありました。ワトソンが音連れたことがあるプレハブもあって、のぞいていたのを覚えています。この番組は Crickによるとかなり忠実に史実をなぞっているとのことで、Watsonの二重らせんという本を読むより、最初このドラマをみるほうが感動が深いのではないかと思いました。ブラッグとロザリンド・フランクリンが、完成した二重らせんモデルを身にやってきて二人で語り合う最後の場面は感動です。(写真はケンブリッジのMRC分子生物学研究所のノーベル賞関係展示にかざってあったWatsonとCrickが作ったDNAの模型です。ドラマにもこの模型が登場します)
この番組はロザリンド・フランクリンの協同研究者で彼女を良く知るAaron Klug(MRC LMBの所長だった方で、ノーベル賞受賞者)も作成に協力しており、実際こんな会話がかわされたのかもしれないと思われます。Klugさんはロザリンドフランクリンは本当に偉大な科学者だったと語っていたそうです。MRC LMBには彼女とKlugさんが研究していたタバコモザイクウイルスの模型が飾ってありました。(下の動画ですがAcademic Video Onlineの動画リンクなので、認証失敗とかの表示がでて絵がでないときは無視してください。ログインできる人はログインして鑑賞してください。同じ動画はDailymotionにもだれかがアップロードされていますが、字幕抜きなので聞き取りにくいかもしれません。Part 1とPart 2にわかれているようです)

Life Story

ブラッグ:模型を前にしてフランクリンにIt looks as if they have got it right.
フランクリン:Yes.
ブラッグ:I’ve given my life to crystallography.I never thought I’d live to see this.
フランクリン: It’s your work too.
ブラッグ:And yours.
フランクリン:And mine.
ブラッグ:I know how you must feel. I’m sorry.
フランクリン:I might have seen it, but I didn’t. I see it now.
ブラッグ:This race, this winning and loosing, it’s not the way I was taught to do science.
フランクリン:It doesn’t matter. モデルをあおぎみて、This is what matters.
Life is the shape it is for a purpose. When you see how things really are, all the hurt and the waste falls away. What’s left is the beauty.

様々な大学の図書館のホームページには、自宅から使える様々な便利なサイトが載っていると思いますが、コロナ感染拡大にともなってさらに新しいサービスが無料で使えるようになっているので是非大学の図書館のホームページを見てください。たとえば九州大学の図書館のニュースページをみると、先日紹介したCambridge University Pressの無料で教科書で読めるサービスへのリンクがでていますし、様々なサービスが無料で使えるようになっているのがわかると思います。九大図書館が新設した「新型コロナウイルス感染症対応 特設ページ」には上のリンク集以外にいろいろ参考になるリンク(ログインしなくても使えるサービスも含む)がありますので学外の方もふめてご参照ください。ログインなしで無料で使えるサービスリストも同じところにでていますので九大以外のかたも是非ニュースページをご覧ください。たとえばこんなのがのっていました(九大図書館のニュースから引用。詳しくは上のリンクを参照してください。)


期間限定の無料アクセスなど(認証不要)

※新型コロナウイルス感染症拡大への対応として、各社のご厚意により提供して頂いております。

Project MUSE
50以上の出版社の電子ジャーナルと電子ブックを無料で提供しています。
出版社及びアクセス可能範囲・期限の一覧
おおむね2020年6月30日まで無料アクセス。

Annual Reviews
全ての電子ジャーナルを無料で提供しています。
2020年4月30日まで無料アクセス。

Royal Society
全ての電子ジャーナルを無料で提供しています。
当面の間、無料アクセス。

雑誌記事索引データベース ざっさくプラス
2020年5月31日まで無償公開。

Springer
教科書などを無料で提供しています。
タイトルリスト
2020年7月31日まで無料アクセス。

ACM Digital Library
2020年6月30日まで無料アクセス。

桜が咲きました。春がきています!コロナウイルスに負けずに物理数学の本を勉強しましょう!

コロナウイルスで大騒ぎですが、皆さんのご健康をお祈りいたします。中国から私のラボにきていた卒業生の皆さんやそのご家族の皆さんのご無事を祈っています。私のほうは、論文の作成や論文レフリーを依頼されていたので査読作業も忙しくてブログの更新が遅れていました。昨日査読レポートのアップロードを終えたので久しぶりに外に散歩に出かけてみました。写真は道端に咲いていたきれいな水仙の花です。

今日は福岡は暖かく、なんと五月中旬並みの気温(23度ちょっと)もあったそうです。
桜はというと、気象台の開花予想はもう少し後のようですが、なんと近所の桜は咲いていました!蕾のかたいソメイヨシノが並んでいる中に一本だけ、きれいな花を数輪つけているものをみつけました。レンゲも田んぼに咲きはじめ、タンポポの花を奥さんがみつけました。写真は庭のサクランボの木の花です。一週間前にとった写真ですが、満開の花に蝶々が蜜を吸いに来ているのが写っています(クリックして拡大してご覧ください)。たくさんのかわいいメジロも蜜を吸いにてきていて、私が数メートル離れて立っていても無視して、一心にサクランボの花の中にくちばしを入れておりました。右の写真はあぜ道に咲いているアザミです。花いっぱいの春がやってきています。皆さんも花を植えたり、散歩にでかけたりすると気が晴れると思います。

卒業式がなくなった大学も多いのですが、自宅にこもることが多い今の時期にはいろいろな勉強ができると思います。ときどき紹介しているようにネットでいろんな勉強ができますので、しっかり時間をとって勉強するチャンスかもしれません。以前紹介した学習院大学の田崎晴明先生の物理数学の優れた教科書ですが、数日前には主成分分析なども加筆された改訂版を公開されました。絶対おすすめの本ですので勉強してみてはどうでしょうか。また英語ですがCambridge University Pressではコロナの感染拡大にともなっていろいろなサービスの無料公開を始めています。ここをご覧ください。教科書のhtml版の無料公開(5月末まで)を始めていたので紹介しようと思ったのですが、アクセス数がものすごくて今は公開を停めたようです。再開すると書いてありますのでちょくちょくみてもらうと良いと思います。(結局、一般公開はとりやめになって、大学などでCambridge University Pressのサービス―Cambridge Coreなど―を購読している場合のみ大学経由でアクセスできるようになったようです。4月3日追記)

生命科学志向の有機化学の教科書が無料で読めます!量子化学の教科書とかもあります

台風や洪水で被害にあわれた方々に心からお見舞い申し上げます。

さて今回は、生化学や糖鎖生物学、あるいは生命科学を学ぶ人に適当な有機化学の教科書として以下の本をみつけたので紹介しておきます。また無料で科学や歴史、英語などを学べるサイトも紹介します。
Organic Chemistry with a Biological Emphasis Volume I
Organic Chemistry with a Biological Emphasis Volume II
この二冊は、わかりやすい英語で書かれた教科書で、ミネソタ大学モリス校のサイトにおいてあって、無料で利用できるオープンソースのライセンスの教科書です。下の画像をクリックすると、化学以外を含めた様々な分野のオープンライセンスの教科書がみつかります。(画像をクリック後に開いたページの左側にあるBiological/Physical Sciencesをクリックすると生物、物質科学関係の本のリストがみられます。)

Find Open Textbooks

著者のTim Soderbergさんはもとは英語専攻で、日本で英語教師を5年ほどやっておられたそうです。その後、大学に入りなおして科学を専攻し、大学院入学資格を得た後、ユタ大学の大学院に入ってJournal of Organic ChemistryのEditor-in-Chiefを長年つとめたDale Poulter先生の指導のもとで、アーキア(古細菌)の酵素であるprenyltransferaseの研究(それぞれtRNAと膜脂質の修飾に働く2種の酵素の研究)で生化学で博士号を取得。2000年から2016年までミネソタ大学の准教授として有機化学を教えておられた方です。生化学の研究をしていた、有機化学に詳しい先生の書いた本なので生体分子をとりあげて有機化学を学ぶという方針で書かれています。これは生命科学を学ぶ人のための有機化学の教科書としておすすめできると思います。章内問題の解答や章末問題の一部の解答もダウンロードできますので勉強しやすそうです。

あと、Open Educational Resources (OER)というのをご存知ですか。無料の教科書やビデオを駆使して教育していこうという趣旨の運動のようで、無料で数学、物理、化学、生物学その他を学べるという運動です。有機化学については、以下のOERのサイトもご覧ください。
https://oerdegrees.org/courses/chemistry/
https://oerdegrees.org/courses/organic-chemistry/

いろんな無料で利用できる教材へのリンクが集まっているポータルサイトです。その中にはKahn Academyというのがあって、ビデオで有機化学を学べます(トップページ左上のCoursesをクリックすると、数学、物理、化学、生物学、歴史、ミクロ経済学、マクロ経済学、英語の文法、プログラミング(JavaScriptとか)なども学べます。たとえば前に紹介したenantiomer(鏡像異性体、エナンチオマー)について紹介しているビデオとかもあります。字幕がでるビデオですので英語の勉強にもなりますよ。

またサイエンスについては以下を参照してください。
http://oerdegrees.org/programs/science/

こんなのもあります。Libretextsというサイトで、無料で生化学、有機化学、量子化学や量子力学、統計力学、物理化学、政治学などほとんどなんでも学べます。化学へのリンクをあげておきます。
https://chem.libretexts.org/
またこちらにはSolderbergさんの教科書が1冊本のカラー版でおいてあります。章の順序立てがかわっていますが、一冊まるごとダウンロードできますのでご覧ください。

「ロウソクの科学」を読んでみよう!秋の読書のすすめです

  • 昨日は即位礼正殿の儀ということで、お雛様のような美しいいでたちの皇族の方々をテレビで拝見しておりました。さて、この秋、ノーベル化学賞が吉野彰さんに授与されましたが、吉野さんは化学の道へ、マイケル・ファラデーの「ロウソクの科学」を読むことでいざなわれたのだそうです。前にノーベル賞を授賞された大隅先生もそのようにおっしゃっていたと思います。というわけで、今「ロウソクの科学」が飛ぶように売れているそうです。英語でよければここにあります(前に紹介したファラデー著作集のサイトです)ので、pdfやepubなどお好きな形式でダウンロードして、タブレットなどで辞書をひきながら読めば簡単に読めると思います。またこちらの本には、「ロウソクの科学」と「力と物質」が収録されています。また女性が英語で朗読しているので良ければ「ロウソクの科学」のオーディオブックがここにあります。 mp3やM4B形式(M4B形式はAppleのiTuneで再生できる形式です)でダウンロードできます。私が普段使っているメディアプレーヤーのMPC-BEでもM4B形式は再生できます。
    また、この「
    ロウソクの科学」のオーディオブックは、YouTubeにもあります。

ロウソクの科学」は理化学研究所の企画 科学道100冊にも選ばれています。科学道ジュニアというジュニア向けの科学の推薦図書一覧もあって、そちらにも選ばれて入っています。科学道に選ばれている本にはこのブログで紹介したものもあって、どれも面白そうですのでこれからの読書計画の参考に是非ご覧ください。
最後にFaradayの有名な言葉を紹介しておきます。下の写真は英国ロンドンにある
ファラデー博物館(The Faraday Museum)で昔私が撮影した
彼の実験ノートの一部の拡大写真です。
“All this is a dream. Still, examine it by a few experiments.
Nothing is too wonderful to be true, if it be consistent with the
laws of nature and in such things as these, experiment is the
best test of such consistency.”と書いてあります。Faraday 博物館の写真の説明文は以下のようでした。
This note was made by Faraday on 19th March 1849, when set out
in search of a connection between gravity and electricity and magnetism
–the final link in the unity of natural forces in which he so firmly believed.

ファラデーは、現代の物理学で使われている場の概念を初めて導入した現代物理学の創始者です(以前紹介した物理学を変えた二人の男―ファラデー,マクスウェル,場の発見(岩波書店)がとても面白い本ですので是非お読みください)。人類の歴史の中で最高の実験家といえるでしょう。彼の直観した場の概念を、数学の言葉で実体化したマックスウエルとともに、現代の場の理論がこの二人のおかげで誕生したのです。彼は前にも書いたのですが、当時知られていた重力、電気力、磁力の三つの力を統一しようと実験を行っていました。統一場の理論の先駆者ですね。

Brenner先生がCurrent Biologyに書かれたコラムの記事や関連本がダウンロードできます。

 

先日亡くなったBrenner先生はCurrent Biology という雑誌に 1994年1月から2000年12月までコラムを執筆されていました。そのコラム( Loose Endsというコラム名が、途中から False Startsにかわりました。これはコラムの掲載場所が雑誌の巻末から巻頭に変わったのに対応して おちゃめにタイトルを変えたようです)がオンラインで読めるようになりましたのでお知らせします。またpdfをダウンロードすることもできます。ダウンロードするには、ページの中央下にあるスピーカーボタンの左隣にある、ダウンロードボタンをおしてください。「パブリケーション全体―8.5MB 出版物をpdfファイルとしてダウンロードします」という表示がでますのでクリックするとpdfが保存されます。

それからEMBO in Perspectiveという本も紹介しておきます。無料ダウンロードはここからできます。

EMBO (ヨーロッパ分子生物学機構)の50周年記念で作られた本だそうで、サイエンスライターでドロシー・ホジキンの伝記を書いたので有名な Georgina Ferryさんが書いた本です。Paul Nurseが序文を書いています。

Based on personal interviews with Sydney Brenner, L. Luca Cavalli-Sforza, Georges Cohen, James Watson and the directors of EMBO, this book tells the story of the journey from the study of molecules and microbes in the nuclear age to the growth and expansion of EMBO and the life sciences. It also provides new perspectives on some of the creation myths of the organization. (上記のEMBOのホームページからの引用)

写真は自宅に実ったサクランボです。毎年、カラスなどに食べられないようネットを張っていたのですが、今年は面倒なので白いビニールの荷づくり紐を、トリの羽が引っ掛かるように張りました(写真右)。これは案外効果がありました。一切鳥がよりつきませんでした。

最近、カラスの代わりにカラスの仲間のカチガラスがご近所のサクランボを食い尽くしていました。カチガラスはかささぎの別称で、佐賀の県鳥ですが福岡にも出没しています。(余談ですが、植松三十里さんの小説「かちがらす-幕末を読みきった男」( 小学館)は、幕末の佐賀藩主の活躍を描いたものでとても面白かったです。) カチガラスは電柱の上に巣を作って停電の原因になったりしている害鳥でもあります。

白いビニール紐を張っておくと、カチガラスはおろか、一切の鳥が寄り付かなくなり、写真のサクランボは今は熟れすぎたまま木に全部残っています。収穫は連休中に終えたので、あとは紐を切って鳥に食べてもらわなくてはと思っています。とにかく、サクランボなどを鳥から守るには、ビニールひもを張り渡すというのがとても効果があることがわかったのは発見でした。

テキストデータをどんどん蓄積していくソフトの紹介その3―詳しいTextclipperのclipfileツールの使い方です

前に紹介したTextClipperのクリップツールの一つclipfileを作者の吉村隆樹さんがバージョンアップしてくださいました(2018/11/28)。前のバージョンを使っている方は新しいバージョンにしてください。ここからバージョンアップ版をダウンロードして解凍してできたclipfile.ctaファイルをtextclip7962フォルダ中に上書き保存するだけです。以前のバージョンでは保存日時の年号が正しく入らなかったのですが、今回のバージョンアップで2018がちゃんと入るようになりました。吉村さんによると典型的な2000年問題だったそうです。バージョンアップをお願いして数時間で新バージョンを作ってアップロードしてくださいました。吉村さん、どうもありがとうございました。

以下では先日紹介したTextClipperのクリップツールclipfileの使い方をもうすこし詳しく紹介しておきます。
1)まずTextClipperをここからダウンロードしてダウンロードしたzipファイルを解凍してください。解凍してできたフォルダがtextclip7962という名前になります。このフォルダはProgram Filesのフォルダには入れないでください。入れると動きません。このプログラムを使用するには7-zip32.dllが必要です(バックアップ時)のでここから取得してください。

2)ここまでの作業でtextclip7962というフォルダができました。バージョン番号がフォルダ名になっていますね。TextClipper本体はこのフォルダの中にあるtextclip.exeです。これをダブルクリックするとTextClipperが起動します。このソフトの使い方については

http://www.hi-ho.ne.jp/makoto_watanabe/tc/index.html などをみてください。

では次にclipfileというクリップツール(TextClipperの機能拡張のようなものです)をインストールしましょう。これはブラウザにかぎらずMS WordやAcrobat Readerで表示しているpdfファイルなど、任意のソフトで表示しているテキストを選択し、それを規定の名前のテキストファイルTc_txt.txtに次々と保存できるツールです。
一つのテキストファイルに、保存日時と出典、および保存時に追加できる任意のキーワードとともに保存してくれます。新しくクリップしたテキストはもとのテキストファイルの末尾に追加されます。これを使うと、ネットサーフィンで見つけたテキストをキーワード付きでテキストファイルで保存できますので、あとで秀丸など適当なテキストエディタでgrep検索して簡単に探し出すことができます。保存するときに将来検索の時に思いつきそうな、選択したテキストには含まれないキーワードを追加しておけるので、後々の検索時に探しもれが少なくなるのもこのツールの便利な点です。

3)では、clipfileを使えるようにしましょう。
以下のurlからクリップツールのclipfileを選んでダウンロードします。
http://takaki.la.coocan.jp/freesoft/textclipper/
ここをクリックしてダウンロードしてもいいと思います。clipfile.zipがダウンロードできますので、前に紹介した7-Zipなどのソフトで解凍します。解凍してできたclipfile.ctaというファイルを上の2)でできたtextclip7962のフォルダにドラッグして移動させます。これでclipfileを使う準備ができました。

4)TextClipperを起動して、clipfileを使ってみましょう。
まずTextClipperを起動します。

上の図のヘルプの左にある、環境設定を選び、

開いてでてくるメニューでクリップツールキーをAlt+cなど好きなキーの組み合わせに設定します。

これでAlt+Cを押したらクリップツールが動くように設定できました。

5)では、実際にテキストを適当に選んでスクラップブックのようにテキストファイルに保存してみましょう。
まずTextClipperを起動しておいてください。そのあと、ブラウザなどで適当なサイトを訪れて、保存したいテキストを選択し、さっき決めておいたクリップツールキー(Altをおして同時にCを押す)を押します。すると下の画像のようにポップアップメニューが開いて一番上に「TextFileに追加」がありますのでこれを選択します。
するとキーワード入力のポップアップ画面が開きますので、あとで検索に便利なキーワードを入れます。複数入れても構いません。自由に入力しましょう。

保存ボタンをおして完了です。Tc_text.textという名前のファイルに上の選択した部分が出典の一部、日時、キーワードとともに保存されているはずです。

ではうまく保存できたかどうかをtextclip7962フォルダ内にできているTc_txt.textというファイルを開いて確認しましょう。出典、日付、キーワード、クリップしたテキストの順に保存されていたら成功です(下図参照)。

上の例では、私の去年の学会でのランチョンセミナーの講演動画がでているYouTubeのページにあるテキストをクリップしたテキストの後に、今しがたクリップした論文のテキストが追加されています。N型糖鎖、先天性グリコシル化異常症などとあるのは、さきほどつけたキーワードです。その下にクリップしたテキストが保存されているのがわかります。

このように、ちょっと気になったテキストを、どんどんクリップして蓄積しておき、あとで秀丸エディタなどのテキストエディタのgrep検索機能で検索します。grep機能についているタグジャンプ機能を使えば該当するクリップしたテキスト全文のある場所に容易にジャンプすることができます。テキストファイルのサイズが大きくなってきたら、Tc_text.textファイルの名称をTc_text1.txtなどすきな名前に変更します。次にclipfileツールでクリップしたら、自動的にまっさらなTc_txt.txtファイルができてそこに保存されますので、またゼロからクリップがはじめられます。

こうしてできた大量のクリップファイルを一斉に grep検索したら何年にもわたって蓄積したデータを一瞬で検索できて便利です。データはテキストファイルですので、加工も活用もきわめて簡単です。英語論文の例文集の作成、アイデアメモの作成などいろいろな用途につかえるすばらしいツールですので是非活用してみてください。

写真は福岡で撮影したイチョウです。とてもきれいに黄葉しています。秋も深まってきました。

 

AntConcの使い方と活用法その2―自分専用の英語論文例文集(コーパス)の作り方pdftotextの使い方

前回紹介した英語論文用の例文集に使えるAntConcはテキストファイルやhtmlファイルを扱いますが、最も身近な英語の例文集の素材はpdfファイルだと思います。そこで今回は英語の例文集の作成のために重宝する、「pdfファイルをテキストファイルに変換する方法」を紹介します。AcrobatやFoxit Readerなどでpdfを開いて、textファイルとして保存する方法は、pdfファイルが数百、数千ある場合は手作業では対応できません。こんな場合は、Acrobatなどで複数のpdfファイルを一つのpdfファイルに結合してからtextファイルに変換するという方法もありますが、そんなめんどうくさいことをしなくてもpdftotextという無料ソフトを使えば一括で複数のpdfファイルをそれぞれ別のテキストファイルに変換でますので、やってみましょう。

まずpopplerというpdfを扱うプログラミングライブラリ(その中にpdftotextが入っています)をお使いのWindows, Mac, linux用のものを選んでダウンロードしてインストールします。linuxではsudoコマンドでpopplerをダウンロードしてインストールできますし、Mac版もアプリストアからダウンロードできるはずです。私が使っているWindows 10やWindows 7のPCの場合については、ここに詳しいインストールの仕方が書いた記事がでているのを見つけました。大変丁寧に書いてありますのでそのよく読んでインストールしてください。私もこの記事のとおりにインストールして利用しています。

私はCドライブ直下にpoppler-0.68.0というフォルダ(ダウンロードしたPopplerの圧縮ファイルを解凍(解凍ソフトは註1をみてください)してできるフォルダ名のままコピーしただけです)を作り、その直下にあるbinフォルダ(binaryフォルダの意味で、実行ファイルが入っているフォルダのことです)に自分の必要なpdfファイルを集めてテキストファイルに変換しています。shareフォルダの下にはpopplerとrenameしたデータファイル(上述のホームページにあるリンク
https://poppler.freedesktop.org/poppler-data-0.4.9.tar.gz からダウンロードしたpoppler-data-0.4.9.tar.gzファイルを解凍したもの。註1参照)をおいてください。あとは以下のコマンドを記述したバッチファイルをテキストファイルエディタで作ることが必要です。

for %%i in (*.pdf) do (pdftotext %%i %%i.txt)

このコマンドをテキストファイルエディタにうちこみ、できたファイルに適当な名前(pdf2txt.batとかすきな名前)をつけて保存します。保存のときデフォルトではテキストファイルで保存されれウため、pdf2txt.txtになりますのでファイル名の変更でpdf2txt.batにするか、保存時に.batで保存してください。保存場所はpdftotextのあるフォルダ(上の例ではbinフォルダ)にします。

あとは、変換したいpdfファイルを上のbinフォルダにコピーして、コマンドプロンプトでpdf2txt.batファイルを実行するだけです。日本語のファイルも英語のファイルもともにテキストファイルに変換されます。(invalid font weightというエラーが出るかもしれませんが無視してよいようです。不都合があったら教えてください。)

以下はコマンドプロンプトが初めての人むけの簡単な説明です(註2参照)。

バッチファイルというのはwindowsのコマンドプロンプト(windows7では「すべてのプログラム」の部分をみていくと、アクセサリフォルダの下にあります。windows10では下の図の左端の写真ようにシステムツールの下にあります。)でファイル名を入力してエンターを押すと、ファイル内に書いてあるコマンドを逐次実行するというものです。

矢印のコマンドプロンプトをクリックして起動するとき右クリックで、管理者として実行を選んで起動しておくと管理者としてログインしていないときにおこるトラブルをさけられますので注意してください。

今回のバッチファイルは以下のような内容で動きました。

for %%i in (*.pdf) do (pdftotext %%i %%i.txt)

意味は、iという変数にpdfのファイル名をいれ、それにpdftotextコマンドを実行してpdfのファイル名(%%i)のついたテキストファイル(%%i,txt)を作るという操作をフォルダ内にあるすべてのpdfファイル(*.pdfというワイルドカード*を使っている部分で、任意のファイル名のpdfファイルを表しています) がなくなるまで一個ずつ繰り返す(for    doの部分)というものです。

コマンドプロンプトを上に説明したように起動すると、黒いバックに白い字の画面が開きます(上の真ん中の図)
自分の今いるディレクトリ(フォルダ)の名前が表示されています。これから目的のpopplerのフォルダを探すとき、たとえばCドライブの直下にpopplerのフォルダがあるなら、コマンドプロンプトでcd ..(cdとうって、ピリオドを二回うちます)というコマンド(これはディレクトリを上に登って行くコマンドです)を何回かうってディレクトリをC:¥>にします。上の図の右端の図。
dirとうつとディレクトリやファイルの一覧が表示されます。
popplerのフォルダへ移りたいのでcd poppくらいまでをタイプしてあとはタブキーを押してください。タブの自動補完機能でcd poppler-0.68.0と自動入力されます。(このタブ補完の機能はlinuxで重宝するのですがWindowsのコマンドプロンプトでも利用できますので活用してください。) enterキーを押すとC:¥poppler-0.68.0>と表示されてディレクトリを移動したのがわかります。ここでdirとうってenterを押すとディレクトリ内のファイルとフォルダが表示されます。プログラムファイルのあるbinのフォルダ(ディレクトリ)があるのを確認してください。cd binとうってenterを押すとbinのディレクトリに移動します。C:¥poppler-0.68.0\binとなっていたら成功です(上の右端の図)。再びdirとうってenterをおします。これでこのbinフォルダ内にあるすべてのファイルとフォルダが表示されます。あとはそこにコピーしてあるバッチファイルpdf2txt.batを実行する(コマンドラインにpdf2txtとうってenterを押す)と、自動的にファイル名のついたtxtファイルができあがります。

こうして一括でpdfファイルをテキストファイルに変換したら、あとはこれらのテキストファイルをAntConcに読み込んでコーパスとして論文を書くときに参照すればいいわけです。

もちろんテキストファイルですから、テキストファイルを一括検索して、検索結果にタグジャンプして参照できるgrepコマンドも使えます。適当な、grepコマンドが使えるエディタ(たとえば有料ですが秀逸なエディタでおすすめの秀丸エディタ)でpdfの内容を串刺し検索するのもよいですね。pdfgrepというソフトもあって、これを使えばpdfファイルのままでgrepができるそうです。これはまだ使っていません。windows版をダウンロードしてさきほどのbinファイルにコピーしておけば、コマンドプロンプトで使えるのですが、linux版とちがって検索語がハイライトしなかったりしてまだ使いこなせていません。興味のある方は使ってみてください。

註1:圧縮ファイルの解凍には私は7-zipを使っています。たいていの圧縮解凍はこれでできます。
註2:パスの通し方とかは説明しないでpdftotextを使う方法を説明していますので、良く知っている方はパスを通して適当な場所にpdftotextをおいて使ってください。

物理や数学、工学や生物科学の新刊本をDOABでダウンロードしてみよう:オープンアクセス本のすすめ

このところ、古典のダウンロードサイトばかり紹介していましたが、今日は最新の本がダウンロードできるサイトを紹介します、。去年の講演でも紹介したサイトですが、
DOAB (Directory of Open Access Books)というサイトにはSpring-Natureをはじめいくつかの出版社が公開しているオープンアクセス本がまとめられていて便利です。たとえば生物科学のビッグデータの解析に重宝するGO termというのがありますが、その解説本The Gene Ontology Handbook」が丸ごとダウンロードできるのがわかります。このサイトでいろんなキーワードをいれて探すと、2018年の新刊を含めて、オープンアクセスで公開されている本がいろいろあって面白いです。例えば今日、Mathematicaという数式処理ソフトでこのサイトで検索をかけてみました。九大の生物学科でも昔はMathematicaを使う演習がありましたが、数式処理ソフトとしては有名な市販ソフトです。するとこんな本が見つかりました。

Control Theory Tutorial
Basic Concepts Illustrated by Software Examples
(Steven A. Frank)

検索結果のページの下の方にある、Free Accessというボタンを押してみてください。ダウンロードリンクが開きます。この本は別途、Mathematicaのコードがダウンロードできるようにしてあり、生命科学にも応用範囲のひろい、制御理論の基礎をMathematicaを動かしながら勉強できるようです。著者は生物科学系のカリフォルニア大学の先生で、生命科学の分野の人が制御理論を学ぶのに最適の本のようにみうけられます。興味のある方はダウンロードしてみてください。他にも各人の好みのキーワードで検索するときっとぴったりの本が見つかると思います。

写真は毎日の猛暑を逃れるため、夕方 山の川にいった時にみつけたアメンボです。どこにいるかわかりますか?