AntConcの使い方と活用法その2―自分専用の英語論文例文集(コーパス)の作り方pdftotextの使い方

前回紹介した英語論文用の例文集に使えるAntConcはテキストファイルやhtmlファイルを扱いますが、最も身近な英語の例文集の素材はpdfファイルだと思います。そこで今回は英語の例文集の作成のために重宝する、「pdfファイルをテキストファイルに変換する方法」を紹介します。AcrobatやFoxit Readerなどでpdfを開いて、textファイルとして保存する方法は、pdfファイルが数百、数千ある場合は手作業では対応できません。こんな場合は、Acrobatなどで複数のpdfファイルを一つのpdfファイルに結合してからtextファイルに変換するという方法もありますが、そんなめんどうくさいことをしなくてもpdftotextという無料ソフトを使えば一括で複数のpdfファイルをそれぞれ別のテキストファイルに変換でますので、やってみましょう。

まずpopplerというpdfを扱うプログラミングライブラリ(その中にpdftotextが入っています)をお使いのWindows, Mac, linux用のものを選んでダウンロードしてインストールします。linuxではsudoコマンドでpopplerをダウンロードしてインストールできますし、Mac版もアプリストアからダウンロードできるはずです。私が使っているWindows 10やWindows 7のPCの場合については、ここに詳しいインストールの仕方が書いた記事がでているのを見つけました。大変丁寧に書いてありますのでそのよく読んでインストールしてください。私もこの記事のとおりにインストールして利用しています。

私はCドライブ直下にpoppler-0.68.0というフォルダ(ダウンロードしたPopplerの圧縮ファイルを解凍(解凍ソフトは註1をみてください)してできるフォルダ名のままコピーしただけです)を作り、その直下にあるbinフォルダ(binaryフォルダの意味で、実行ファイルが入っているフォルダのことです)に自分の必要なpdfファイルを集めてテキストファイルに変換しています。shareフォルダの下にはpopplerとrenameしたデータファイル(上述のホームページにあるリンク
https://poppler.freedesktop.org/poppler-data-0.4.9.tar.gz からダウンロードしたpoppler-data-0.4.9.tar.gzファイルを解凍したもの。註1参照)をおいてください。あとは以下のコマンドを記述したバッチファイルをテキストファイルエディタで作ることが必要です。

for %%i in (*.pdf) do (pdftotext %%i %%i.txt)

このコマンドをテキストファイルエディタにうちこみ、できたファイルに適当な名前(pdf2txt.batとかすきな名前)をつけて保存します。保存のときデフォルトではテキストファイルで保存されれウため、pdf2txt.txtになりますのでファイル名の変更でpdf2txt.batにするか、保存時に.batで保存してください。保存場所はpdftotextのあるフォルダ(上の例ではbinフォルダ)にします。

あとは、変換したいpdfファイルを上のbinフォルダにコピーして、コマンドプロンプトでpdf2txt.batファイルを実行するだけです。日本語のファイルも英語のファイルもともにテキストファイルに変換されます。(invalid font weightというエラーが出るかもしれませんが無視してよいようです。不都合があったら教えてください。)

以下はコマンドプロンプトが初めての人むけの簡単な説明です(註2参照)。

バッチファイルというのはwindowsのコマンドプロンプト(windows7では「すべてのプログラム」の部分をみていくと、アクセサリフォルダの下にあります。windows10では下の図の左端の写真ようにシステムツールの下にあります。)でファイル名を入力してエンターを押すと、ファイル内に書いてあるコマンドを逐次実行するというものです。

矢印のコマンドプロンプトをクリックして起動するとき右クリックで、管理者として実行を選んで起動しておくと管理者としてログインしていないときにおこるトラブルをさけられますので注意してください。

今回のバッチファイルは以下のような内容で動きました。

for %%i in (*.pdf) do (pdftotext %%i %%i.txt)

意味は、iという変数にpdfのファイル名をいれ、それにpdftotextコマンドを実行してpdfのファイル名(%%i)のついたテキストファイル(%%i,txt)を作るという操作をフォルダ内にあるすべてのpdfファイル(*.pdfというワイルドカード*を使っている部分で、任意のファイル名のpdfファイルを表しています) がなくなるまで一個ずつ繰り返す(for    doの部分)というものです。

コマンドプロンプトを上に説明したように起動すると、黒いバックに白い字の画面が開きます(上の真ん中の図)
自分の今いるディレクトリ(フォルダ)の名前が表示されています。これから目的のpopplerのフォルダを探すとき、たとえばCドライブの直下にpopplerのフォルダがあるなら、コマンドプロンプトでcd ..(cdとうって、ピリオドを二回うちます)というコマンド(これはディレクトリを上に登って行くコマンドです)を何回かうってディレクトリをC:¥>にします。上の図の右端の図。
dirとうつとディレクトリやファイルの一覧が表示されます。
popplerのフォルダへ移りたいのでcd poppくらいまでをタイプしてあとはタブキーを押してください。タブの自動補完機能でcd poppler-0.68.0と自動入力されます。(このタブ補完の機能はlinuxで重宝するのですがWindowsのコマンドプロンプトでも利用できますので活用してください。) enterキーを押すとC:¥poppler-0.68.0>と表示されてディレクトリを移動したのがわかります。ここでdirとうってenterを押すとディレクトリ内のファイルとフォルダが表示されます。プログラムファイルのあるbinのフォルダ(ディレクトリ)があるのを確認してください。cd binとうってenterを押すとbinのディレクトリに移動します。C:¥poppler-0.68.0\binとなっていたら成功です(上の右端の図)。再びdirとうってenterをおします。これでこのbinフォルダ内にあるすべてのファイルとフォルダが表示されます。あとはそこにコピーしてあるバッチファイルpdf2txt.batを実行する(コマンドラインにpdf2txtとうってenterを押す)と、自動的にファイル名のついたtxtファイルができあがります。

こうして一括でpdfファイルをテキストファイルに変換したら、あとはこれらのテキストファイルをAntConcに読み込んでコーパスとして論文を書くときに参照すればいいわけです。

もちろんテキストファイルですから、テキストファイルを一括検索して、検索結果にタグジャンプして参照できるgrepコマンドも使えます。適当な、grepコマンドが使えるエディタ(たとえば有料ですが秀逸なエディタでおすすめの秀丸エディタ)でpdfの内容を串刺し検索するのもよいですね。pdfgrepというソフトもあって、これを使えばpdfファイルのままでgrepができるそうです。これはまだ使っていません。windows版をダウンロードしてさきほどのbinファイルにコピーしておけば、コマンドプロンプトで使えるのですが、linux版とちがって検索語がハイライトしなかったりしてまだ使いこなせていません。興味のある方は使ってみてください。

註1:圧縮ファイルの解凍には私は7-zipを使っています。たいていの圧縮解凍はこれでできます。
註2:パスの通し方とかは説明しないでpdftotextを使う方法を説明していますので、良く知っている方はパスを通して適当な場所にpdftotextをおいて使ってください。

物理や数学、工学や生物科学の新刊本をDOABでダウンロードしてみよう:オープンアクセス本のすすめ

このところ、古典のダウンロードサイトばかり紹介していましたが、今日は最新の本がダウンロードできるサイトを紹介します、。去年の講演でも紹介したサイトですが、
DOAB (Directory of Open Access Books)というサイトにはSpring-Natureをはじめいくつかの出版社が公開しているオープンアクセス本がまとめられていて便利です。たとえば生物科学のビッグデータの解析に重宝するGO termというのがありますが、その解説本The Gene Ontology Handbook」が丸ごとダウンロードできるのがわかります。このサイトでいろんなキーワードをいれて探すと、2018年の新刊を含めて、オープンアクセスで公開されている本がいろいろあって面白いです。例えば今日、Mathematicaという数式処理ソフトでこのサイトで検索をかけてみました。九大の生物学科でも昔はMathematicaを使う演習がありましたが、数式処理ソフトとしては有名な市販ソフトです。するとこんな本が見つかりました。

Control Theory Tutorial
Basic Concepts Illustrated by Software Examples
(Steven A. Frank)

検索結果のページの下の方にある、Free Accessというボタンを押してみてください。ダウンロードリンクが開きます。この本は別途、Mathematicaのコードがダウンロードできるようにしてあり、生命科学にも応用範囲のひろい、制御理論の基礎をMathematicaを動かしながら勉強できるようです。著者は生物科学系のカリフォルニア大学の先生で、生命科学の分野の人が制御理論を学ぶのに最適の本のようにみうけられます。興味のある方はダウンロードしてみてください。他にも各人の好みのキーワードで検索するときっとぴったりの本が見つかると思います。

写真は毎日の猛暑を逃れるため、夕方 山の川にいった時にみつけたアメンボです。どこにいるかわかりますか?

科学の本を無料でダウンロードして読める日本のサイト「科学図書館」の紹介です。

栗の花が散ると二日後には梅雨に入るといわれているそうです。
気象台の梅雨入り宣言の後も、晴天が続いていましたが、栗の花が散り始め、福岡も今日は梅雨の雨がふりしきっていて、アジサイがとてもきれいです。
(写真は梅雨入り宣言後の晴天続きの夕日と数日前に散り始めたクリの花です)

今日はInternet Archiveではなく、科学図書館という日本のサイトを紹介します。私のホームページのリンク集には開設当初からいれているサイトです。数学、物理学、天文学、哲学などさまざまな名著が日本語で無料で読め、ダウンロードできます。サイトとこの素晴らしいサイトを作成している方については、ここに紹介記事があるのでご覧ください。アップロードしてある著作はすべてサイト作成者のかたがLATEX 2εで組んで編集した後にpdfにしてアップロードされているそうです。このため、本文の内容を検索することも自由にできるようになっています。、例えばポアンカレの「科学の価値」(田辺元訳)のpdfをダウンロードしてきたら、本文の全文検索がpdfで可能です。これは極めて便利です。そのほか、本文内に注を入れてくださっていたり、様々な心遣いに感動しますよ。是非このサイトをご利用ください。
実は後日紹介しようと思っていますが、ポアンカレの「科学の価値」(田辺元訳)は、国立国会図書館デジタルコレクションで、ポアンカレと検索窓にいれればでてきて(リンクはここ)、画像を全コマ ダウンロードできます。pdfにしてくれるのですが、画像pdfなので検索はできません。
他にこの国立国会図書館のサイトには、ポアンカレの「科学の方法」や「科学と仮説」(「科学と臆説」というタイトル)などもありますが、これは全コマダウンロード不可で、50ページづつしか印刷pdfにできないなどきわめて不便です。

この科学図書館のサイトにある外国の名著の翻訳では、今紹介したフランスの数学者 アンリ・ポアンカレの「科学の価値」の他、
ハーヴェイの 「動物の心臓ならびに血液の運動に関する解剖学的研究」
パストゥール 「自然発生説の検討/自然発生について」
ダーウィン 「人及び動物 の表情について」
アーレニウス 「史的に見たる科学的宇宙観の変遷」〔改訂版〕
オストヴァルト 「エネルギー」
ヘッケル 「宇宙の謎」【改訂版
ディーツゲン 「一労働者の観たる人間頭脳の働らきの性質」
その他、様々な講演録、伝記などがそろっています。また
日本の名著もいろいろそろっています。(以下敬称略)
寺田寅彦の「物理学序説」もありますし、
九州大学工学部に助手としておられ、その後 東京に移られて東京工業大学助教授をつとめられていた科学史家、天野清の「量子力学史」、「熱輻射論と量子論の起源」、「熱輻射史」その他の業績も無料でダウンロードして読めます。(将来を嘱望されていた天野清は残念なことに、昭和20年4月の東京大空襲で亡くなりました。)

その他、様々な先達の著作(天文学、物理学、哲学、数学史など―石原純、九大の教授だった桑木彧雄の業績、戸坂潤、村田全や小倉金之助の著作、三浦梅園の著作などいろいろ)が読めます。是非ご覧ください。

物理学の本をダウンロードしてみよう―Internet Archiveの使い方5

ちくま学芸文庫にはさまざまな科学の名著が網羅されています。カタログを眺めてみると、どれをとっても読んでみたい本ですが、科学の古典もいろいろ含まれていてそれらが日本語で読めるのはとても素晴らしいことです。Internet Archiveには、この文庫でとりあげられている多くの本や、岩波書店その他から翻訳本がでている本が沢山収録されています。Internet Archiveからは、KINDLE, epubやpdf形式など電子書籍の形式を選んで、自分のタブレットやPCにダウンロードできます。後はアプリを使って辞書を自動でひきながら読めるので、英語その他の外国語の本を読むのもずいぶん楽になりました。本当にいろんな本がよめます。今日は物理の本を紹介しましょう。
たとえば 理論物理学の教科書の定番ランダウ・リフシッツの 理論物理学教程は日本語版も出版されていますが、Internet Archiveからは英語版が無料でダウンロード可能です。検索窓に
creator:”L.D. Landau”とかcreator:”L.D. Landau & E.M. Lifshitz”で検索してみてください。とりあえず「力学」へのリンク(第2版第3版)をはっておきます。
こちらのブログ(とね日記)に詳しい情報(一部リンク切れあり)もあります。第3版のありかは、このブログに教えてもらいました。
この「とね日記」にはファインマン物理学全巻が無料でオンラインで読めるというサイトの紹介などもあっておすすめです。ファインマンはアメリカの有名な物理学者で朝永振一郎やシュヴィンガーとともにノーベル物理学賞を授賞しています。彼の大学での物理学の講義は有名でとても面白い教科書です。またご冗談でしょうファインマンさんなどの本でも有名ですね。Internet Archiveには著作の朗読や動画を含めていろいろ無料でダウンロードできるものがそろっています。ここをご覧ください。
私の学生のときには、物理学者のガモフの本の翻訳をよく読んだものでした。ガモフは遺伝暗号の解読にも参加していたので生物学への影響も大きかった人です。宇宙の開闢の時にビッグバンがあったというのを提唱した人でもあります。そのガモフの本もInternet Archiveにはいろいろありました。George Gamowで検索してみてください。トムキンス氏の冒険とかもみつかります。
「物理の伝記」とか「1,2,3、無限大」それに前に紹介した「重力」とかもあります。p135あたりから以前紹介した Faradayの研究の話が書いてあります。
その他の科学の名著として、たとえば、ちょっと検索するだけで、
フォン・ノイマンの自己増殖オートマトンの理論
とか、
Theory Of Games And Economic Behavior ゲームの理論と経済行動とかもあります。
Norbert Wienerの本もいろいろありました。サイバネティクスで有名で、二次の確率過程であるWiener過程はランジュバン方程式の勉強の時におめにかかったことがあります。
サイバネティクス Cybernetics Or Communication And Control In The Animal And The Machine は有名な本ですね。他に検索してみると、彼の自伝とかもあります。

いろいろ検索してみてください。 田んぼに水が張られて田植えの準備がはじまりました。

NCBI Bookshelfの紹介と、糖鎖生物学の教科書、糖鎖科学のロードマップの紹介です。

ランチョンセミナーでも紹介しましたし、またこのサイトのリンク集にもあげてありますが、NCBI Bookshelfには様々な生命科学の本がアップロードされており、自由にオンラインで読めたり内容を検索して読んだりできるので、勉強や研究にとても役立つ、活用できるサイトです。ストライアーの生化学(第5版)だのMolecular Biology of the Cellの古い版(第4版)などもありますので、本のタイトルを見るだけではなく、ページの一番上にある、キーワード検索ボックスを活用していろんな本を縦断検索してみてください。レポート作成や、新しい分野の研究のための予備知識の収集、セミナーや授業の準備などに大いに役立ちます。

私達の研究している糖鎖生物学の定番の教科書Essentialsof Glycobiologyの第3版(Cold Spring Harbor Press社、2017年発行の最新版です)がこのサイトにあるので、オンラインで無料で読むことが出来ます。編集者のEskoさんのカリフォルニア大学サンディエゴ分校のサイトには、この本の図(低解像度版)と図のパワーポイントスライドをダウンロードできるようにしてありますので、興味のある方は訪れてみてそこに書いてある著作権に留意した上でご利用ください。
糖鎖生物学は、アメリカでは研究のロードマップが公開され、集中的な予算投下で研究が猛烈に進んでいる分野です。アメリカの医療研究機関では糖鎖生物学の研究者がひっぱりだこで、人材不足になっているという話です。この糖鎖科学研究のロードマップ(Transforming Glycoscience
A Roadmap for the Future, National Research Council (US) Committee on Assessing the Importance and Impact of Glycomics and Glycosciences))もBookshelfに公開されていますのでご覧ください。pdf版もここからダウンロードできます。
これは日本語訳も発行されていますが、日本でも最新の研究成果をふまえたグライコサイエンスのロードマップが完成しており、ほどなく公開される予定です(私も執筆しています。英語版も発行されます)。

 

夏目漱石や芥川龍之介、その他日本の著者の本を読んでみよう―Internet Archiveの使い方4

私の昨年12月のランチョンセミナー(ConBio2017)では、Internet Archiveの使い方に軽くふれただけでしたので、このブログでYouTubeの動画よりももっと詳しく紹介する記事を続けています。
私が英国のケンブリッジ大学に留学していた時、ケンブリッジ大学図書館の利用票をもらったので、よく大学図書館に通いました。図書館には英語の本だけではなく、中国語や日本語の本も沢山所蔵されていました。日本語の本では、夏目漱石全集だの芥川龍之介全集、坪内逍遥訳のシェークスピア全集など様々な本があったので、当時小学校に通っていた子供の勉強にも役立ちました。
Internet Archiveには、下で紹介した寺田寅彦の青空文庫だけではなく、寺田寅彦全集も収録されています。私がみた範囲では一巻だけ欠落していますが、ほぼ全巻収録されています。また夏目漱石全集、芥川龍之介全集、小泉八雲(ラフカディオ・ハーン)全集、夏目漱石の奥さんの「漱石の思い出」、芭蕉の俳句集、その他いろんな日本語の本が読めることがわかるでしょう。多くは外国の大学図書館の日本語書籍コレクションをネット公開しているものです。探し方はいろいろあるとおもいますが、夏目漱石の本を探す時の一例を画像を交えて紹介します。(画像はギャラリー表示しているのでクリックすると大きく表示されます。)

Internet Archiveのホームページにアクセスして、Search Metadataにnatsumeと入れる。漱石がsosekiになるのか、sohsekiか などがわからないので名字だけいれます(一番上の画像)。
そして左のMedia Typeのtextsのボックス(上から二番目の画像)にチェックを入れ本や論文など、テキストファイルだけに表示をしぼります。さらに、AvailabilityのところにあるAlways Availableにチェックを入れると無料で読めるものだけに表示がしぼられます(上から3番目の画像)。本の表紙などの画像が自動で表示されますので、あとは画像を上から順にみていくだけです。マウスをドラッグして表示の下まできたら、 マウスをさらに下にドラッグするとFetching more resultsというメッセージがでて矢印がくるくるまわり、さらに本が表示されますので、どんどん表示させてみていってください。画像をみていくとマンガとかもヒットしていますが、それはnatsumeで検索しているから漱石でないnatsumeさんがヒットしているわけです。今回はそれは無視して画像をみていくと、漱石の作品の英訳本や漱石の伝記、「漱石の思い出」などがあって、その下あたりに漱石全集の画像があると思います(一番下の画像)。クリックすると本が表示されますので読んでみてください。虫メガネのアイコンをクリックすると画像を大きくして読むこともできます。
今回はtextにチェックをいれて表示を本に絞りましたが、チェックをいれないで検索するのもやってみてください。漱石の作品の朗読なども聞けます。いろいろ試してみてください。

ノストラダムスの大予言がふっとぶ予言書? ルクレチウスの事物の本性について-Internet Archiveの使い方3

このところ紹介しているInternet Archiveは、様々な本が登録されていて、pdfのほか、epub形式その他 様々な形式でダウンロードできます。iOSの人もwindowsの人も、Linuxの人もKindleの人も、それぞれにあった形式の電子書籍をダウンロードできるのがすごいところです。もちろん動画や音楽なども登録されているのでそちらをいろいろみてみるのも楽しそうです。今日はInternet Archiveに入っている、紀元前のローマの詩人、古代ギリシャの原子論を現代に伝えているルクレチウスの本(英語への翻訳版)”On the Nature of Things”「物の本質について」を紹介します。この本は、ピュリッアー賞をとった「1417年その一冊がすべてを変えた」(原題はThe Swerve: How the World Became Modern という本によって、一躍 欧米で注目された本で、有名なビーナスの誕生の絵はルクレチウスの著作の始めの部分をモチーフにして描かれているという説もあります。
日本では寺田寅彦が随筆「ルクレチウスと科学」でやさしく紹介したので、昔から有名で、私が初めてルクレチウスの名前を知ったのも岩波文庫で寺田寅彦随筆集を読んだ時でした。子供向けの本(「原子の歌 宇宙をつくるものアトム」 (科学入門名著全集)など)としても翻訳がでていました。寺田寅彦のこの随筆はInternet Archivesにも収録されていて、全文はここにあります。これは日本の青空文庫のものをアップしてあるのです。この随筆をみてすぐに岩波文庫の「物の本質について」を買ってきて読みました。

寺田寅彦の紹介を読んでもらえばわかりますが、この本は19世紀から20世紀にかけて多くの科学者に読まれ、インスピレーションの源泉として利用された本です。成立したのは紀元前1世紀、原子論で有名なエピクロスの学説を詳しく伝えているとされる本です。1417年、ドイツのとある修道院でこの写本がみつかりこの一冊がルネサンスをよびよせたともいわれるほど大きな影響を与えました。神々の怒りに恐れている人々に、この世には原子と空虚しかなく、原子は不滅であるので何も恐れることはないと説くこの本は、宗教に脅されている人々には強い味方となったと思います。すべてが決定論的におこらないように、ルクレチウスのアトムはときどきランダムなずれの運動(swerveと訳されています)をおこなうと書かれています。まるで量子力学の波束の収縮の予言、あるいは波動関数の確率解釈の予言みたいですね。

寺田寅彦の紹介を読むと、ルクレチウスは現代科学を生む原動力になったのがよくわかります。ノストラダムスの大予言というのが昔、はやりましたが、ルクレチウスの本は、ノストラダムスよりも、もっともっと影響力の大きい予言書として働いたという言い方も可能かもしれません。さまざまな科学者がルクレチウスを読んでそれをどう解釈して科学に役立てるかを考えたようです。ルクレチウスと科学についてはInternet Archiveにもいろいろ本がならんでいます。寺田寅彦の随筆には、Munro訳のOn the Nature of Thingsについて触れられていて、これはInternet Archiveにアップロードされており(全3巻)、 その第2巻に、寺田寅彦の紹介している物理学者のAndradeの序論(The Scientific Significance of Lucretius)が載っています。寅彦の読んだ本を今、ネットで自由にダウンロードしてタブレットやパソコンで読める時代になっているのですね。感慨もひとしおです。

この原稿を書こうとネット検索しているとき以下のページにルクレチウスの本の英訳をみつけました。Vancouver Island Universityの名誉教授Ian Johnston先生が、なくなったお子さんに捧げているページです。そこにはルクレチウスのほか、ホメロスモンテーニュ、カフカカントの著作(「永遠平和のために」など)もアップロードされていますし、「ダランベールの夢」とか、デカルトの方法序説省察ニーチェの著作などもあって、とてもいいサイトになっていましたので、ご覧ください。ルクレチウスについての紹介の他、Munro訳をもとにした新訳がアップロードされていてオンラインで読める他、rtf版もダウンロード可能です。

 

謎のVoynich手稿:ボイニッチ手稿をダウンロードしてみよう (Internet Archiveの使い方1)

今回は、Internet Archiveの使い方の練習です。

ボイニッチ手稿Voynich manuscriptというのをご存知ですか?図のような不思議な文字と絵が満載の古い本です。NHKのBSで幻解!超常ファイルというシリーズがありますが、最近その番組で紹介されていました。何が書いてあるのかいまだに解読されていないという謎の手稿です。解読しようと多くの暗号解読者が挑戦しましたが誰一人として解読に成功していません。何語で書かれているのかもわからないという絵だけがやたらきれいな謎の手稿です。でたらめが書かれているのではなさそうである、という統計解析の結果もでていますが、何の意味もないでっちあげの本で高値で販売するために作ったという説もあるようです。ときどき、解読の突破口というようなニュースもでます。

不思議な植物や入浴中(?)の女性、そして天体のような図が満載の本ですが、未知の言語で書かれている不思議な本です。昔、町の図書館で「ヴォイニッチ写本の謎」(青土社)という本を読みましたが、この本は暗号解読の解説がとてもわかりやすくおすすめです。

さて、本題ですが、Voynich manuscriptを無料でダウンロードしてみましょう。高解像度の各ページのjpegファイルをダウンロードすることもできますし、Yale大学図書館に所蔵されている原本をスキャンした本を一冊まるごとダウンロードすることも可能です。Internet Archiveからダウンロードします。サイトにアクセスして、右上のSIGN INの右のほうにある、SearchのところにVoynich manuscriptといれます。プルダウンでSearch metadataにチェックが入っているのを確認してください。エンターを押すと検索が始まり、Voynich manuscriptのテキストやオーディオファイルその他がリストされます。この中からtextのファイルを左のmedia typeの中からtextsにチェックして選ぶと23個のテキストファイルが表示されます(high resolution jpeg imagesもあります)。一番上のファイルをクリックすると、ダウンロードページが開きます。画像をクリックすると1ページずつ読めますし、ダウンロードするファイルの形式(pdfやepubその他いろいろ)を選んで自分のディバイスにダウンロードして保存することも可能です。以下の画像を参照しながらやってみてください。

答え合わせとして、リンク集に直リンクが載せてありますので、参考にしてください(5月16日追記)

Internet Archiveは私の電子資料の活用法の動画でも紹介しましたが、きわめて有用なサイトです。このような面白い例で使い方に慣れてください。

ダーウイン生誕200年

ことしはダーウイン生誕200年、「種の起源」が出版されてから150年ということで世界各地でお祭りがあります。
ダーウインの書いた本は以下のサイトに、インターネットで無料でアクセスできるようにあつめてあります。英語の勉強をするとこんなサイトが使えるのですばらしい事だと思います。
Darwin onlineビーグル号航海記や種の起源の初版、それ以降の版、ダーウインの全ての著作がダウンロードできます。