PymolをUbuntu にインストールして使おう!

日替わりリンクなどのページのほうに簡単に書いたUbuntu (Linuxのもっとも普及しているディストリビューション)への分子グラフィックスソフトPyMOLのインストール法をまとめておきます。写真はPymolで表示したInaZというバクテリアのタンパク質の立体構造(AlphaFold2による予測構造)です。驚くような不思議な構造をしていますね!
https://alphafold.ebi.ac.uk/files/AF-P06620-F1-model_v2.pdbからInaZタンパク質の立体構造情報が記述されているpdbファイルをダウンロードして、PyMOLの画面(一番下の写真)にドラッグアンドドロップすれば表示されます。タンパク質を立体的に表示することができて、自由に拡大、回転、反転もできます。さらに立体構図の描画方法も様々に変化させて表示することができます。構造生物学には必須のソフトウエアです。

Ubuntu の最新版LTS20.04へのインストール法は簡単です。デスクトップ左端にあるAと書いてあるアイコン(Ubuntu Softwareという、Ubuntuでソフトウエアをインストールするときに使うツールのアイコンです)をクリックします。開いたウインドウで検索窓にpymolといれてエンターを押すとpymol-ossというソフトウエアがヒットします(下の写真)。
上の写真ではインストール済みとなっていますが、初めてのインストール時には、インストールボタンが表示されているので、それを押すとインストールが始まります。インストール中と表示されて、インストールの進み具合がインストール中24%などと表示され、100%になると、権限の設定画面がでます。デフォルトでチェックが入っていない、USB上のファイルの読み書きを許可すると言う英語の表示にもチェックをつけて、閉じるボタンを押したらおしまいです。ソフトを起動すると以下のような画面になります。

この画面に立体構造を表示したいpdfファイルをドラッグアンドドロップすればただちに立体構造が表示されます。これでPyMOLが使えるようになりました。この後は、東京大学の森脇 由隆先生のpymol bookを読むといいでしょう。日本語でほんとうに丁寧に説明されていますし、ページ右上のprinterのアイコンを押せば印刷もできます。そのときプリンタをpdf printerに指定すればpdf版の本もできます。

一週間分の日替わりリンクなどを掲載しておきます。

元旦から毎日更新の固定ページをつくりました。まだご存知ない方が多いようなので、一週間分の掲載内容をトップページにもまとめておきます。庭の水仙が咲きだしました。

2022/1/8
NHKでシャーロック・ホームズのドラマを毎週みています。オンラインで日本語でシャーロック・ホームズの日本語訳を読めるのはここがよさそうです。https://221b.jp/


2022/1/7
機械学習の教科書の紹介です。 Dive into Deep Learning (Dが二つ続くのでD2Lと省略して紹介されることも多い本です)という教科書で、スタンフォード大、マサチューセッツ工科大、ハーバード大、ケンブリッジ大など世界の300の大学で採用されている教科書だそうです。Jupyter notebookで手を動かしながら学んでいくというスタンスの教科書で評価の高いものだそうです。
https://github.com/d2l-ai/d2l-enのサイトにある、Book Websiteをクリックして開くページで、MXNetやPyTorch, Notebooks,Coursesなどとあるタブの最初のMXNetをクリックするとpdf版がダウンロードできます。Coursesをクリックすると授業のシラバスやスライドなども見られます。最初のほうの日本語訳もできているようでここから見られます
2022/1/6
ものすごい図鑑 NHKのサイト
これは子供だけでなく大人も楽しめるデジタル昆虫図鑑です。
カブトムシ、モンシロチョウ、ハンミョウ、キリギリス、ノコギリクワガタなど、いろんな虫を画面上で回転、拡大、縮小して立体的に観察することができます。複眼の電子顕微鏡写真もあったりして、楽しいサイトです。お子さんと一緒にどうぞ。
2022/1/5
動画編集にはどんなソフトを使っていますか?以前、Scientific Americanという雑誌をパラパラみていたら、DaVinci Resolve  17という動画編集ソフトの広告がでていて、ハリウッドで使われているソフトで、なんと無料で利用できるとありました。Blackmagic Design Pty. Ltd.社の製品ですが最近日本語のリファレンスマニュアルが無料で公開されているのを知りました。チュートリアルとかも充実しているので時間のある方は試してみるのもいいと思います。Windows, Mac-OSX, Linux対応のソフトです。HDビデオの編集程度ならさほど高スペックなコンピュータはいらないもようです。
2022/1/4
Juliaというプログラミング言語が注目を集めています。前もちょっと紹介しましたが、Pythonより早くて使いやすいそうです。Juliaをつかったデータサイエンスの入門書(英語)が以下に公開されています。興味のある方はご覧ください。

Introduction to Datascience: Learn Julia Programming, Math & Datascience from Scratch

2022/1/3
今日は、わかりやすい量子化学計算の解説ページを紹介しておきます。元旦に紹介した「ノーコードではじめる機械学習」の著者である久我涼子さんのホームページで、pythonによるアプリケーション開発などの記事もあってきわめて参考になります。このブログの記事から生まれた本は

ゼロからわかる!! 独習 量子化学計算: 理論からはじめない新しい量子化学計算の本

というKindle本で、これは解りやすい本です(紙の本はありません)。またこちらのページには、tsujimotterさんこと辻順平さんによる、簡単な分子軌道法の入門解説記事があります。

2022/1/2
QDくんの過去ツイまとめ(機械学習、時系列分析、確率・統計に関する有益記事紹介)というtwitterの記事に有益なリンクがまとめられています。日本語字幕付きのハーバード大学コンピュータサイエンス入門講義の動画とか、いろいろありますので参考になります。
2022/1/1
機械学習に興味がある方へ
:プログラミングなしで機械学習が学べるOrange 3というのをご存知ですか?日本語の解説書としては「ノーコードではじめる機械学習」がよさそうです。Kindleなど電子書籍版と紙の本が最近発行されたばかりですが、買ってみる価値があると思います。YouTube動画を見るのも参考になります。
https://www.youtube.com/watch?v=HXjnDIgGDuI 

無料動画講座の紹介です―WordPressの使い方を知ろう

今日はクリスマスイブですね。雨が降っていますが、夜明け前に雪にはならないようです。暖かいです。今夜は多くの家にサンタさんが来ることと思います。メリークリスマス!
写真は10日ほど前に撮った前回紹介した、丘の上のイルミネーションです。昼間、散歩にいって丘の上のベンチに腰をおろしていると、近くでブーブーという鳴き声がして、あわてて丘を下りました。多分イノシシです‥‥。

さて、このブログはWordPressで作成しています。今私が勉強しているUdemyのWordPressの講座(「WordPress開発マスター講座」)の中に、無料でみられる「WordPressの使い方を知ろう―ボーナスレクチャー」というタイトルの動画(36本、トータルで3時間14分の動画)が公開されました。上のリンクをクリックして開くページで、「WordPressの使い方を知ろう―ボーナスレクチャー」の部分をクリックすると、動画の一覧がでてきますので、見たいものをプレビューのリンクをクリックして視聴できます。講師のたにぐち まこと(ともすた)先生はとてもわかりやすく上手に講義されるので、WordPressでブログを作ろうと思う方や、今作っている方に参考になると思います。

有料や無料の動画講座の紹介です

明日と明後日の19時から21時まで早稲田大学の早見先生による、PowerPointスライド作成実演ライブがYouTubeで開催されるそうです。面白そうなのでYouTubeで視聴されるとよいと思います。下の一つ目の動画は録画に替わっていますので、「ライブ配信準備中です」とでている部分をとばしてみれば11月20分の第一回目がみられます。

早見先生は「離散数学入門(グラフ理論の世界にようこそ)」という全14回の講義をYouTubeで公開されおり、とてもわかりやすいと評判です。グラフ理論は生命科学でも活用されている分野ですので興味のある方はご覧になるのをおすすめします。

今年になって知ったのですが、有料の講座にもいろいろ面白いものがあります。昔は定年になったら放送大学の講義を学ぶという方も多かったようですが、今では放送大学よりもっとわかりやすい有料講座や無料講座、無料講義がいろいろ公開されています。私も今年に入ってからUdemyという有料講座のコースをいろいろ購入して勉強をはじめました。こちらは定価は24000円のとか高い値段のコースが多いのですが頻繁にセールをやっていて、しばらく待っていると24000円のコースが1200円とか1600円とかで購入できる場合が多いです。時々サイトをチェックしてみて、安いときに購入するのがお勧めです。ちょうど今、ブラックマンデーセール(11月26日まで対象コースが1200円より)というのをやっていて、はじめるのには最適の時期だと思います。数学、RやRStudioを含む統計、Pythonなどのプログラミング、GitやGitHub、Docker入門講座もありますし、物理、化学、英語、フォトショップ、ヘルスやエクササイズの講座などなど、日本語の講座や英語の講座がいろいろありますので面白いです。Udemyのコースは修了期限がないので、安い値段のときに購入しておいてあとで時間ができたときに勉強することが可能です。コースの動画の一部が無料公開されているので、購入する前に、コースの動画を何本か視聴してみて、気に入れば購入するというのがいいと思います。

論文のレフリーのやり方―おすすめの査読の手引き書がでています

論文をだすようになると、査読依頼がくることが増えてきます。昔は査読の仕方は先輩や先生に教えてもらっていたのですが、最近とてもよい本が出たので紹介します。水島昇さんの本です。
「科学を育む 査読の技法+リアルな例文765」(羊土社)という本です。
https://www.yodosha.co.jp/yodobook/book/9784758121132/22.html
水島さんはノーベル賞を授賞された大隅先生の協同研究者でもあり、同時受賞を推す方も多かったと聞いています。私がJSTのさきがけの研究費をもらっていた時の仲間です。日本生化学会の会長もされていたことがあり、最前線で活躍されている科学者です。
この本は例文ものっていて、私が前に紹介していたように、オンラインで公開されているレフリーのコメント(たとえばここここにあります。前のEMBO journalのサイトでは論文を開いて、Peer Reviewというタブをクリックするとみられますし、後のeLifeのサイトでは論文を開いて、横のReferecesの下にあるDecision Letter―これは論文を掲載するかしないかなどについて編集部から著者へ送られてくるメールのことです―のところをクリックするとみられます)から学ぶ方法と組み合わせると、査読の要領がよくわかる絶対おすすめの本です。是非購入してお手元におかれることをすすめます。

なお九州大学の方はMaruzen eBook Libraryで無料で読めます。オンラインで読むのもいいですし、ダウンロードして読むのもおすすめです(ただし1日60ページの制限があります)。他大学の方もそれぞれの図書館がMaruzen eBook Libraryを契約しているならそちらで読むことが出来ると思います。
今日の写真は、秋の青空にかかる月(9月29日撮影)を背景に、落ち葉の季節の桜の木にかかったクモとクモの巣が写っています。拡大してよくみると一番下の枝の尖端あたりに蜘蛛がいるのがわかるのですが‥‥
昨日は散歩の途中、家の近くの路上でタヌキがたたずんでこっちを見ていました。ちょっと離れていたので、写真を撮ったのですがうまくとれませんでした。長いしっぽでよその家の庭にはいっていきました。間近にタヌキをみたのははじめてです。ハクビシンも住宅街をうろついています‥‥。

機械学習とかディープラーニングの学習のてびき

タンパク質の立体構造を予測するAIが生んだプログラムAlphaFold2は、AIの有効性を実感させてくれました。がぜんAIに対する興味がでてきたのですが、ディープラーニングとか機械学習とかの勉強にはこんな本はいかがでしょうか。
「高校数学からはじめるディープラーニング―初歩からわかる人工知能が働くしくみ」(講談社ブルーバックス。金丸隆志著)
私はAmazon Kindle版をポイント半額付加セールのときに買いました。Kindleは安売りがあるので紙の本よりいい時がありますね。内容はとてもわかりやすくておすすめの本だと思います。Excelのマクロもダウンロードできるようになっていて理解が深まるいい本です。

また統計やデータサイエンスの勉強には総務省統計局のサイト(先生向け)が面白そうです。小学校から中学、高校向けの教材、補助教材などがそろっていて、統計ではRの紹介もされています。高校向けの機械学習の補助教材の部分にある教科書とそれに付随するPythonコードは、Google Colaboratoryのジュピター・ノートブックの環境で実行することにより動作しますと書かれていて、結構本格的な教材のようです。内容には。線形回帰、サポートベクターマシン、決定木・ランダムフォレスト、ニューラルネットワーク、ナイーブベイズ法、K近傍法、因子分析、主成分分析、クラスター分析、アソシエーション分析が含まれており、教材、データなどが自由にダウンロードして使えます。

左の写真はお盆のころに山際に咲いていた百合の花です。今は右の写真のように種ができています。

Mathematicaの紹介です!

ヒマワリもアサガオもそろそろ花の数が減ってきて秋を感じさせる毎日です。さて今日はMathematicaの紹介です。MathematicaはStephen Wolframという人が開発した有料ソフトで数値計算と数式処理ができますし、最近では画像や音声、信号処理、機械学習、統計解析、バイオインフォマティクスなど広範囲で利用されています。Pythonなどのプログラミング言語に比べてプログラムが格段に簡単で、自然言語での入力も可能になるなど科学の研究、学習には必須といってよいソフトでしょう。先日、微分方程式の解き方の講演があったのでオンライン参加してみました。講師の丸山 耕司先生は理論物理(御専門は量子情報、量子制御理論など)出身の方で、Wolfram社のブログなどの他、雑誌「数理科学」に寄稿されたり、「動かして学ぶ量子コンピュータプログラミング」(O’Reilly Japan)という本の監修、そして量子力学の定番教科書サクライの現代の量子力学 第2版(最近原書の第3版がでています)の問題解説(演習 現代の量子力学 第2版 J.J.サクライの問題解説)(吉岡書店)の著者の方でした。微分方程式の解き方の基本のキから学べる講義でしたので、以下のリンクから無料登録して講演をご覧になるのをお勧めします(2021/10/31までの期間限定での公開ですので注意してください)https://www.bigmarker.com/series/solving-differentialequations-ja/series_details?utm_bmcr_source=twitterまたWolfram Japanのtwitterにこの講義の他、Mathematicaによる微分積分学入門など関連したいろいろな情報がでているので参考にしてください。リンクはこちらです。
https://twitter.com/WolframJapan

MathematicaはWolfram言語というプログラミング言語で動くソフトです。Wolfram言語は、日常言語とかわらない命令もうけつけるように設計されていて、プログラミング初心者にもきわめてやさしい、そして短いコードで、高度なプログラムが書けるすぐれたソフトウエアです。Wolfram言語の入門書としては開発者のWolframの書いたAn Elementary Introduction to the Wolfram Language 第2版がおすすめです。この開発者自身が書いたWolfram 言語(Mathematicaで使われているプログラム言語)の解説本は以下のリンクで無料で読める他、オンラインでWolfram 言語を使って学習できるので興味のある方は下のリンクにアクセスしてみてください。
https://www.wolfram.com/language/elementary-introduction/2nd-ed/

英単語の発音を調べるサイト―FASTA, GWAS, RNAseq, glycocalyx, Entrezなど正しく発音できますか?

毎日うだるような暑さですがお元気でしょうか。今日は英語の話です。
英語で発表しようとする時や、会話のとき、この単語の発音でいいのかな?と思うことがよくあります。そんなときはYouGlishというサイト(リンク集にいれてあります)にアクセスして、検索窓に発音を調べたい単語を入れて、Say It!というボタンを押しましょう。するとYouTubeの音声コーパスからその単語を含む動画を選び出して再生してくれます。動画の下には、その単語を含む文(字幕)が表示されます。いくつかの動画をみて比較したいときは、次の動画のボタンを押すと別の動画が同様に再生されます。これは便利なサイトです。Improve your English pronunciation using YouTubeというタイトルのサイトです。

ブックマーク必須のサイトですので、是非試してみてください。
以下はこのサイトを使ってみるための 練習問題です。それぞれの単語を検索窓にいれて発音を調べてみてください。面白い動画も見つかると思います。

RNAseq  (アール・エヌ ・エー・セックという人が多いですが‥本当はどう発音するでしょう)
glycocalyx (細胞表面を覆っている糖衣)
sialic acid  (シアル酸)
GWAS (ゲノムワイド関連解析―この解析でABO式血液型物質合成遺伝子と血液凝固に関係があることや、新型コロナウイルスの劇症化とABO式血液型が関連することも解明されています)
FASTA  (塩基配列やタンパク質のアミノ酸配列を記述する標準記載形式です。ファスタという発音も正しいですが、ファストエイと読む人も多いです)
Entrez (NCBIのデータベースの入り口ですが、フランス語として読むようです), genome (ゲノムですが英米人の発音はどうでしょうか?)
Lucretius (ルクレチウス)
などなど、いろいろ遊んでみてください。

出てくる動画は、基本的なものが選ばれているので、動画をはじめから見るのも勉強になりますよ。

写真は散歩の途中でみつけた錦鯉です。なんと川の中を泳いでいます。梅雨入りのころには上流500メートルあたりに泳いていましたが、梅雨の増水で流されたようで少しづつ下流へ移動して今は橋の下で悠々と泳いでいます。これを書いている最中に町内で野生のサルが出没しているので出会ったら家の中に避難するようにという放送が入りました。イノシシやタヌキは時折見かけますが、サルは怖いですね。京都の家の柿の木には毎年サルが実を食べにやってきていました。飼っていた犬が木の上にいるサルに吠えて、まるで絵本のような情景でした。近くの駅では、小学校の下校時にサルが電車の駅のベンチに座っていて、子供たちが逃げるようにして電車に乗り込んでいたそうです。昔の話です。

AlphaFoldを試してみています―生物学の革命:タンパク質の立体構造を驚異的精度で予測するGoogleのAI

7月16日早朝、アミノ酸配列を入力すると、その配列をもつタンパク質(蛋白質)の立体構造をほぼ完璧に予測できるというGoogleのDeep Mind系列の人工知能ソフトAlphaFold2の論文とソフトが公開されて、ものすごい反響を呼んでいます。
生物学の革命を今まのあたりにしているのだと思います。タンパク質の立体構造を予測するプログラムのコンテストで驚異の成績で優勝したソフトです。コンテストは、構造解析の実験で立体構造がわかっているがまだ立体構造が未公開のタンパク質のアミノ酸配列を問題として与えて、参加したグループが立体構造の予測を競うというものです。ここのところあまり良い結果がでていなかったそうです。そこに突如参加したAlphaFoldというGoogleのグループが初回でトップの成績をあげ、二回目の去年の大会では、改良版AlphaFold2がほとんどの問題で実験結果とぴったりの予測に成功して世間を震撼させたのでした。このソフトとアルゴリズム、AIの学習データセットの公開が待たれていたのですが、ついに公開されて全世界でAlphaFoldがブームになっているようです。7月16日早朝、雑誌Natureに論文が公開されて
https://www.nature.com/articles/s41586-021-03819-2
プログラムも一般公開されました。
https://github.com/deepmind/alphafold

プログラムの導入方法や使い方については、以下の森脇 由隆さんの記事が最高にわかりやすいのでご覧ください。
https://qiita.com/Ag_smith/items/7c76438906b3f665af38

Twitterも参考になります。https://twitter.com/Ag_smith
上の記事によると使用するコンピュータはlinuxの動くパソコンでメモリが32ギガバイトから64ギガバイト(それ以上ならなおよいでしょう)、ディスク容量はデータベースをダウンロードする必要があるので4テラバイト以上必要です。計算スピードが必要なので高速のSSDドライブを使うのがいいそうです。M.2 SSDという最新型のドライブ(メモリーみたいに差し込むだけで使えるのでSSDをつなぐケーブルとかがないものです)のパソコンがおすすめです。グラフィックボードはRTX3060以上がよいそうです。この森脇先生はRyzen9 5900X, RTX3090, HDD 8TBで使った場合、二時間余りで立体構造の計算結果がでるとTwitterに書かれていました。

残念ながら私のパソコンはこのスペックではなかった(ディスク容量不足など)ため、新たに購入する必要がありそうです。ただグラフィックボードはビットコインのマイニングで品薄となっていて昔10万したものが倍の値段になっていたりするので、あまりこれにお金はかけずに第四世代のPCIe (PCI express:Peripheral Component Interconnect Express)対応のマザーボードとPCIe 4.0対応のM.2 SSDで高速化を図るほうがよいと、阪大の先生からアドバイスをもらいました。

ということで、自分のパソコンでは動かないので、パソコンを組み立てる前に、Google Colaboratoryで利用できAlphaFold2を使ってみることにしました。Googleのアカウントを取得しておいて、以下のurlからアカウントとのログイン名とパスワードを使ってログインして使います。
https://colab.research.google.com/drive/1LVPSOf4L502F21RWBmYJJYYLDlOU2NTL
使い方は簡単で、アミノ酸配列を入力部分にペースト、上のほうにあるランタイムのプルダウンメニューからランタイムのタイプを変更を選んでGPUを使うに設定し保存、その後入力アミノ酸配列を確認して、ランタイムからすべてのセルを実行を選んで開始します。

さっそく私達が解析していたN型糖鎖の合成の第一段階で働く酵素DPAGT1の線虫版algn-7遺伝子産物を解析してみました。2時間弱で解析がおわりました。結果が冒頭の写真です。5つの予測結果が返ってきてダウンロード可能です。このサイトに書いてあるように、GPUの割当が不足で計算が途中で止まることもある(たとえば全長2300アミノ酸のタンパク質を解析しようとしたらだめでした)ようですが、1000アミノ酸程度の長さのものなら1-2時間で解析が終わります。

ところがビッグニュースが今日とびこんできました。なんと21の生物種のプロテオームのAlphaFold2による解析がすでに終了しており、その解析結果がダウンロード可能になっています。要するに21種の生物の全タンパク質のAlphaFold2による立体構造解析結果が一括でダウンロードできるというわけです。
ヒト、マウス、ゼブラフィッシュ、シロイヌナズナ、大腸菌、線虫C. elegansなど主なモデル生物種が網羅されています(以下のリンクをクリックしてください)。私は早速 線虫のタンパク質の解析結果をダウンロードしました。
https://alphafold.ebi.ac.uk/download

For downloading all predictions for all species, visit the FTP site:
ftp://ftp.ebi.ac.uk/pub/databases/alphafold
だそうですので、ftpでダウンロードするのもよいでしょう。

ダウンロードしたプロテオームファイルはtar圧縮ファイルなのでWindowsのパソコンなら7-zipなどの解凍ソフトで解凍します。
解凍されたファイル(まだgz拡張子がついた圧縮ファイルです)にはファイル名にUniprotのタンパク質登録名が入っています。たとえば上で解析したN型糖鎖合成の第一段階をつかさどる酵素(algn-7遺伝子の作る酵素)の立体構造解析の結果を調べたいとします。このタンパク質はUniprotではQ9U1Z2という登録名なので、解凍したフォルダのなかでQ9U1Z2という名前の入っているファイルを検索します。
するとファイル名がAF-Q9U1Z2-F1-model_v1.pdb.gzとAF-Q9U1Z2-F1-model_v1.cif.gzという二つの圧縮ファイルが見つかりました。これらをそれぞれ7-zipで解凍してできるのがAlphaFoldによる予測結果です。
解凍してできたpdbファイルはオンラインでは
https://www.ncbi.nlm.nih.gov/Structure/icn3d/full.html
にアクセスしてパソコンのファイルを指定してloadすれば、立体構造を手軽にみることができます。以下の写真がダウンロードしたpdbファイルを表示した写真です。私が昨日解析した上の結果とほとんど同じです。

またcifファイルはJmolとかで読み込めば立体構造が簡単にみられます。Jmolのダウンロードは以下から可能です。
http://jmol.sourceforge.net/
Jmolの使い方はここにあります。要するにjmol.batというファイルをダブルクリックしたら使えるので簡単です。
https://katakago.sakura.ne.jp/soft/jmol/jmol-pc.html

Uniprotにもヒトのタンパク質についてはAlphaFold2の予測結果は掲載されているようですが、まだ掲載されていない生物種も多いのでこのダウンロードファイルは貴重ですね。

(おまけの追記です。2021/07/24)
以下のリンクに詳しい説明とダウンロードリンクもあります。
https://insideuniprot.blogspot.com/2021/07/alphafold-structure-predictions-freely.html
このリンクにある記事を参考にヒトのタンパク質のAlphaFoldによる解析例を紹介します。ヒトの遺伝子の例として、私達が以前研究していたコンドロイチン合成酵素chondroitin synthase 1 (CHSY1)についてみてみましょう。UniprotでCHSY1とhumanの二語を検索窓に入れて検索すると、一番上の検索結果にQBX52というのがあります。
https://www.uniprot.org/uniprot/Q86X52
これをクリックしてみると、このタンパク質についてのすべてが載っているのですが、Structureの項目を探してみると、そこにAlphaFold2による予測結果が載っています。そこにあるAlphaFoldというリンクをクリックすると予測結果のページが表示されますのでご覧ください。
https://alphafold.ebi.ac.uk/entry/Q86X52

カエルの王様バラの中に―Wikipediaのダウンロード法

お昼前に買い物から帰って家に入るとき、奥さんが「わっ、 カエルがいる!」と叫んでカメラをとりにきました。さっそく見にいくと、バラの花の中にアマガエルがくつろいでいました。写真は奥さんが撮影した薔薇の花の中でくつろぐ、アマガエルです。去年も5月にアマガエルをみかけましたので、花の中で虫を取っているのかもしれません‥‥。

さて今日の本題です。Wikipediaのデータをダウンロードしておいて、インターネットにつながずに利用する方法があるそうです。やってみると今後いろいろWikipediaの利用法が拡がると思います。やりかたはKiwixというフリーソフトをダウンロードしておいて、これでWikipediaのデータ(zimファイルというファイル形式です)をダウンロードして利用するだけです。日本語のページはこちらです。英語版の完全版だと83Gくらいのデータのダウンロードが必要ですので、もっとサイズの少ない日本語版とか、ずっと小さなサイズの分野別Wikipediaとかをつかって練習してみてから、巨大ファイルのダウンロードに挑戦するべきでしょう。

以下はKiwixの日本語版ページからの引用です。
「Kiwixは非常に簡単です。Kiwixは利便性を考えたさまざまな機能があります。

  • 全文章からの検索
  • お気に入りとメモ
  • HTTPサーバー
  • PDF形式、HTML形式にエクスポート
  • 100言語以上のUI(ユーザーインターフェース)
  • タブによるネットサーフィン
  • 記事をまとめたウィンドウマネージャーとダウンローダー
  • その他さまざまな機能…
    WikipediaだけではなくてWiktionaryなどもダウンロードできます。英語版、フランス語版、ドイツ語版その他各国語版のWikipediaもありますので必要なものからダウンロードして使ってみてください。