AlphaFoldを試してみています―生物学の革命:タンパク質の立体構造を驚異的精度で予測するGoogleのAI

7月16日早朝、アミノ酸配列を入力すると、その配列をもつタンパク質(蛋白質)の立体構造をほぼ完璧に予測できるというGoogleのDeep Mind系列の人工知能ソフトAlphaFold2の論文とソフトが公開されて、ものすごい反響を呼んでいます。
生物学の革命を今まのあたりにしているのだと思います。タンパク質の立体構造を予測するプログラムのコンテストで驚異の成績で優勝したソフトです。コンテストは、構造解析の実験で立体構造がわかっているがまだ立体構造が未公開のタンパク質のアミノ酸配列を問題として与えて、参加したグループが立体構造の予測を競うというものです。ここのところあまり良い結果がでていなかったそうです。そこに突如参加したAlphaFoldというGoogleのグループが初回でトップの成績をあげ、二回目の去年の大会では、改良版AlphaFold2がほとんどの問題で実験結果とぴったりの予測に成功して世間を震撼させたのでした。このソフトとアルゴリズム、AIの学習データセットの公開が待たれていたのですが、ついに公開されて全世界でAlphaFoldがブームになっているようです。7月16日早朝、雑誌Natureに論文が公開されて
https://www.nature.com/articles/s41586-021-03819-2
プログラムも一般公開されました。
https://github.com/deepmind/alphafold

プログラムの導入方法や使い方については、以下の森脇 由隆さんの記事が最高にわかりやすいのでご覧ください。
https://qiita.com/Ag_smith/items/7c76438906b3f665af38

Twitterも参考になります。https://twitter.com/Ag_smith
上の記事によると使用するコンピュータはlinuxの動くパソコンでメモリが32ギガバイトから64ギガバイト(それ以上ならなおよいでしょう)、ディスク容量はデータベースをダウンロードする必要があるので4テラバイト以上必要です。計算スピードが必要なので高速のSSDドライブを使うのがいいそうです。M.2 SSDという最新型のドライブ(メモリーみたいに差し込むだけで使えるのでSSDをつなぐケーブルとかがないものです)のパソコンがおすすめです。グラフィックボードはRTX3060以上がよいそうです。この森脇先生はRyzen9 5900X, RTX3090, HDD 8TBで使った場合、二時間余りで立体構造の計算結果がでるとTwitterに書かれていました。

残念ながら私のパソコンはこのスペックではなかった(ディスク容量不足など)ため、新たに購入する必要がありそうです。ただグラフィックボードはビットコインのマイニングで品薄となっていて昔10万したものが倍の値段になっていたりするので、あまりこれにお金はかけずに第四世代のPCIe (PCI express:Peripheral Component Interconnect Express)対応のマザーボードとPCIe 4.0対応のM.2 SSDで高速化を図るほうがよいと、阪大の先生からアドバイスをもらいました。

ということで、自分のパソコンでは動かないので、パソコンを組み立てる前に、Google Colaboratoryで利用できAlphaFold2を使ってみることにしました。Googleのアカウントを取得しておいて、以下のurlからアカウントとのログイン名とパスワードを使ってログインして使います。
https://colab.research.google.com/drive/1LVPSOf4L502F21RWBmYJJYYLDlOU2NTL
使い方は簡単で、アミノ酸配列を入力部分にペースト、上のほうにあるランタイムのプルダウンメニューからランタイムのタイプを変更を選んでGPUを使うに設定し保存、その後入力アミノ酸配列を確認して、ランタイムからすべてのセルを実行を選んで開始します。

さっそく私達が解析していたN型糖鎖の合成の第一段階で働く酵素DPAGT1の線虫版algn-7遺伝子産物を解析してみました。2時間弱で解析がおわりました。結果が冒頭の写真です。5つの予測結果が返ってきてダウンロード可能です。このサイトに書いてあるように、GPUの割当が不足で計算が途中で止まることもある(たとえば全長2300アミノ酸のタンパク質を解析しようとしたらだめでした)ようですが、1000アミノ酸程度の長さのものなら1-2時間で解析が終わります。

ところがビッグニュースが今日とびこんできました。なんと21の生物種のプロテオームのAlphaFold2による解析がすでに終了しており、その解析結果がダウンロード可能になっています。要するに21種の生物の全タンパク質のAlphaFold2による立体構造解析結果が一括でダウンロードできるというわけです。
ヒト、マウス、ゼブラフィッシュ、シロイヌナズナ、大腸菌、線虫C. elegansなど主なモデル生物種が網羅されています(以下のリンクをクリックしてください)。私は早速 線虫のタンパク質の解析結果をダウンロードしました。
https://alphafold.ebi.ac.uk/download

For downloading all predictions for all species, visit the FTP site:
ftp://ftp.ebi.ac.uk/pub/databases/alphafold
だそうですので、ftpでダウンロードするのもよいでしょう。

ダウンロードしたプロテオームファイルはtar圧縮ファイルなのでWindowsのパソコンなら7-zipなどの解凍ソフトで解凍します。
解凍されたファイル(まだgz拡張子がついた圧縮ファイルです)にはファイル名にUniprotのタンパク質登録名が入っています。たとえば上で解析したN型糖鎖合成の第一段階をつかさどる酵素(algn-7遺伝子の作る酵素)の立体構造解析の結果を調べたいとします。このタンパク質はUniprotではQ9U1Z2という登録名なので、解凍したフォルダのなかでQ9U1Z2という名前の入っているファイルを検索します。
するとファイル名がAF-Q9U1Z2-F1-model_v1.pdb.gzとAF-Q9U1Z2-F1-model_v1.cif.gzという二つの圧縮ファイルが見つかりました。これらをそれぞれ7-zipで解凍してできるのがAlphaFoldによる予測結果です。
解凍してできたpdbファイルはオンラインでは
https://www.ncbi.nlm.nih.gov/Structure/icn3d/full.html
にアクセスしてパソコンのファイルを指定してloadすれば、立体構造を手軽にみることができます。以下の写真がダウンロードしたpdbファイルを表示した写真です。私が昨日解析した上の結果とほとんど同じです。

またcifファイルはJmolとかで読み込めば立体構造が簡単にみられます。Jmolのダウンロードは以下から可能です。
http://jmol.sourceforge.net/
Jmolの使い方はここにあります。要するにjmol.batというファイルをダブルクリックしたら使えるので簡単です。
https://katakago.sakura.ne.jp/soft/jmol/jmol-pc.html

Uniprotにもヒトのタンパク質についてはAlphaFold2の予測結果は掲載されているようですが、まだ掲載されていない生物種も多いのでこのダウンロードファイルは貴重ですね。

(おまけの追記です。2021/07/24)
以下のリンクに詳しい説明とダウンロードリンクもあります。
https://insideuniprot.blogspot.com/2021/07/alphafold-structure-predictions-freely.html
このリンクにある記事を参考にヒトのタンパク質のAlphaFoldによる解析例を紹介します。ヒトの遺伝子の例として、私達が以前研究していたコンドロイチン合成酵素chondroitin synthase 1 (CHSY1)についてみてみましょう。UniprotでCHSY1とhumanの二語を検索窓に入れて検索すると、一番上の検索結果にQBX52というのがあります。
https://www.uniprot.org/uniprot/Q86X52
これをクリックしてみると、このタンパク質についてのすべてが載っているのですが、Structureの項目を探してみると、そこにAlphaFold2による予測結果が載っています。そこにあるAlphaFoldというリンクをクリックすると予測結果のページが表示されますのでご覧ください。
https://alphafold.ebi.ac.uk/entry/Q86X52

カエルの王様バラの中に―Wikipediaのダウンロード法

お昼前に買い物から帰って家に入るとき、奥さんが「わっ、 カエルがいる!」と叫んでカメラをとりにきました。さっそく見にいくと、バラの花の中にアマガエルがくつろいでいました。写真は奥さんが撮影した薔薇の花の中でくつろぐ、アマガエルです。去年も5月にアマガエルをみかけましたので、花の中で虫を取っているのかもしれません‥‥。

さて今日の本題です。Wikipediaのデータをダウンロードしておいて、インターネットにつながずに利用する方法があるそうです。やってみると今後いろいろWikipediaの利用法が拡がると思います。やりかたはKiwixというフリーソフトをダウンロードしておいて、これでWikipediaのデータ(zimファイルというファイル形式です)をダウンロードして利用するだけです。日本語のページはこちらです。英語版の完全版だと83Gくらいのデータのダウンロードが必要ですので、もっとサイズの少ない日本語版とか、ずっと小さなサイズの分野別Wikipediaとかをつかって練習してみてから、巨大ファイルのダウンロードに挑戦するべきでしょう。

以下はKiwixの日本語版ページからの引用です。
「Kiwixは非常に簡単です。Kiwixは利便性を考えたさまざまな機能があります。

  • 全文章からの検索
  • お気に入りとメモ
  • HTTPサーバー
  • PDF形式、HTML形式にエクスポート
  • 100言語以上のUI(ユーザーインターフェース)
  • タブによるネットサーフィン
  • 記事をまとめたウィンドウマネージャーとダウンローダー
  • その他さまざまな機能…
    WikipediaだけではなくてWiktionaryなどもダウンロードできます。英語版、フランス語版、ドイツ語版その他各国語版のWikipediaもありますので必要なものからダウンロードして使ってみてください。

データサイエンス向けにおすすめの統計学の教科書の紹介です

インターネットをみていると、初心者向きの統計学の教科書を見つけました。「データ分析のための統計学入門 原著第4版 “OpenIntro Statistics Fourth Edition”」という本で、日本統計協会から翻訳本が市販されています。この本は訳者のお一人である国友直人先生のweb pageにpdfがおいてあるので無料でダウンロードして読むことができます。
原本のOpenIntro Statisticsという本は無料公開されており、上の訳本の中でも関連サイトが詳しく紹介されています。この訳本では問題の解答は省略されていますが、英語の原本pdfには練習問題の一部の解答が載っているので原本をダウンロードして合わせて使うとよいでしょう(上にあるリンクの本の購入ページでYou Pay 15$とある部分のスライダを左に動かして0ドルにしてcartにいれ、購入手続きでemailアドレスをいれるとダウンロードできます。0ドルの領収書がメールで送られてきます)。英語のサイトには解説ビデオ(下のほうにvideoのリンクがあります。クリックするとYouTubeビデオが開くので字幕オンにしてみるとよいです)やRプログラミング言語での勉強用リンクもあります(各章の表題の下の部分にある Software LinesというリンクをクリックするとRやRStudio、Pythonその他でのコードのページが開きます。たとえばChapter  5. Foundations for Inferenceの下にあるIntro to Inferenceの部分をクリックして開いたページでLab: R (Base)とある部分をクリックするとこんなページが開きます。Pythonコードのページとかもありますので適宜利用してください。)また訳者によるRの簡単なイントロも訳本のページ(R・エクセル・基礎数学と題したpdf)にあるのでご覧ください。データそのものはzipファイルでダウンロードできますし、こちらにはR用のデータやデータのcsvファイルなどもそろっています。またRのパッケージとしてもデータが公開されているのでR でパッケージを読み込んで使うこともできます。
医学生物学向きには同様な無料本(Harvard大学の先生が書いたものです)
Introductory Statistics for the Life and Biomedical Sciencesがあります。こちらは英語版ですが、上の本と同様にRのコードへのアクセスリンクもスライドもありますので、よかったらダウンロードして読んでみてください。

4月11日の日曜日は快晴で青空がとても綺麗な一日でした。我が家のリンゴの木にも沢山花が咲きました。

当日は県知事選挙の日。病気で九大病院に入院された小川知事の辞職にともなって実施される福岡県知事選挙の投票に歩いてでかけました。丁度お昼どきだったので会場には投票する人が、私達二人をふくめて3人しかいません。会場のコロナ対策は万全でした。換気万全の投票所ですが、まず入り口にアルコール消毒液が備えられていて手指を消毒、その後非接触型体温計で体温を測り入場します。投票券をマスクの職員の方に手渡すと、手袋した手で受け取り、アクリル遮蔽板を介してやり取りします。あとは投票用の消毒済み鉛筆と投票用紙を手渡されて記入台で候補者名を書いて投票です。鉛筆はそこで回収されます。コロナ蔓延下での選挙も何度も行われているので対策も洗練されてきた感じがします。選挙結果は予想通り、8時の開票と同時に当選確実がでるというものでした。COVID-19下での選挙制度の洗練度を確認できてよかったです。

福岡では桜が満開です―iPadのTipsの本と動画の紹介

(注:このブログでは、12ポイント太字の部分はリンクです。クリックすると該当ページが開きます。)
今年は福岡の桜の開花が早く、もはや満開を迎えてはらはらと散り始めているところもあります。卒業式も終業式も終わって、今は春休み。一昨日、昨日、今日と近所でお花見をしましたが、春休みの小学校の前では、この4月に新一年生になるお子さんが、満開の桜のもとでランドセルを背負って記念撮影してもらっていました。春爛漫です。

図書館でiPadについての新刊を借りてきました。iPadクリエイティブという本です。紙の本と電子ブック両方があります。これはおすすめです。たとえばiPadで読んでいる電子ブックの必要ページをpdfにする方法とか、アップルペンシルの賢い使い方などいろんなtipsが満載で、買って損がない本です。著者のamity_senseiの本の紹介動画とtipsの動画の一例を、下に貼り付けておきます。

こちらは、
「みんなが知らない、純正アプリのiPad読書術。【Kindle × Apple Books】」という動画で、Apple BooksやKindleといった電子ブックの紹介、およびpdf化のやりかたの紹介です。


是非チャンネルをご覧ください。
あと、YouTubeですが、Braveというブラウザでみると広告が抑制されているようです。広告スキップがうっとおしいと思われる方は試してみると良いと思います。広告ブロック機能が強力なブラウザですし、FirefoxやChromeなどからのブックマークの移行も自動で行われて便利です。プライバシーに配慮したブラウザで、なんとプライベートブラウジングモードはTorを使っています。

Clonezillzaの使い方―LinuxやWindowsのまるごとバックアップのやり方

(注:このブログでは、12ポイント太字の部分はリンクです。クリックすると該当ページが開きます。)
日経Linux2020年11月号の付録にClonezilla 2.6.7-28のISOファイルがついていました。このソフトはLinuxやWindows(MacやChromeOS、アンドロイドなども可能)のシステムを、まるごとバックアップをするフリーソフトでここからダウンロード可能です(最新版は2.7.0-10)。使用しているブロックだけをバックアップするので、短時間でイメージやクローンがつくれます。ちょうど今まで利用していたLinux LTS版(ubuntu 16.04 LTS)のサポートがきれていたので、現在の環境をClonezillaでバックアップしておいて、最新版のLTSを入れなおすことにしました。
このソフトはNorton GhostとかTrue Imageとかいう有料ソフトと同様なソフトで、Windows やLinux、Macなどのイメージをつくっておいて、必要になったらそのイメージから現在のシステムを復活する(リストアする)ことができます。
注意点ですが、このソフトでは、まずバックアップ先を指定した後、バックアップするシステムを指定するという順番でバックアップします。つまりバックアップ用の外付けハードディスあるいはUSBメモリなどをまず指定し、その後、現在使っていてバックアップしたいドライブ(バックアップ元といわれるもので、複数同時指定可能)を指定してバックアップするのです。
ネット検索してみても日本語で使い方の詳しい説明をしているサイトがあまりなかったので、以下に具体的なやり方をまとめておきます。
1)まずClonezillaのサイトからClonezilla LiveのISOイメージファイル (ubuntuベースのものでなくて、DebianベースのものでOKです)をダウンロードします。ダウンロードしたISOファイルから起動用USBメディアをEtcherというソフトを使って作成します。EtcherというこのソフトはWindows, Mac, Linuxなどに対応しており、一発で起動用USBを作成できるソフトです。イメージファイルのありかを指定し、USBメモリを選び、ボタンを押すだけでブート用USBメモリができあがります。前に紹介したRufusというソフトも利用できますが、Etcherのほうが簡単です。(もちろんClonezillaのISOイメージをCDやDVDに焼いて、CDやDVDから起動して利用することもできます。)
2)次に、システムのイメージを保存するUSBドライブあるいはハードディスクドライブなどを決めて、その中にイメージ保存用のフォルダを作っておいてください。英語名のフォルダを作っておきます。(私は今回はCloneZilla_demoという名前のフォルダにしました。)ディスクにパーティションを切ってある場合は、どのパーティションを保存先に選ぶかを、容量や大事なファイルの有無(万が一のエラーでファイルが壊れることもあるかと思います)などを考慮してきめます。重要なファイルが入っているディスクやパーティションは壊れると怖いので、大事なファイルは別の場所にバックアップしておくことを薦めます。私は何もファイルがはいっていないパーティションにイメージ保存用のフォルダを作りました。まっさらのUSBメモリだとより安心ですね。保存用のフォルダを中に作成できたら、準備は完了です。

3)上の1)で作成したブート用USBメモリをパソコンに差し込んで起動します。Clonezillaが起動します。起動しない場合はUEFIのブートメニューを(F11キーなどマザーボードに応じたキーを押して)表示してUSBメモリを選べば起動します。古いパソコンでBIOSのもの(legacy BIOS)では起動順序をUSB優先に変えなくてはいけないかもしれません。うまくブートメディアから起動したら次に進みます。
4)上の写真のような起動画面が表示されますので、一番上のデフォルト(Clonezilla live)のままエンターを押す、あるいはしばらく放置しておくと下の写真のような言語選択画面になります。矢印キーで日本語を選びます。enterを押して次に進みます。
5)「キーボードのレイアウトを変更?」の画面、デフォルトのキーボードレイアウト(英語キーボード)を維持の選択のままenter。
6)Clonezillaを開始します のメニューがでます。そのままenter。
7)Clonezilla-オープンソース複製システム(OCS)という画面が開きます。今回はディスクイメージを作って保存したいので、開いたメニューで一番上にある「device-image ディスク/パーティションイメージ」(デフォルトで選ばれている)を選んだままenter。
8)Clonezilla  イメージディレクトリのマウントという画面がでます。(ここからがイメージの保存先の設定になります)一番上の「local_dev ローカルディスク(例=ハードディスク、USBドライブ)をマウント」が選ばれているのでそのままenter。
すると、次の写真のように「Clonezilla イメージリポジトリとしてUSBディバイスを使用したい場合」というメッセージが下部に表紙されるので、イメージ保存用のUSBディバイスを接続します。5秒以上待つとUSBディバイスが認識されるのでenter。
9)すると画面がかわって、現在認識されているストーレッジの一覧が表示されます。イメージを作ろうとしているハードディスクと、さっき接続したイメージ保存用のUSBディバイスが表示されているのを確認してください。皆さんのパソコンによりますが、例えば/dev/sda、/dev/sdb、/dev/sdcなどと表示されると思います。私のパソコンの場合、sdaがSSDでメインディスク、sdbが補助のハードディスクで、sdcは今接続した外付けハードディスクです。これで全部のドライブが表示されているのでCtrl-Cを押します(Ctrlキーとcを同時に押します)。上の写真ではsda、sdb、sdcなどの後に表示されているハードディスクの型番などを消してあります。

10) こんどは「Clonezilla-オープンソース複製システム(OCS)|モード」という画面になります。
さきほど表示されたsda、sdb、sdcのそれぞれのディスクの詳細が表示されています(上の写真)。私の場合はsdcのパーティションsdc2にイメージを保存する予定なので矢印キーでsdc2を選びます。enter。(註:この写真の場合、sda1は200.9Gのext4形式でフォーマットされているSDDであり、sdb1は1.8テラバイトのディスク、sdc1は2Tバイトのntfs形式でフォーマットされているボリューム(パーティション)、sdc2も同様で、sdc3は1.6Tバイトのntfs形式でフォーマットされたボリューム(パーティション)だとわかります。写真ではsda1, sdb1などのディバイスのメーカー型番などは消してありますが本当はIn_以下の部分に詳しく表示されています。)
11) 次は「Clonezilla イメージリポジトリ用のディレクトリブラウザ」という画面になります。私の場合、sdc2を選んだのでその内容が表示されています。いちばん上にあるゴミ箱recycling binが選択されていますが、あらかじめ2)で作っておいたCloneZilla_demoというディレクトリにイメージを保存するので、矢印キーでそれを選びます。選んだらenter。
12)次は保存先の最終確認画面になります。/dev/sdc2[/CloneZilla_demo/]というように、保存先として選んだディレクトリが表示されているので、画面の指示どおり、Tabキーを押してDoneを選択します。そしてenter。するとこの画面の画面下部に黒地に白で保存先の容量と名称などが表示されます(下の画像)。OKなのでenter。
13)画面が替わって、「Clonezilla-オープンソース複製システム(OCS)」の画面で初心者モードを選べる画面となります。デフォルトで選択されている初心者モードを選んでenter。
14)次は「モードを選択してください」 の画面です。「ローカルディスクをイメージに保存」を選びます。enter。(他にパーティションをイメージに保存するモードも選べます。)
15)すると「イメージの保存名を入力してください」という画面になります。西暦と月日からなる保存名がついています。そのままでもいいです。enter。

16)ここからは、 いよいよ保存したいローカルディスク(コピー元)の選択画面となります。私の場合は、sdaとsdbを保存したいのでスペースを押してまずsdaを選択。次に矢印キーで下のsdbを選び、スペースを押してsdbも選択します。選択完了したドライブには先頭に星印*がつきます。17)次の画面は、「Clonezilla 拡張パラメータ| モード savedisk」という画面で、圧縮オプションの選択画面となります。一番上の「zip 並列 GZIP圧縮を使用(マルチコア/SMP用)」でOKなのでこれを選んでenter。(画像は省略しました)
18)次は、ファイルシステムの保存前のチェックの画面となります。これはNTFSシステムを使っているwindowsでは使えません。Linuxなどではチェック可能ですなどと書かれています。今回はディスクに問題はないので、「元ファイルシステムのチェック/修復をスキップする」を選んでenter。

19) イメージ保存後、保存イメージが復元可能かどうかのチェックをするかどうかのオプションです。「はい 保存イメージをチェックします」を選んでenter
20) 画面が替わって、イメージを暗号化しますか?の画面となります。暗号化しないのでそちらを選んでenter。
21)すべての処理の完了後に実行される操作の選択画面です。一番上の「すべての処理の完了時に実行する、再起動シャットダウン他を選択してください」というメニューのままでenter。下に黒地で緑のメッセージが表示されます。確認してenter。
22)すると緑のメッセージの下に、ずらーっとメッセージがならんで表示されます。この中には、これからイメージを作成するドライブについての情報があるので確認しましょう。黒地に黄色の文字で「次のステップは、このマシンのハードディスク・パーティションをイメージとして保存することです。本当に続けてよろしいですか?(y/n)」と聞いてきます。よろしければyを押します。これでイメージ作成が始まります。
23)進行状況の画面がしばらく表示されます。数時間以上かかると思いますので気長に待ちましょう。以下のようにイメージは復元可能ですというメッセージがでたらほぼ完了です。確認してenter。
24)すると次の画面がでます。この画面で矢印キーを使って、電源offを選んでenterで終了です。再起動その他も選べます。

Pythonの勉強用におすすめの本(12/09動画について追記しました)

PythonはRとならんでおすすめのプログラミング言語です。医学部で教えている野村研の卒業生もPythonの講義をしているそうです。物理科学系だけではなく生命科学分野でもPythonを使えると断然有利になります。まったく初心者の方への入門書としては、いちばんやさしいPythonの教本 第2版 人気講師が教える基礎からサーバサイド開発までなどはどうでしょうか。第2版はみていないのでわかりませんが、プログラミングに使うエディターはAtomよりはVSCode(Visual Studio Code)のほうが良いと思います。まず初心者用の入門書で概要がわかったら、次は「すっきりわかるPython入門」をおすすめします。この本はAnacondaをつかってPythonをインストールしていくという、最近主流の入門スタイルで書かれています。大変よくわかるとうちの奥さんのおすすめ本です。出版社のサイトのリンクを下に書いておきます。この本のサイトの「掲載ツール導入・利用ガイド」の項目には、AnacondaやJupyterLabのインストールのやりかたが書いてあるので参考にしてみてください。電子書籍版もあります。
https://sukkiri.jp/books/sukkiri_python
なお九州大学の方(九大図書館にログインして、データベースにあるMaruzen eBook Libraryにアクセスしてみてください)やこのサービスを契約している組織の方は、ここで紹介した本を(一日60ページの制限がありますが)パソコンにダウンロードして読むことができます。すこし読んでみてよかったら購入するのがいいと思います。(残念ながら九大では「いちばんやさしいPythonの教本」は初版しかダウンロードできません)私はどちらもpdfで読んでみて、結局紙の本を購入しました。このライブラリには他のpythonの入門書もいろいろありますので、試し読みしてみて自分に向いている本を選ぶとよいかもしれません。入門用の動画ですがNGSハンズオン2015の動画の中にPython入門の動画がありますので、
https://togotv.dbcls.jp/20151110.html
入門前にこれを見てみるのもおすすめです(私はこれをみてPythonをはじめました)。

あと、最近はやりのJuliaというプログラミング言語の入門書も上のMaruzen eBook Libraryにあって読むことができます。「1から始めるJulia プログラミング」(コロナ社)という本です。Juliaを学びたい方にはおすすめです。Juliaはpythonのように書けてCにまさるとも劣らないスピードで実行できる画期的なプログラミング言語だそうです。
(写真は一週間ほどまえにみかけた皇帝ダリアです。)

Firefoxの不具合をリフレッシュ機能で解消する

昨日はFirefox の古いesr版を最新版へとアップグレードする方法とScrapBookやSageのアドオンの代替品を紹介しました。スムーズにアップグレードできる場合とできない場合がありましたが、後者の場合はFirefoxのバージョンを上げたり、下げたりいろいろいじっていたのがうまくいかない原因だろうと思います。
後者の場合ですが、無事にScrapBookとSageの代替品のインストールも終わって、どちらもうまく使えるようになったので一安心して、再起動すると、なんとツールバーのScrapBookとSageのアイコンが透明になって、マウスをあてると、そこにアイコンは存在するのですが押してもうまく動きません。そして設定したscrapbook.rdfの場所や、Sage feedsの場所の設定も消えてしまっていて初期設定に戻っていました。いろいろGoogle検索したのですが解決法はみつからず、結局Firefoxのリフレッシュを試したところ、うまくいって不具合を解消できたのでやり方をメモしておきます。

リフレッシュのやり方はここにあります。
https://support.mozilla.org/ja/kb/refresh-firefox-reset-add-ons-and-settings

リフレッシュすると、アドオン(拡張機能)やその設定などは消えてなくなりますが、ログインパスワードを含むログイン情報、ブックマークなどは保存したままFirefoxの不具合が解消されるそうです。不具合のあるFirefoxで、上のリンクにアクセスして、ページ内のリフレッシュボタンを押すなどするとリフレッシュが始まります。リフレッシュ中に今までのprofileフォルダはOld Firefox Dataという名前のフォルダとしてデスクトップに保存されるので、デスクトップフォルダの空容量がprofileフォルダを保存するのに十分かどうかを、リフレッシュの実行前に必ず確認しておいてから実行してください。このOld Firefox Data フォルダには前のprofileがそのまま残っていますので、リフレッシュで不具合が出た場合は、このprofileから復旧できます。

リフレッシュが終わるのに時間がかかる人が多いかもしれませんが、じっとまちましょう。しばらくするとリフレッシュが終わります。私の場合、復元とかいうボタンがでたので押しました。終わると私のブックマークタブとかもきれいになくなっていて失敗かと思ったのですが、右上の三本線ボタンを押して、ヘルプ、トラブルシューティング情報、profileで確認すると全く新しいprofileフォルダができているのがわかりました。その中にはたしかにブックマーク情報もはいっているようでした。これを確認した後再起動すると、(記録をとっていなかったので二回目の再起動後かもしれません)めでたく前のブックマークやログイン情報その他が復活しており、ログイン情報も残っているのがわかりました。リフレッシュの仕様によって、すべての拡張機能(機能拡張、アドオン)はなくなっているので、さっそくSage-likeScrapBeeLie Science Dictionary Tool WebExtensionなどのアドオンをインストールしました。最後のアドオンは、Life Science Dictionaryのアドオンで、マウスカーソルを英語にあてると訳や例文がポップアップするものです。pdfをブラウザで表示すればpdfを読む時にもポップアップ辞書として使えます。私は文献の整理にZoteroを使っていますので、Zoteroのページにいって、Zotero Connectorというアドオンをインストールしました(firefoxの機能拡張ページにzoteroといれても見つかりませんでした)。このアドオンはZoteroを起動しておいた状態でツールバーのZotero connectorアイコンをクリックすると文献情報やpdfを一発でZoteroにダウンロードするものです。ZoteroはEndNoteなどのように文献整理、論文の文献欄の作成などができるソフトです。いろいろな無料文献ソフトの中では個人情報の扱いが一番ちゃんとしているようなのでここ数年はこれを使っています。

写真は散歩の途中でみつけた からすうり です。梅の木にからまっています。後ろに見えるのは柿です。秋も深まってきていますが、ここ数日、福岡は20度を越えていて、暑いです。

Firefox 52.9.0esr版からFirefox Quantum最新版へのアップグレードおよびScrapBookとSageアドオンの代替品の紹介です

Firefox esrのFirefox Quantum最新版へのアップグレードのやり方およびScrapBookとSageというアドオン(拡張機能、機能拡張)の代替品の紹介をします。

プログラム本体とアドオンの扱いにわけて説明します。まずアップグレードの失敗に備えてprofileフォルダのバックアップをとっておきましょう。profileフォルダの中には、ログインパスワードやブックマーク、機能拡張(アドオン)の情報などなど、重要な情報が集められているので、更新に失敗してもバックアップしておいたprofileフォルダを使って失敗前のFirefoxに戻すことができますので是非ともバックアップをとっておいてから以下の作業をやってください。

profileフォルダの探し方は下の図のとおりです。

Firefoxの右上のバーの中にある、三本線が積み重なったマークをクリックして開くメニューから、矢印で示してある「ヘルプ」をクリックして、「ヘルプ」メニューにある「トラブルシューティング情報」をクリック、「トラブルシューティング情報」メニュー中の「プロファイルフォルダー」の項目にある「フォルダーを開く」のメニューからprofileフォルダの位置がわかります。このprofileフォルダ全体を万一のために別の場所にバックアップしておいてください。
この際、profileフォルダのバックアップ先は、決してFirefoxのインストール先のフォルダにはしないことが大事です。Firefoxをインストールするときに上書きされるようなフォルダはバックアップ先には不適です。不具合が生じた時の以前のFireifoxへの戻し方の概略は、アップグレードに失敗したFirefoxをアンインストールし、インストーラーを使ってもとのFirefoxを再インストールし、インストール後にできたprofileフォルダを、バックアップしてあったprofileフォルダに中身を入れ替えるだけです。

ではいよいよアップグレードにとりかかりましょう。

アドオンの取り扱い。
まずFirefoxのQuantum(Firefox 57以降版)にアップグレードする前にQuantumでは使えなくなるアドオン(機能拡張)を調べて、代替アドオンをGoogle検索などを使って探してインストールする準備をしておきましょう。代替アドオンの名前などをメモしておけばOKです。

私の場合は、Firefoxのアドオンで、昔から使ってたScrapBookとSageの代替アドオンを探しました(どちらもFirefox Quantumでは使えません)。

1)ScrapBookは元のデータを含めてScrapBeeというアドオンで代替利用できます。
https://addons.mozilla.org/ja/firefox/user/13434730/

ScrapBeeというアドオンは、ScrapBookのデータを読み込めますので、Firefoxをアップグレードする前に、Scrapbookの元データの場所を確認しておいてください。普通 元データはFirefoxのprofileフォルダの中のScrapBookフォルダにありますので、profileフォルダ全体ををバックアップしておくとバックアップから復元できます。FirefoxのProfilesフォルダの下に、固有の文字列のあとに”.default”とかいてあるprofileフォルダ(たとえばabcdef7x.defaultというようなフォルダ名になっています)があります。これを開くとFirefoxのいろんなデータフォルダがあって、その中にScrapBookという名前のフォルダでデータが保存されているのがわかります。このフォルダを開くとそこにscrapbook.rdfファイルがありますのでこのありかをScrapbeeのoptionで設定すると、ScrapBookで蓄積したデータを最新版のFirefoxで利用することができます。もちろん新たなweb pageの保存もできます。

Scrapbeeのインストールと使い方についての日本語による解説記事は以下をご覧ください。
http://rainbowvortex.blog.fc2.com/blog-entry-121.html

Scrapbeeに元のScrapBookのデータのありかを教える必要がありますが、上の記事にあるように、Scrapbeeのoptionメニューでscrapbook.rdfファイルのありかを記述してそれを保存すればよいだけです(ScrapBookデータフォルダはFirefoxのprofileフォルダの下にあり、ScrapBookフォルダの直下にこのrdfファイルがあります)。ScrapBook フォルダを開いてscrapbook.rdfというファイルの場所を絶対パス表示で表示してそれをコピーしてScrapbeeのオプション設定に記入します。記入後設定をsaveすると、うまくいけば、昔のScrapBookで保存した記事のリストが一覧表示されます。うまく読み込めない場合は、ScrapBookフォルダの場所をFirefoxのprofileの下の位置から、デスクトップなどFirefoxと関係ない場所へ移してやってみてください。読み込めるはずです。

2)RSSリーダーのSageはSage-likeというアドオンをインストールして代わりにしています。
https://addons.mozilla.org/ja/firefox/addon/sage-like/
このアドオンをQuantumにインストールしてから、まだフィードファイルフォルダを設定していないので、オプションの設定メニューを使って、以前Sageで設定していたRSSフィードのデータを一括取り込みします。下図のようにオプションメニューを開きます。

Feeds Bookmark folderというのの設定項目が一番上にあります。select feeds folderというプルダウンメニュー(左図の矢印)をひらくと、Bookmarkの他にSage feedsという項目がいくつかあります。このアドオンにはじめからついてきているfeedsもありますが、たぶん下のほうにあるSage feedsをクリックすると、いままで使っていたSageアドオンのfeedsのリストが見つかると思います(右図矢印)。それを選べば、以前と同様にSageで設定したfeedが使えるようになります。

Firefox のQuantum最新版へのアップグレード

先ずアップグレード前の注意点です。
Firefoxをアップグレードする前に、今使っているFirefoxのprofileフォルダをバックアップしておくのを強く勧めます。プロファイルフォルダの場所の見つけ方は上に説明したとおりです。以前の記事にもありますので参照してください。このprofileフォルダにはパスワードやログイン情報の他、多くのアドオンのデータも保存されています。上に書いてあるScrapBookというアドオンのデータもこのフォルダの中にあります。このprofileフォルダさえあればFirefoxが異常になった時でも再インストールなどして前の状態を復活できますので、Firefoxをいじるまえに是非バックアップしておいてください。

Firefoxの古いバージョン52.9.0 esr版がインストールしてあるパソコンがあったので、Firefoxを起動し、メニューの「ヘルプ」→「Firefoxについて」を選んでFirefox 60.9.0esrへアップグレードします。これはアドオン以外は問題なくアップグレードできるでしょう。(どのアドオンが使えなくなったかがわかるのでそれをみて必要な代替アドオンを探してください。)このFirefox esr 60.9.0がインストールしてあるパソコンを最新のFirefox esr 78.4.1にアップグレードしてみました。

一台目のパソコンでは、Firefoxを起動しておき、「ヘルプ」→「Firefoxについて」を選択して更新のチェックを行い(左図)、更新版としてesr 68.12.0が表示されるので更新ボタンをクリックしてアップグレードしました。その後、もう一回同様にヘルプで更新を確認すると、さらに更新があることがわかったので、クリックしてFirefoxを再起動してesr版の最新版である78.4.1へアップグレードできました。以前使っていたプロファイルもそのまま引き継がれて、なんら問題なくアップグレードできました。

ところが別のパソコンでは、アップグレードに失敗しました。そのPCにはFirefox esr 60.9.0がインストールしてあったのですが、ヘルプをクリックして更新を確認したところ、前と同様にesr版の68.12.0へのアップグレードがあると表示されました。クリックしてFirefoxを再起動して更新をインストールしたところ、起動するときにprofilesがないという英語のメッセージ profiles missingがでて昔のプロファイルを読み込めませんでした。Google検索してみると、profileの扱いがFirefoxの67から変更されたことによるらしく、アドレスバーにabout:profilesといれて表示されるいくつかのプロファイルリストに以前使っていたprofileがあればそれを選択するとよさそうでした。mozillaのサイトの説明は不親切で、それをどうやるのかがわからず困りました。

結局はスムーズにアップグレードできたのですが、うまくいった理由はよくわかりません。やったことは、上に述べたようにアドレスバーにabout:profilesとうちこんでエンターを押して表示される、プロファイルリストのページを表示した状態で、「ヘルプ」→「Firefoxについて」を選び、更新の確認を行い、68.12.0が表示されるので更新ボタンをクリックして、Firefoxを再起動しました。すると何の問題もなく以前のプロファイルを保ったまま68.12.0にアップグレードできました。この状態ですぐにヘルプから更新の有無をチェックすると、更新があると表示されたので、更新ボタンをおしてFirefoxを再起動しました。すると何の問題もなく元のプロファイルのままで無事、esr版の78.4.1にりました。しかし再起動するとまたprofileがないとかいってきて、Firfox自体が起動しません。そこでウインドウキー+Rをおして、ファイル名を指定して実行のメニューを呼び出し、firefox -Pとタイプしてfirerfoxを起動しました。するとプロファイルメニューの一覧がでるのでこれから古いプロファイルメニューを選び、いつもこれで起動のチェックをいれて起動します。これで無事昔のブックマーク、パスワード、ログイン情報などが残っているfirefoxが起動しました。これでよさそうだったのですが、まだトラブルは続きました。その症状と解決法は明日書くことにします。

ほとんどの方はprofile missingなどの表示もなく私の一台目のパソコンと同様に最新版にアップグレードできるのだと思いますが、もしできない方がおられましたらこの記事を参考にしてみてください。

夏のおすすめ本2020―その1 Rに関するおすすめ本2冊

毎日猛暑がつづきますが皆さんお元気の事と思います。今日から数回にわたって、面白そうな本、役に立つ本などを紹介していきたいと思います。第一回目はR(アール)の本です。今や統計解析にソフトの定番のプログラミング言語Rは無料で使える素晴らしいソフトですが、統計解析だけではなくゲノム解析にも活躍しているソフトです。昔はグラフィカルインターフェースがなかったのですが、今ではRのパッケージのR commanderや日本の神田善伸先生(自治医科大学)が開発されたEZR(イージーアールと読みます。これも大評判になってRのパッケージになりました)がありますので、グラフィカルインターフェースでRを使うことができて、初心者にもやさしいソフトとなりました R commanderはRをインストールしたあと、パッケージとして追加インストールして使います。EZRはR commanderの追加プラグインになっています。インストールするとどちらも日本語で使えます。EZRを中心に使いたい場合は開発者の神田先生のサイトからダウンロードして使うのもおすすめです)。また、RStudioというRの統合開発環境ソフトを使えば、Rをもっと便利にスムーズに利用することができるようになったので、Rはますます便利で使いやすくなっています。インストール法については以前の記事二つがありますので、ここここを参照してください。

今日紹介するのは、EZRの使い方を、その開発者の神田先生が解説した本です。先生のホームページにも簡単な使い方などが載っていますのでそちらも参照してみてください。

EZRでやさしく学ぶ統計学 改訂3版〜EBMの実践から臨床研究まで〜神田善伸 著(2020年10月発行)

これ一冊あれば、生物系医学系の普通の統計解析はすべて日本語のプルダウンメニューを使ってできます。私も論文のデータ解析にはこの本を主に参照しています。大変役立つ本ですので、是非一冊購入して統計解析の勉強や研究に活用してください。私は第一版を購入して使っていますが、すでに第3版がでているほどに売れている本のようです。これがちょっと難しそうという方むけに、神田先生はもうすこしやさしい初心者向けマニュアルも書かれています。全く初心者の方にはこれがおすすめです。 マンガの部分もあったりしますが、統計解析の基本をひととおり学べますし、EZRの開発秘話とかものっています(立ち読みで読めます)。

サラっとできる! フリー統計ソフトEZR(Easy R)でカンタン統計解析
という本です。立ち読みしてみて、まずこちらを買うのもありかもしれません。医療や生命科学関係の事柄を急いで学びたいという人には同じ著者の

初心者でもすぐにできるフリー統計ソフトEZR(Easy R)で誰でも簡単統計解析

がいいかもしれません。まず神田先生の簡単な入門書で学び、実験データの解析には最初の本(第3版)を使うというので、Rを使った生命科学の統計データ解析には十分だと思います。他にいろいろ本を買う必要はないでしょう。(以上2020/11/19追記)

Rはバイオインフォマティクスや次世代シークエンサーのデータ解析、ゲノム解析にも大活躍しているソフトです。最近英語の本ですが、こんな本が公開されています。
Computational Genomics with Rという本です。
紙の本や電子ブックはこの秋にでるようですが、Rをつかって出力されたhtml版が上のリンクから無料で読めます。バイオインフォマティクスの専門家による本ですので、役立ちそうです。
著者は日本にもいたことがある人で、Rのバイオインフォマティクス解析用のBioconductorの多くのパッケージを開発している方たちです。著者紹介によると、この本のほとんどを書いた方は、Dr. Altuna Akalin wrote most of the book and edited the rest. Altuna is a bioinformatics scientist and the head of Bioinformatics and Omics Data Science Platform at the Berlin Institute of Medical Systems Biology, Max Delbrück Center in Berlin.(以下略)ということで、ドイツのベルリンにあるバイオインフォマティクスとオミックスデータセンターのヘッドだそうです。まだ私も読んでいないのですが、勉強してみたい本ですので紹介しておきます。

写真は、散歩の途中で撮影した山百合と葛の花です。山百合の間によくみると葛の花が咲いているのがわかります。

オープンアクセスの電子ブックをダウンロードしてみよう―Pythonや制御理論や統計学の教科書、力学の教科書やFelix Kleinについての本などなど

以前の記事に書きましたが、分子生物学会のランチョンセミナーでオープンアクセスの電子ブック(無料で読める電子ブック)を探せるサイトDOAB(Directory of Open Access Book)を紹介しました。リンク集にもリンクをのせてあります。今日、ちょっとのぞいてみるといろいろオープンアクセスの本が新しく公開されていました。検索窓にPythonと入れて検索してみると、Pythonに関連した本がずらずらとでてきます。本のLicenseの下にある
Abstract | Keywords | Free access | Buy the book |の部分のFree accessのリンクをクリックすると本がダウンロードできます。いろいろな本がありますがPythonを学ぶにはIntroduction to Scientific Programming with Python
Authors: Dr. Joakim Sundnes in Simula SpringerBriefs on Computing。Springer Nature (2020) とか
Programming for Computations – Python
Authors: Linge, Svein — Langtangen, Hans Petter
Book Series: Texts in Computational Science and Engineering, Springer Nature (2020) などは面白そうです。
また神経科学へのPythonの応用を紹介している本で
Python in Neuroscience
Authors: Eilif Muller — James A. Bednar — Markus Diesmann — Marc-Oliver Gewaltig
Book Series: Frontiers Research (2015)Publisher: Frontiers Media SA
も神経科学に興味がある人には面白いのではないでしょうか。

検索窓にソフトウエアのMathematicaをいれて検索すると、こんどは制御理論の教科書がでてきました。Mathematicaを使って制御理論を学ぶ教科書のようです。
Control Theory Tutorial: Basic Concepts Illustrated by Software Examples
Author: Steven A. Frank Book Series: SpringerBriefs in Applied Sciences and Technology, Springer Nature (2018)

ほかにもいろいろ面白そうなオープンアクセスの本があります。Browseボタンを押して色んな本をタイトル、分野、そして出版社別にながめることもできます。Publisherで検索すると、各出版社から何冊くらいオープンアクセス本がでているかがわかります。とても多くのオープンアクセス本をだしているSpringer Nature社の面白そうなタイトル(2019-2020年発行)を以下にならべておきますので、検索してみてください(直リンクははってないので、上のサイトでタイトルで検索するなどしてみてください)。科学だけではなくて哲学、社会学の本とかもあります。たとえば王陽明の紹介本とかもありました。

Make Life Visible
Prof. Yoshiaki Toyama, Ph.D. Atsushi Miyawaki… (2020) 生物科学の可視化の技術の本のようです。

Statistical Population Genomics
Julien Y. Dutheil in Methods in Molecular Biology (2020)

Gene Drives at Tipping Points
Precautionary Technology Assessment and Governance of New Approaches to Genetically Modify Animal and Plant Populations
Prof. Dr. Arnim von Gleich… (2020) ジーンドライブについての本

Data Journeys in the Sciences
Dr. Sabina Leonelli, Dr. Niccolo Tempini (2020)

The Amazing Journey of Reason
from DNA to Artificial Intelligence
Mario Alemi in SpringerBriefs in Computer Science (2020)

Introduction to Scientific Programming with Python
Dr. Joakim Sundnes in Simula SpringerBriefs on Computing (2020) これは最初に紹介した本です。

The Pangenome
Diversity, Dynamics and Evolution of Genomes
Dr. Herve Tettelin, Duccio Medini (2020)

Bioimage Data Analysis Workflows
Dr. Kota Miura, Dr. Nata?a Sladoje in Learning Materials in Biosciences (2020)

Good Research Practice in Non-Clinical Pharmacology and Biomedicine
Editors :Anton BespalovMartin C. MichelThomas Steckler 薬学や医学での研究の再現性、正しいサンプリング、実験デザインなどを教えてくれる本です。

The Everyday Life of an Algorithm
Authors: Daniel Neyland アルゴリズムのやさしい紹介の本。

Principles of Mechanics
Fundamental University Physics
Salma Alrasheed in Advances in Science, Technology & Innovation (2019) 物理の力学の本

The Ethics of Vaccination
Dr. Alberto Giubilini in Palgrave Studies in Ethics and Public Policy (2019) ワクチン接種の必要性を議論している本

Understanding Statistics and Experimental Design
How to Not Lie with Statistics
Prof. Dr. Michael H. Herzog… in Learning Materials in Biosciences (2019) 統計学と実験計画法の教科書

The Legacy of Felix Klein 数学者フェリックス・クラインについての本
Prof. Dr. Hans-Georg Weigand… in ICME-13 Monographs (2019)

The Brownian Motion
A Rigorous but Gentle Introduction for Economists
Authors;Andreas Loffler, Lutz Kruschwitz 経済学者のためのブラウン運動の理論の教科書。

写真は5月ごろに撮影したバラの花をホテルにしているアマガエルです。昼間はこのバラの花の部屋の中でじっと休憩していますが、夜になると外にでかけて大きな声で鳴きます。今も外はカエルの声がにぎやかです。