ゆりの花が咲きだしました!

毎日猛暑が続いています。福岡も気温が体温より高くなったりしています。頼みの夕立はまったくきません。自宅付近では風が結構ふいて、湿度は低いので市内ほどではないのですが、やはり暑いです。自宅では百合の花がいっぱい咲きだしました。

今年はブドウ(デラウエア)もカメムシにほとんどやられなかったので、葉っぱもきれいに実が色づいてきています。色づいたものはみんなで食べましたがとてもおいしかったです。さて今日はFoldseekを動かしていましたが、使い方はまだ慣れないところがあるので後日記事を掲載することにします。かわりに国立国会図書館で個人送信で読める本を二冊紹介しておきます。

一冊目はトルストイです。昨日NHKの100分de名著で取り上げられた本「人は何で生きるか」(トルストイ)が無料で読めます。番組の再放送は2022年8月8日(月)午後1時5分~1時30分/Eテレだそうです。
https://www.nhk.jp/p/meicho/ts/XZGWLG117Y/blog/bl/pEwB9LAbAN/bp/p5oJ1oXpM0/
トルストイの番組でとりあげられた作品はトルストイ全集第5巻にのっています。こちらから読めます。https://dl.ndl.go.jp/info:ndljp/pid/1699150/8
デジタルコレクションの個人送信資料には、世界文学全集や日本文学全集がはいっているので、トルストイの他の本も翻訳で皆よむことができます。ドストエフスキーとかもありますので探してみてください。

もう一冊は現代代数学概論改訂3版(白水社)という本です。バーコフとマクレーンによる教科書で、じっくり現代代数学を学ぶのに最適というようなことが秋月康夫先生の序文にかいてあります。訳者序文にも幅広い分野の人に役立つ本だとありました。共著者は圏論でも有名な方ですよね。こちらにありますのでご覧ください。
https://dl.ndl.go.jp/info:ndljp/pid/2422244

タンパク質の立体構造が似たものを探すプログラムDaliを使ってみました。

今日はタンパク質のpdbファイル(タンパク質の立体構造―原子の座標などを記述してあるファイルで、タンパク質のデータベースのPDBファイルのリンクからダウンロードできる)を用いて、類似の立体構造を持っているタンパク質を探すプログラム Daliの使い方を簡単に紹介します。
まず調べたいタンパク質の立体構造を記述してあるファイルPDBファイルをAlphaFoldのサーバーなどからダウンロードします。
https://www.alphafold.ebi.ac.uk/
今日は線虫C. elegansのN型糖鎖合成経路の遺伝子の一つ algn-13の立体構造を使ってみることにします。AlphaFoldのサーバーで「algn-13  C. elegans」のキーワードで検索して(Uniprotでも可能です)algn-13の項目を表示してPDBファイルをダウンロードします。
https://www.alphafold.ebi.ac.uk/entry/P92012
AF-P92012-F1-model_v3.pdbというファイルがダウンロードできたと思います。
そのファイルを保存した上で、Daliサーバーにアクセスします。
http://ekhidna2.biocenter.helsinki.fi/dali/
Daliサーバーのトップページには様々な便利なプログラムがおいてあります。今回はプログラムの中からAF-DB comparisonを使ってみましょう。これはAlphaFoldが予測したタンパク質の立体構造のPDBファイルを入力して、類似の立体構造を持っているタンパク質を(一つの種)から探しだすプログラムです。サーバーの負荷の観点から、検索は一つの種内でだけ実行できます。以下のリンクをクリックして表示されるページのSTEP 1からSTEP 4で検索が始まります。
http://ekhidna2.biocenter.helsinki.fi/dali/index.html#AFDB
STEP 1でパソコンに保存してあるpdbファイルの場所を入力します。
STEP 2で検索する種を一つ選びます。今回はHumanにしてあります。
STEP 3はオプショナルで、入力しなくてもいいですが、emailアドレスを登録しておくとメールで完了通知がとどきます。上のjob titleは今回の検索ジョッブのタイトルを適当につけます。
STEP 4でsubmitします。
画面が替わって、実行順番待ちの画面にかわります。Status: Queuedと表示されています。
画面がRunningになったら検索中です。
終わるとこんな画面になります。結果は一週間保存されるそうです。

Interactiveを押します。画面が替わって結果が一覧できます。

今回は試しに一番上のヒットであるNo.1を選択して、3D表示してみましょう。Expand gapsの隣にある3D superposition (PV) ボタンを押します。
結果が表示されます。
緑が線虫のタンパク質(Queryにチェックが入っています)、茶色がヒトのタンパク質(e7raA)です。薄く表示されているのはヒトのタンパク質のほうの全体です。線虫とヒトの二つのタンパク質の立体構造が見事に一致しているのがわかると思います。右の図はマウスで拡大縮小、回転など自由に動かして眺めることができます。Tutorialをみながらいろいろ試してみてください。これはBLASTとちがって直接、類似の立体構造をさがしてくれるのでとても有用です。私達がpsi-blastにもとづいて立体構造の類似を議論したがあったのですが、Daliでやってみると確かに類似の立体構造が確認できました。別のプログラムであるFoldseek
https://search.foldseek.com/searchもDaliとはまた違った結果がみられるのでこちらも結構役立ちそうです。

既知の全タンパク質の立体構造予測結果が公開されています!

AlphaFold2というAIによる高精度のタンパク質の立体構造予測プログラムが公開されて一年になります。ヒトやマウス、ショウジョウバエ、線虫その他のモデル生物の予測立体構造が35000余り一斉に公開されて世界に衝撃を与えました。一昨日(7月28日付発表)さらなる衝撃のニュースがとびこんできました。
‘New era in digital biology’: AI reveals structures of nearly all known proteins
https://www.science.org/content/article/new-era-digital-biology-ai-reveals-structures-nearly-all-known-proteins

AlphaFold reveals the structure of the protein universe
https://www.deepmind.com/blog/alphafold-reveals-the-structure-of-the-protein-universe 
こちらにはこんなことが書いてありました。
Today’s update means that most pages on the main protein database UniProt will come with a predicted structure. All 200+ million structures will also be available for bulk download via Google Cloud Public Datasets, making AlphaFold even more accessible to scientists around the world.

既知のほぼすべてのタンパク質(バクテリアからヒト、植物などを含む)2億種類以上の立体構造予測結果がデータベース公開されたのです。たとえばこちらから検索できて、pdbファイルなどもダウンロードできます。
https://www.alphafold.ebi.ac.uk/
構造予測の結果を、すべてダウンロードすることもできるようになっています。
https://alphafold.ebi.ac.uk/download

タンパク質のデータベースである
UniProt https://www.uniprot.org/
のほぼすべての項目にAlphafold2による立体構造予測が載せられています。立体構造がわかれば、その構造予測ファイルを利用して、Dali http://ekhidna2.biocenter.helsinki.fi/dali/や、Foldseek https://search.foldseek.com/searchといったプログラムを用いて、似た立体構造をもっている他のタンパク質を検索することができます。やりかたは明日簡単に紹介します。
AlphaFold2を用いた成果も続々と発表されていて、たとえば1000個ほどのタンパク質からなるヌクレオポア複合体(核膜孔複合体)の立体構造の決定に大きく貢献したそうです。https://unfolded.deepmind.com/
https://www.science.org/doi/10.1126/science.abm9506

タンパク質の立体構造予測の革命―続き

昨年のAIを用いたタンパク質立体構造予測プログラムAlphafold2は革命的な成果でした。これに続いてこのブログでもOmegaFoldという新しいプログラムができたそうだというニュースを記事にしていました。OmegaFoldはAlphafold2のようにmultiple sequence alignments (MSA)を用いないので、より速く計算できるという画期的プログラムということでした。最近その論文も公開されました。
https://www.biorxiv.org/content/10.1101/2022.07.21.500999v1
同じタイミングでESMFoldというプログラムも公開されてこちらも優秀らしいです。
https://www.biorxiv.org/content/10.1101/2022.07.20.500902v1
中国からさらに最近、
HelixFold-Single: MSA-free Protein Structure Prediction by Using Protein Language Model as an Alternativeという論文も公開されました。
https://arxiv.org/abs/2207.13921
タンパク質立体構造をアミノ酸配列だけを入力すると正確に予測できる時代がきているのを実感します。TwitterでOmegaFoldなどの検索語で検索するといろいろ最新情報がでてきます。nitterをつかうとストレスがたまらないのでおすすめです。

田口善弘先生の市民講演会もみるとよいと思います。

https://youtu.be/3Rm9x7j-ClA

増補 複雑系経済学入門(塩沢 由典 著)が出版されています

ちくま学芸文庫から「増補 複雑系経済学入門」塩沢 由典 著が出版されました。初版から20年の進歩を書き加えた補章がついた増補版だそうです。https://www.chikumashobo.co.jp/product/9784480099785/
さっそく注文しました。
こちらに書評などがあつめられています。
http://www.shiozawa.net/chosho/index.html
これは塩沢先生のホームページ
http://www.shiozawa.net/にある著書紹介のページです。
先生の公式ホームページのトップページに次のような文を見つけました。
2022.6.21 ちょうど20年前に『数学セミナー』の姉妹誌ともいえる『数学のたのしみ』に「数学とオカルトのあいだ」という文章を書いていた。今回の”To be, or nto to be”とある意味、好対照なものだ。関心のある方は、ぜひ一読いただきたい。
早速リンク
http://www.shiozawa.net/ronbun/sugakunotanoshimi.htmlから「数学とオカルトのあいだ」という記事を読みました。
経済学と数学について書かれていますが、私が昨日、生命科学と数学についてかいたのと同じ考えを述べておられると思います。
塩沢先生からは高校の時、数学を習いました。高校に講師でこられていたのですが先生に習った時だけ成績がよかったです。ちょうどベトナム戦争の最中だったので、講義に「ベトナムに平和を」のバッジをつけてこられていたのを覚えています。試験の監督中、黒板に数式を書いて考えておられたのも印象的でした。今も大活躍されているご様子で、私もがんばらねばと思います
Microfoundations of Evolutionary Economics
という最近の本は先生のお仕事の集大成の共著だそうでドラフト版の一部は先生のホームページに公開されています。http://www.shiozawa.net/chosho/index.html

生命科学の理論について思うこと

昨日はLシステムの本の紹介をしました。植物の形態をうまく説明できるモデルとして有名なモデルです。MathematicaやPython, Javaなどで動かして試してみることができるのでネット検索してみてください。Mathematicaな以下のリンクなどをご覧ください。
https://resources.wolframcloud.com/FunctionRepository/resources/LSystem/

生命科学のモデル、確かに面白いのですが注意しなくてはならないことがあると思います。ある生命現象をうまく記述できる場合には二通りがあると思うのです。一つはその生命現象を支配している分子メカニズム、あるいは物理メカニズムを的確にとらえているので現象の時間的発展(時間スケールをふくめて)を記述できるのみならず、それに対する外部からの搖動にシステムがどう応答するかも予測できるという理論です。これは真に有効な理論です。もう一つは、生命現象をパラメータの調節でうまく記述できるのですが、予測力がないものです。これはたとえて言うと、生命現象を数学の言葉で描写しているだけというものです。生命現象をフランス語で記述しているのがAさんのモデルで、Bさんは英語で記述しているというようなものです。微分方程式を使ってモデルを作っている人の中には、生命現象を微分方程式のパラメータ合わせで記述している(持ち合わせている自分の言葉で生命現象を記述している)だけという人がいるのではないでしょうか。そういうモデルは現象を数学の言葉で描写しているだけですから、類似の現象はうまく記述できますが、予測力はない。そしてそのモデルは、その生命現象を支配している分子メカニズム、物理メカニズムを明らかにするには無力だというものです。生命科学のモデルを作る人は、そういうわなにかからないように注意しなくてはいけないと思っています。

植物の形態形成の数理モデルの本や論文がダウンロードできるサイトの紹介です。

植物の形態形成を中心に形態形成の数理モデルを研究しているグループを紹介します。こちらはカナダのカルガリー大学のPrzemyslaw Prusinkiewicz教授のグループのホームページです。
http://algorithmicbotany.org/virtual_laboratory/
教授の主要著書の2冊(どちらもSpringerから出版されています)が無料でダウンロードできます。
The Algorithmic Beauty of Plantsは有名な本です。
http://algorithmicbotany.org/papers/#abop
高解像度版をダウンロードしてお読みください。私は原書をもっています。以下はサイトからの引用です。
The Algorithmic Beauty of Plants was originally printed by Springer-Verlag in 1990 (second printing 1996). (See our list of known errors from the print version.) An electronic version has been produced using the original LaTeX files and digital illustrations. It is available in two versions: the original version is of higher quality, while the downsampled version is of low quality, but has a much smaller file size. To fully appreciate the book, we strongly recommend that you read the high-quality version if at all possible.

You can download the entire book as a PDF file (high quality, 17Mb; low quality, 4Mb), or by chapters:
目次です。
Front matter (2.5Mb; LQ, 150kb)
Chapter 1 – Graphical modeling using L-systems (2Mb; LQ, 1Mb)
Chap2ter 2 – Modeling of trees (4Mb; LQ, 300kb)
Chapter 3 – Developmental models of herbaceous plants (1.7Mb; LQ, 500kb)
Chapter 4 – Phyllotaxis (2.5Mb; LQ, 500kb)
Chapter 5 – Models of plant organs (1.2Mb; LQ, 300kb)
Chapter 6 – Animation of plant development (650kb; LQ, 160kb)
Chapter 7 – Modeling of cellular layers (3.7Mb; LQ, 800kb)
Chapter 8 – Fractal properties of plants (1.2Mb; LQ, 300kb)
Back matter (900kb; LQ, 250kb)

また、上の本でL-systemと書いてあるのはLindenmayer Systemsのことで、
Lindenmayer Systems, Fractals, and Plantsという本もダウンロードできます。
http://algorithmicbotany.org/papers/#lsfp
Fractals: Introduction, basics, and applicationsという講義のノートがもとになってできた本だそうです。

また、ホームページには学位論文(修士や博士の学位論文)もダウンロードできるようになっています。
http://algorithmicbotany.org/papers/#theses
海外の学位論文は、日本の学位論文にくらべてきわめて詳細で、わかりやすく、基礎知識も丁寧に記述されています。私も糖鎖関係の海外の大学の博士の学位論文をときどき読みますが、大変役立ちますので皆さんも是非関連分野の海外のPhD Thesisを入手して読んでみてください。
こちらの研究室のものでは修士の学位論文のこれはいかがでしょう。
Modelling Natural Phenomenon with Reaction-Diffusion
http://algorithmicbotany.org/papers/ringham.th2020.html
Turingの反応拡散方程式について詳しく書かれていて面白そうです。テントウムシやヘビの模様、花の花弁の模様や自己免疫疾患の乾癬(かんせん)のモデルなどが載っています。

Google Cloudを用いた円周率100兆桁の計算成功は日本人の研究者によってもたらされたそうです。です

これは全く知らなかったのですが、円周率はすでに100兆桁まで計算されているのですね。この仕事はGoogle Cloudの開発者で、Google Cloudで2019年に円周率 31 兆 4000 億桁という当時の世界記録を樹立した岩尾エマハルカさん(この2019年の仕事で女性として史上3人目の円周率計算の世界記録保持者になったそうです)の主導で行われた業績です。岩尾さんについては、去年のNHKの記事にある対談をご覧ください。
https://www3.nhk.or.jp/news/special/news_seminar/senpai/senpai75/

100兆桁の計算については、岩尾さんが書かれた2本の記事(いずれも日本語)がわかりやすいです。
https://japan.googleblog.com/2022/06/new-digit-pi-2022.html

https://cloud.google.com/blog/ja/products/compute/calculating-100-trillion-digits-of-pi-on-google-cloud
後の記事からすこし引用します。
「以上のような性能測定と最適化の結果、100 兆桁の円周率の計算が無事に完了しました。ちょうど 100 兆桁目は 0 でした。計算が終了してから、最終結果を Bailey–Borwein–Plouffe の公式 (BBP の公式) という別のアルゴリズムを用いて検証しました。この検証が、円周率計算全体で最も怖い瞬間です。計算に 5 ヶ月を費やしても、最終結果を確認するまでは、途中経過が正しいのか確実に確かめる方法が無いからです。幸い、BBP の公式と今回の結果が一致し、計算が正しいことが確認されました。以下が小数点以下 100 兆桁目までの 100 桁です。
4658718895 1242883556 4671544483 9873493812 1206904813
2656719174 5255431487 2142102057 7077336434 3095295560

全桁の結果は、こちらのデモサイトでご覧いただけます。
https://pi.delivery/

最後のリンクのサイトから、計算結果を全部ダウンロードできますし、円周率の音楽なども聞くことができますのでご覧ください。

また岩尾さんの2019年の円周率計算結果をもとに、
偉大なコンピュータ科学者Don Knuth スタンフォード大学名誉教授が講演した
Stanford Lecture: Don Knuth – “Pi and The Art of Computer Programming” (2019)
もご覧ください。

https://www.youtube.com/watch?v=3DKo219ZHMw&t=356s
超越数である円周率Piの配列の中に、宇宙の創造者のメッセージがはいっているというカール・セーガンのSF 「コンタクト」の最終章をまた読みたくなってきました。この本のなかでセーガンがワームホールで宇宙旅行するというアイデアをキップソーン(Kip Stephen Thorne)から教えてもらったというのは有名な話です。ソーンは映画インターステラ―の監修もつとめていてSFに強い物理学者だと思っていましたが、2017年のノーベル賞物理学賞を授賞しましたね。
https://www.nobelprize.org/prizes/physics/2017/thorne/biographical/

おすすめのSF小説を二冊紹介します

ときどきSFを紹介しています。Kindle unlimitedでカタログをみているとき、小松左京の「日本沈没」が入っているのをみつけました。いままでテレビドラマや映画はみたことがあるのですが、原作は一回も読んだことがなかったのです。たしか原作では、日本が沈没するメカニズムにトンネル効果のようなものを想定していると聞いたことがありました。このKindle本は検索できるものだったので、さっそく「トンネル」で検索してみました。山をくりぬいたトンネルもいくつもヒットしましたが、たしかにトンネル効果という言葉もヒットしました。日本沈没のメカニズムが書かれている部分があるんですね。面白そうなので読んでみようと思います。
https://books.bunshun.jp/ud/book/num/1692042600000000000Q

あとKindle unlimitedには山本弘さんの「プロジェクトぴあの」も入っています。これもおすすめの作品です。私は紙の本を昔買ってもっています。アイドルをやっている女の子が世界的な大発明をする話です。これって朝ドラに最適の話だと思いますが、どうでしょう。未読のかたは読んでみてください。山本弘さんの多くのSFの中で、最高傑作であると思います。https://www.php.co.jp/books/detail.php?isbn=978-4-569-82026-2
文庫化もされています。

電子ブックのセール情報のサイト

電子ブックをよく読むようになりました。紙の本は割引販売がないですが、電子書籍はセールがあると割引価格で買えるのがいいですね。下に載せたサイトはKindleにかぎらず電子書籍の割引セールの最新情報が頻繁に更新されて集められているのでおすすめします。パソコンソフトを調べるのに昔からお世話になっている、窓の杜のサイトです。
https://forest.watch.impress.co.jp/category/book/index.html
いまなら198円で講談社からでている
「Google英文ライティング 英語がどんどん書けるようになる本 Kindle版
遠田和子 (著) 」が買えたりします。こちらはKindle unlimitedでは無料で読めます。そのほか、園芸の本もいろいろ198円で売っています。この本のリンクを調べていたら他にもこんなKindleセールのサイトを見つけました。これもよさそうです。
https://premium.gamepedia.jp/kindle/