AlphaFold2のオープンソース版OpenFoldというのがあるのを今日知りました。

AlphaFold2は、驚異的な精度でタンパク質の立体構造を予測することができます。ただこれはオープンソースではないので、世界のいろんな場所で改良を加えることが難しいと言う欠点があります。去年11月に投稿されたプレプリントでは、OpenFoldという、AlphaFold2とおなじ内部構造をもったオープンソースの機械学習プログラムが紹介されています。
https://www.biorxiv.org/content/10.1101/2022.11.20.517210v2

論文では、OpenFoldがより少ない計算リソース(GPUは1個でOK)で、より早くAlphaFold2と同じ予測精度で予測可能であることが示されています。どれくらいの数のタンパク質の立体構造を学習に用いたらAlphaFold2と同じ精度での立体構造予測が可能になるかも、学習に使うタンパク質の数を変えて試しています。
AlphaFold2は132000個ほどのPDBに登録されているタンパク質の立体構造データで学習したそうですが、OpenFoldでは 17,000、10,000、5,000、2,500、2,000、 1,000 の個数で学習させて予測精度への影響を検討しています。10000個使えばAlphaFold2と遜色ない予測精度になるそうです。もっと数を減らしてもそれほど精度はおちなかったようで、OpenFoldを使って立体構造がまだあまり沢山知られていない生体分子の立体構造(たとえばRNAの立体構造など)も予測できるようになるだろうと書かれています。
私などには難しい論文ですが、幸い この論文の著者の一人 ハーバード大学医学部のResearch AssociateのNazim Bouattaさんによる講義が以下のページにまとまっています。今年の2月から3月にかけておこなわれたハーバード大学での最新の講義です。機械学習でタンパク質の立体構造を予測するというのはどんなことかが良くわかる連続講義です。AlphaFold2の原理やその限界とOpenFoldについても詳しく触れられている講義ですので、このプレプリントを読むための予備知識として絶好の講義だと思います。
https://scholar.harvard.edu/nazimbouatta/lectures

講義のタイトルは以下のとおりです。
Machine learning for protein structure prediction, Part 1: Algorithm space
Machine learning for protein structure prediction, Part 2: AlphaFold2 architecture
Machine learning for protein structure prediction, Part 3: AlphaFold2 and OpenFold
YouTubeでも見られます。
Special Lectures on Machine Learning and Protein Folding
https://youtube.com/playlist?list=PL0NRmB0fnLJQPDZh-6utVnRpF1-beEr4T
https://youtu.be/kIkn5DGEJJw

Google Bardを使ってみました。

ChatGPTを毎日利用しています。これに対抗して、Googleからも新しいサービス Google Bardが提供されており、日本語にも対応しているというので使ってみました。
こちのページにある、ログインボタンから、試験運用中のBardにログインできます。
https://bard.google.com/

ログインボタンを押すと、Googleアカウントでログインできるので、アカウントを選んで(ない人はアカウントを作る必要があります)ログインします。
するとプライバシーポリシーが表示されるのでよく読んで、同意できる場合は同意して使い始めることができます。

ChatGPT plus (GPT-4.0)ではちゃんと答えてくれなかった「コンドロイチンの線虫 C. elegansの初期発生での機能は?」という問いには、やはりコンドロイチン硫酸の哺乳類での機能を線虫に置き換えただけのウソの答えを返してきました。英語でWhat are the roles of chondroitin in the early embryonic development of the nematode C. elegans?ときくと、ちゃんと細胞分裂にも必須だとまともな答えが返ってきました。日本語よりはやはり英語で使う方がよさそうですね。また、糖鎖生物学の研究に役立つtwitter  アカウントを教えてと言う問いには、やはりChatGPTと同じで、存在しないアカウントを教えてくれました。どれも実在しないとchatすると、お詫びと、新しいtwitterアカウント候補をリストしてくれました。でも5つの内、一つが実在するアカウントで後は存在しないものでいた。この辺はChatGPTと同じレベルです。

小松左京の書いた作品名を列挙してください。と聞くと、こんな答えでした。
「小松左京の代表的な作品をいくつかご紹介します。

  • ハレー彗星
  • 日本沈没
  • 復活の日
  • さよならジュピター
  • 海底軍艦
  • 宇宙からのメッセージ
  • 異星からの物体X
  • 未来の想い出 t
  • 火星の静かな夜
  • アルファの城」

こんな答えでしたから、これもChatGPTなみですね。

また、ChatGPTと同じように、英語の論文の校閲に最適なpromptを教えて聞くと、ちゃんとそれらしいプロンプトを教えてくれました。まだ英文校閲には使ってみていませんが、試してみてまた報告します。

日本の科学者による生命の起源についての新説の紹介です。

英語で配信されている動画シリーズ 週間科学ニュースで日本の科学者による生命の起源に関する新説が紹介されています。
https://youtu.be/bX3kFQxKZ4M

私は知りませんでしたが、日本語でもニュースになっていたそうです。
http://www.astroarts.co.jp/article/hl/a/13026_aminoacid
横浜国立大学からのプレスリリースはこちら。
https://www.ynu.ac.jp/hus/koho/30020/detail.html
横浜国立大学大学院理工学府の小林憲正名誉教授、癸生川陽子准教授、中部大学の河村公隆客員教授、NASAゴダード宇宙飛行センターのウラディーミル・アイラペティアン博士らの研究グループによる研究成果だそうです。詳しくはプレスリリースや上の記事のリンクからご覧ください。生命が誕生するころの太陽はいまよりずっと活発で太陽風も激しく、太陽自体も今より暗かったというのはこのニュースで初めて知りました。

論文はこちらから読めます。
https://www.mdpi.com/2270428
Kobayashi, K.; Ise, J.-i.; Aoki, R.; Kinoshita, M.; Naito, K.; Udo, T.; Kunwar, B.; Takahashi, J.-i.; Shibata, H.; Mita, H.; Fukuda, H.; Oguri, Y.; Kawamura, K.; Kebukawa, Y.; Airapetian, V.S. Formation of Amino Acids and Carboxylic Acids in Weakly Reducing Planetary Atmospheres by Solar Energetic Particles from the Young Sun. Life 2023, 13, 1103. https://doi.org/10.3390/life13051103

このニュースを伝えているのは、Sabine Hossenfelder博士のYouTubeチャンネルです。以前もこのチャンネルを紹介したのでそこにも書きましたが、

脳は量子重力を使っているのか?Sabine HossenfelderさんのYouTubeチャンネルの紹介

博士は現在、the Frankfurt Institute for Advanced Studiesのresearch fellowで、物理学の基礎の研究と科学の哲学や社会学についての論説でも有名です。著書にLOST IN MATH How Beauty Leads Physics Astrayという有名な本もあります。翻訳は「数学に魅せられて、科学を見失う物理学と「美しさ」の罠(みすず書房)」というタイトルででていて、こちらから購入できます。https://www.msz.co.jp/book/detail/08981/

他に、Scientific American、 New Scientist、Nautilus、 Aeonや New York Timesなどにも活発に寄稿されています。Royal Instituteでの講演も面白かったです。https://youtu.be/fl9oDJzfg58
最新刊の本とその本についての講演については、上に書いた以前の記事で紹介しましたので、併せてご覧ください。

低分子の代謝産物とアルツハイマー、寿命、コロナ後遺症などはどのように関係しているのでしょうか?動画の紹介です。

今日はカロリー制限で寿命が延びるという線虫C. elegansなどでわかった現象についてカリフォルニア大学で研究している先生の動画を紹介します。英国のRoyal Institutionの講演会の最新の動画です。
Metabolites: the key to treating Alzheimer’s? – with Priyanka Joshiというタイトルです。

https://youtu.be/aMycpGP2RJY

低分子量の代謝産物がいかにタンパク質の立体構造に影響するか、寿命やアルツハイマー発症メカニズムへどう影響するか、コロナウイルス後遺症にどう関係しているかなどのテーマについて模型やスライドを使いながら、とてもわかりやすく講義してくれています。タンパク質の合成からはじまるタンパク質の一生についても手っ取り早く理解できます。とても教育的な講義ですので、是非ご覧ください。

BBCの往年の名作SFラジオドラマを聞いてみましょう!

連休の後半は雨が降って、ゴールデンウイーク最後の2日間の降水量は5月としては新記録だったそうです。130 mm-150 mmほどの記録的雨量を福岡県各地で記録しました。昨日の月曜から今朝にかけては曇っていましたが、午後は快晴。庭のバラの花も綺麗でした。毎年このバラの花の中でカエルが眠っていたのですが、今年はみかけません。鳴き声だけは聞こえるので今年は別のホテルを見つけたのかもしれません。

さて、今日は英語のラジオドラマを紹介します。私がイギリスにいたときに本屋でみつけて購入したカセットテープに入っていたBBCのSFドラマです。出張のときなどよく新幹線の中で訊いていたのを思い出します。Journey into Spaceという4つのエピソードからなるBBCのラジオドラマで1953年ー1956年にわたって放送された番組です。
https://en.wikipedia.org/wiki/Journey_into_Space
私は第一シーズンのカセットテープを聞いていました。4話のタイトルは以下のとおりです。
Journey into Space, series 1: Operation Luna
Journey into Space, series 2: Red Planet
Journey into Space, series 3: World in Peril
Journey into Space, series 4: Return from Mars

人類初の月着陸と、月での謎のUFO・エイリアンとの遭遇、タイムトラベルなどスリル満点の展開を聞くことができます。さらに火星への宇宙飛行、そこで明らかになる地球を長年にわたり監視し、地球文明の発展をコントロールしていきたエイリアンの存在。人類を滅亡させようとするエイリアンとの戦い、等々とても面白いSFドラマです。詳しい内容は上のWikipediaの記事を参照してください。

昨日 YouTubeで検索してみたところ、全編がアップロードされているのを見つけました。是非聞いてみてください。あのホーキング博士やメージヤー首相(サッチャーの後継者の英国首相)などもこの番組のフアンだそうです。

https://www.youtube.com/playlist?list=PLb_reFs62QjWAJW8q616qGkXIGKgbl-I0

マークダウン言語Quartoを使えば、完全無料で自分のホームページが作れて、無料で公開できるそうです。

去年、新時代のmarkdown言語としてQuartoというのを紹介しました。

Pythonによるデータ処理の新刊本とQuartoの紹介です。

これはRStudioが生み出したmarkdown言語で英語も日本語も同じように扱えます。本を作るのによく使われていますが、今日、奥村先生のtwitterで、Quartoで自分のweb pageを作成して、公開することができるのを知りました。科学者が手軽に発振するのに大いに役立つと思います。作り方がRを知らない人、RStudioを知らない人でも作成できるように、詳細に書かれています。

https://www.marvinschmitt.com/blog/website-tutorial-quarto/
公開する場所として、 GitHub pagesというGitHubユーザーが無料で公開できるweb pageを使うので、無料で公開できます。レンタルサーバーにお金をはらってドメインを取得して公開する必要がありません。公開用のテンプレートも無料で提供されています。こんなサイトができます。
https://marvinschmitt.github.io/quarto-website-template/
GitHubを使ったことのない人でも公開できるように、詳細な解説がのっています。頑張れば、自分で無料でweb pageを公開できそうです!

「ChatGPTとの付き合い方」という動画が必見です!

ChatGPTに関する素晴らしい日本語の動画を紹介します。
【第64回】 大学等におけるオンライン教育とデジタル変革に関するサイバーシンポジウム「教育機関DXシンポ」(4/21 オンライン開催)
「ChatGPTとの付き合い方」中川 裕志 理化学研究所革新知能統合研究センター チームリーダー
国立情報学研究所 – National Institute of Informaticsの動画です。YouTubeでも見ることができます。
https://youtu.be/T6VT7IOocKQ

これは末尾にはりつけてある4月11日に紹介したビデオのシリーズの動画です。国立情報学研究所 の以下のサイトでは、この動画と、スライドの重要部分をpdfにした資料をダウンロードすることができます。
https://www.nii.ac.jp/event/other/decs/past.html

19分ちょっとの動画ですが、ChatGPTを使う心構えや、ChatGPTにまつわる世界的な倫理を含めた取り組み、今後AIとどのようにつきあっていくことになるかという未来予想もある、とてもよい講演です。特に詳細な利用例が参考になります。ChatGPTに、反ワクチンの意見をどのような戦略で普及させたらよいかを教えてもらう例、ローマ帝国の滅亡原因を教えてもらう例とかで、ChatGPTの悪用、誤りを含む回答への対処法なども学べます。さらに今後のこうしたAIが、一律に保守的な意見だけを学習して回答するようになることの危険性も指摘されています。

革新的技術であるChatGPTのようなLarge Language ModelによるAIが今後どのように世界を変えていくか、そこを考えるための基礎がわかる動画です。すぐに見終わることができるので気軽にご覧になることをおすすめします。必見の動画です。

ChatGPTを知るための良いリンクを紹介します。

 

プログラミング言語Rの初心者向け教科書(オンライン版、無料)2冊と、Rの教材満載のサイトを紹介します。

プログラミング言語のRはゲノム解析や統計解析に活用されています。学んでおいて損がない必須のプログラミング言語といえるでしょう。今日は、オープンアクセスのRの教科書(英語)2冊を紹介します。O’Reilly から単行本や電子ブックがでていてこちらは有料ですが、オンライン版の教科書はどちらも無料です。またこの記事の最後には、Rの初心者、中級、専門家レベル向けの教材が満載のサイトも紹介しますので併せてご覧ください。

Hands-On Programming with R by Garrett Grolemund
https://rstudio-education.github.io/hopr/index.html
これはプログラムがはじめての人にR言語の全貌を把握させてくれる本です。

もうすこし進んだ人向けのほんはこちらです。
R for Data Science: Import, Tidy, Transform, Visualize, and Model Data (2nd Edition) by Hadley Wickham, Mine Çetinkaya-Rundel, Garrett Grolemund
これは2023年中ごろに発売される予定の最新の第二版のオンライン公開版です。
https://r4ds.hadley.nz/
2017年発行の初版も同じくオンライン無料公開されています。こちらからご覧ください。
https://r4ds.had.co.nz/
R for Data Science: Import, Tidy, Transform, Visualize, and Model Data (1st Edition) by Garrett Grolemund, Hadley Wickham

最後に、これらの本や、初心者レベル、中級レベル、専門家レベル向きの各種教材が次のサイトに集めてありますのでいろいろ探してみるとよいでしょう。

https://education.rstudio.com/learn/beginner/
https://education.rstudio.com/learn/intermediate/
https://education.rstudio.com/learn/expert/
以上のリンクとその他の情報は、次のトップページから見ることができます。
https://education.rstudio.com/

英語論文の書き方―ABC予想を解決し、新理論を開拓中の望月新一教授のブログ

ABC予想を解決し、新理論を開拓中の望月新一教授のブログ

昨年、NHKでABC予想についての番組が放送され、望月先生がその番組の採点をされたブログを紹介しました。

2022年4月のNHKスペシャルに対する望月新一先生による「合格発表」が掲載されていました。

さきほど久しぶりに先生のブログを拝見すると2023年の記事が掲載されていました。
https://plaza.rakuten.co.jp/shinichi0329/
2022年には次世代幾何学国際センターが京都大学に設置され、またThe LPP-RIMS Arithmetic & Homotopic Galois Theory IRN (AHGT)というフランスと日本の共同研究プロジェクトも発足したそうです。先生が開拓した宇宙際タイヒミューラー理論を中心とする「次世代幾何学」が着実に発展しているようです。先生のブログの年頭所感の部分と補足をご覧ください。

また以前も紹介しましたが、先生の論文執筆の際の語学の扱いについての記事
https://plaza.rakuten.co.jp/shinichi0329/diary/201711210000/
も、とても貴重なアドバイスですので、是非ご覧ください。先生は語学に堪能で、冠詞をもたないラテン語、定冠詞しかもたないギリシャ語、不定冠詞や冠詞をもたないサンスクリット語なども勉強されたそうです。論文の書き方についてのこの記事は日本の研究者が是非読むべきものだと思います。すこしだけ引用させてもらいます。

“先日(=2017-11-14付け)の記事の最後辺りで展開した「Cドライブ・Dドライブ」の観点で説明すると、学生だけでなく、多くの日本人は

 英語を勢いよく自分の脳の「Cドライブ」に
詰め込むことこそが「幸せへの究極的な近道」
と誤解しがち

ですが、私の無数の経験から言わせてもらいますと、

 英語を自分の脳の「Cドライブ」に詰め込む
ことは実際にはむしろ、大変に危険であり、
むしろ「不幸への暴走特急」

にしかなりません。つまり、

 脳の「Cドライブ」に最優先で搭載すべきOS
はむしろ、ことの論理構造を見極め、その論理
構造を上手く分割したり整理したりするための
「組合せ論的整理術」を効率よく実行する仕様
のOSなんです。

上述のような英文添削の文脈ですと、いつも思い出すことですが、英語に出てくるような定冠詞・不定冠詞は、日本では「欧米文化を代表するような事象」として見做されがちですが、古代や東欧まで視野を広げてみますと、
・ラテン語には定冠詞も不定冠詞もない、
・古代ギリシャ語には不定冠詞がない、
・(現代)ロシア語には定冠詞も不定冠詞もない
等、多くの日本人の感覚とだいぶ違う実態が浮かび上がってきます。”

ChatGPTやDeepLがある今、最終的な英文のブラッシュアップにこれらを利用すれば、誰でも簡単に論文が書ける時代になりました。英語にわずらわされることがなくなったので、まず日本語でじっくり論文の構成を考えて、論理的な論旨の展開をすることに集中できます。日本語で論旨と構成がすっきりした論文を書けば、あとはAIで完璧な英文ができる時代になりました。これからは日本人が英語の添削に無駄な時間を費やすことなく、すぐれた研究成果をどんどん発表できるに違いありません。今日紹介した望月先生の記事を参考にして、日本語でじっくり構成を練って作成された、世界に通用する優れた英語論文をかける人たちが続出することを期待しています。

アフリカでのゲノム解析結果とその医学への応用、そして人類のアフリカ起源についての動画を紹介します。

今日はNIHの動画の紹介です。
Demystifying Medicine – Out of Africa: Genomic and Environmental Determinants of Global Healthというタイトルです。
https://videocast.nih.gov/watch=48839 演者はCharles Rotimi, (PhD, NHGRI, NIH) と Clement Adebamowo, (BM, ChB, ScD, FWACS, FACS, University of Maryland)のお二人です。
人類がアフリカ起源というのは有名な話です。今日の二人の演者は、アフリカでゲノム配列の解析を行っている方と、それをアフリカでの病気の研究に活用している方です。人類のアフリカ起源の証拠やホモサピエンスの起源、そしてゲノム解析の結果のわかりやすい解説と病気の解析への応用について学べるので、是非ご覧になることをお勧めします。昔、このNIHのvideo castで見た講演では、世界各地の集団のゲノム解析をした結果、アフリカ起源の集団のゲノム配列は、それ以外と際立って異なっており、ありえないことですが、もし今後全く交配がなかったら別の種になってしまうだろうという話をききました。最新の研究ではどうなっているのでしょうか。是非、最新の研究成果を聞いてみてください。
実はChatGPTに講演の字幕をダウンロードして要約してもらおうと作業していました。字幕のダウンロードファイルから必要なテキストを整形するのに手間取っていて、今日は要約ができませんでした。そのままテキストファイルをChatGPTに与えると長すぎるといわれてできなかったので、明日いろいろ試してみようと思っています。