ChatGPTが一段と強力になってきました―RDkitが使えるようになったそうです!

今日も一日ChatGPTにいろいろ簡単なコードを作ってもらって作業していました。8Gとかの大きさのあるWormBaseのファイルGFF3ファイルをあつかうことがなんとかできるようになったのも、ChatGPTがつくってくれるPython scriptのおかげです。
さて今日はこんなニュースも飛び込んできて、ますます科学研究に役立つ生成AIになってきましたね。

ChatGPTのプロンプトで「RDkitを使って〜〜」という指示をするだけで結果が得られるというすごいことになってきています。

RDkitについては以前の記事をご覧ください。

擬人化ドラマ✕情報解説 \世界は元素でできている/が明日放送だそうです。バイオ・ケモインフォマティクスのよいブログも必見です。

 

RDKit入門の記事があります。

生成AI時代のプログラミング学習についての動画やセミナーの案内。

生成AIでプログラム学習が革命を経験していると言われています。先日も赤石 雅典先生のそうした趣旨の講演動画を紹介しました。

AI時代のPythonの学び方についての動画が公開されました。

来月19日に次のセミナーがあるそうです。
2025年度DxMT人材育成セミナー開催(6/19)
タイトル: 生成AIによるプログラミング開発支援とソフトウェア利用支援
【講師】
三澤貴宏(東京大学 物性研究所 特任准教授)
吉見一慶(東京大学 物性研究所 特任研究員)

無料で登録すれば視聴できるようですので興味のある方は申し込んでみてください。
https://dxmt.mext.go.jp/news/3278

上のサイトから概要部分を引用しておきます。(申し込みリンクも上のサイトにあります。)
 
【概要】
 本セミナーでは、生成AI(ChatGPT)を活用したプログラミング学習および材料科学向けソフトウェアの利用支援について紹介します。具体的には、並列化対応したコード作成例、ソフトウェア活用について紹介します。また、MyGPTを利用した、ソフトウェアのAIチューター作成例についても紹介します。
 講演の一部は、以下の論文をもとにしています。
 T. Misawa et al., https://arxiv.org/abs/2504.08817

並列化対応のコード作成例というのも興味をひかれます。このセミナーとは関係ないのですが、並列化で思い出しました。プログラミング言語Rでの並列化についてのパッケージもできたそうです。Rthreadsという以前にあったRdsmパッケージの改良版だそうです。以下のGitHubをご覧ください。https://github.com/matloff/Rthreads

最後に、今AmazonのKindleではセールをやっていて、ポイントが販売価格の半分つくセールだそうです。最初に引用している赤石先生の本も実質半額で買えるのでよさそうです。他の本も大量に実質半額になっています。

「AlphaFold 等のタンパク質立体構造予測ツールを知って・学んで・使う」という講習会に参加しました!

今日はZoomで表題の講習会に参加しました。

AJACS「AlphaFold 等のタンパク質立体構造予測ツールを知って・学んで・使う」というこの講習会、なんと1000名を超える登録者があったそうでこの分野への興味の高まりを示していますね。
AlphaFoldって何?という人でも理解できる大上先生のイントロと、立体構造予測手法と活用例のわかりやすい紹介の後、博士課程二年生の古井さんによる具体的なtipsを含めた講義が素晴らしかったです。これは役立つ講習会でした。スライド中で文献も豊富に紹介して下さっているのでより深く勉強するきっかけにもなると思います。今回の講義の動画やスライド、本日の質疑応答の内容など一式は後日公開されるとのことで、公開されたら是非ご覧になることをおすすめします。AlphaFold登場以降、今日までの進歩の概要も把握できる講義でした。特に、以前このブログでも紹介したオープンソースの立体構造予測ツールBoltz-1についての使い方の紹介や糖鎖付加したタンパク質の立体構造予測の具体的なやり方の紹介もあってよかったです。

内容は以下のとおりです:つぎのurlからの一部引用です。
https://biosciencedbc.jp/event/ajacs/ajacs2025-05-22-structure-prediction.html
『AlphaFold が拓いた次世代のタンパク質構造予測』 大上 雅史氏 (東京科学大学)

アミノ酸配列から立体構造を予測する技術が近年急速に発展しています。本講義では、AlphaFold2に代表されるタンパク質立体構造予測技術について、手法の種類や活用例を紹介します。講義内では、AlphaFold2, ColabFold, AlphaFold3, Boltz-1, ESMFoldを取り上げます。

『タンパク質立体構造予測の実践と応用』古井 海里氏 (東京科学大学)

AlphaFoldによる立体構造予測をしたことがない初学者を対象に、AlphaFold2に代表されるタンパク質立体構造予測ツールの動かし方や、結果を解釈する方法について広く学びます。講義内では、ColabFold、AlphaFold Database、AlphaFold Server、Chai laboratory、Boltz-1について取り扱います。

このように大変有益な「データ解析講習会:AJACS」の過去開催分は、動画、スライド、質疑応答のまとめなどが以下のサイトで公開されているので興味のある講習会を選んで学ぶとよいでしょう。

https://biosciencedbc.jp/event/ajacs/

Lie群とかLie代数とか、エルランゲンプログラムとかが生命科学や医学研究に役立つという動画がありました!

このところChatGPTにWormBase(モデル生物線虫C. elegansのデータベース)のデータ(たとえばGFF3型式のファイル)をPCにダウンロードしてローカルで解析するプログラムを書いてもらって使っています(主としてLinuxの代表的なディストロであるUbuntuで解析しています)。前にもかきましたが、レベルは優秀な学部生、大学院生と共同作業しているような感じです。間違いもありますが、指摘するとすぐ訂正するし、私がわからないことがあって質問すると、的確に答えてくれることが多いです。Google 検索してもなかなか見つけられなかったサイトをさっと教えてくれたりします。PythonプログラムやRのプログラム、Excelのマクロなどをつくってくれるので、昔はできなかった巨大データ(といっても8G程度ですが)の解析が手軽にできてしまいます。年配の方もプログラムを手軽に動かして利用できる時代になっているので、まだ試していない方は是非ChatGPTなどのLLMでプログラムの勉強を始めてみてはいかがでしょうか。今までのプログラム学習(教科書のHello, World!から始めるようなプログラム学習)ではなく、自分で実現したい機能をLLMに伝えて高度で実用的なプログラムを作ってもらい、うまく動くようにLLMと相談しながら改訂した後、うまく動いたプログラムのコードの解説をLLMにやってもらうという方式がおすすめです。

さて今日は英国のThe Royal Society1が本日アップロードした動画が面白そうなので紹介します。

この動画はLie群とかLie代数とか聞いたことがあるけれども難しげで敬遠されていることが多い、Lie理論の入門動画になっています。
The Royal Society Africa Prizeの受賞者 Professor Ali Baklouti による講演です。Lie理論がよく耳にする素粒子論での応用のみならず、生命科学や医学、そして地球物理学など様々な科学分野に応用されていることをこの講演で初めて知りました。昨年、雑誌数学セミナーの4、5、6月号でLie代数やLie群の話が連載されていたのですが応用例としてあげられていたものに生命科学系の話がなかったもので、読まずにパスしていました。この講演をきくと、Lie群とか勉強してみたくなること請け合いです。

YouTubeに量子生物学の講義動画がアップされはじめました。

今月はじめに英語の量子生物学の教科書が無料で読めるという記事を書きました。

量子生物学の教科書を書いて公開している人がいます。

その著者の人が、その教科書(ダウンロードリンクは上の記事をご覧ください)を使った講義を始めたようで、第一章の講義動画がアップされていました。

Quantum Theory & The New Observables: Chapter 1 of Physical Principles of Quantum Biology
https://youtu.be/1igKzDiWc84?

この人は、量子力学を多体系に適用することで正統派のやり方で量子生物学を構築しようとしているようです。20世紀はじめのケルビン卿の物理学の暗雲の話からはじまって、物理学と量子力学の歴史をたどり、エルミート形式の量子力学から非エルミート量子力学で生命を研究するというような構想を語っているようです。ちょっと面白そうですね。

AIを使ったタンパク質設計の最新動画と、物理学に基礎をおいた深層学習の教科書の紹介です!

今日はAIについて二つトピックスを紹介します。

まず機械学習によってタンパク質のデザインを行う方法についての最新の動画がでたので紹介します。とうとう実験をするよりも効率的にタンパク質の設計ができる時代がきたようです。わかりやすく最新の研究成果をプレゼンしているので是非見てください。
Designing new and improved functions in natural protein folds
https://youtu.be/2aaWh8yVq8U?

Boston Protein Design and Modeling Clubのチャンネルhttps://www.youtube.com/@bpdmc/videosにアップされたばかりの動画です。

もう一つは、このところ何回か紹介した物理学に基礎をおいて創る深層学習についての教科書の紹介です。
Physics-based Deep Learning book (PBDL) v0.3
これはオンラインで読める教科書ですが、https://physicsbaseddeeplearning.org/intro.html
pdfをダウンロードして読むこともできる無料の教科書です。https://arxiv.org/abs/2109.05237
pdfへの直リンクはこちらです。https://arxiv.org/pdf/2109.05237.pdf
まだ作成中の教科書なのでさらに内容が増える予定とのことです。

次のGitHubにオンライン版へのリンクやpdfのリンク、そしてJupyter notebookのコードへのリンクなどがまとまっていますのでまずここを見るとよいでしょう。
https://github.com/tum-pbs/pbdl-book?tab=readme-ov-file

『星が私たちをつくる』という動画がおすすめです。

今日は忙しかったので簡単な記事です。
英国The Royal Institutionの最新動画です。
https://youtu.be/CnaAk411284?
星が私たちをつくる ― ロベルト・トロッタ

この動画では星と星についての人類の好奇心が、私たちの進化や進歩をどのように導いてきたかを豊富なエピソードを交えて解説してくれます。私たちの体は星屑でできているという有名な話だけではなく月の満ち欠けの周期を知ることが狩りにどのように役立ったか、ネアンデルタール人にホモサピエンスが取って替われたのは何故か、星の運行を計算して天体暦を作成する目的で、世界初のコンピュータ(Ada LovelaceはThinking machineと呼んでいたそうです)がバベッジによって設計され世界初のコンピュータプログラムがAdaによって書かれたという話もでてきます。とにかくわかりやすく面白い講演ですので是非ご覧ください。Adaの話のところに飛ぶようにした埋め込み動画は下にあります。
https://youtu.be/CnaAk411284?&t=1800

やさしい計算物理学の講義がワシントン大学から公開中です。

英語の講義ですが、計算物理学のやさしい解説講義(pythonコード付き)が公開されています。Physics-informed machine learningというのは、機械学習の際に物理学的知識を組み込んだAIをつくって使うというもののようです。ワシントン大学からの動画です。


Physics-Informed Machine Learning, Section 1 – Introduction, Part 1
https://youtu.be/ak2oTkooJ_s?

Course: Physics-Informed Machine Learning
https://composites.uw.edu/AI/

内容目次を引用しておきます。具体例を通じて学べるよい講義のようです!

Section 1: Introduction
OFAT (One-Factor-At-A-Time) vs. DOE (Design of Experiments) vs. Iterative Machine Learning, Quick Overview of Traditional ML Methods (NN, GPR, Ensemble Methods)

Section 2: Case Study on Heat Transfer
Physics-Informed Features, Loss, and Domain Transformation with Neural Networks (NN)

Section 3: Case Study on Discovering Chemical Reactions
Physics-Informed Augmentation with Sparse Identification of Nonlinear Dynamics (SINDy)

Section 4: Case Study on 3D Printing
Physics-Informed Synthetic Features using Finite Element with Ensemble Methods

Section 5: Case Study on Adhesive Bonding Strength
Physics-Informed Domain Transformation and Dimensionality Reduction with Gaussian Process Regression (GPR)
同じワシントン大学からの次の講義もあります。最初のツイートをしている先生です。動画には日本語字幕もついているようでこちらも本格的に勉強するのによさそうです。

Physics Informed Machine Learning
作成者: Steve Brunton 再生リストをご覧ください。
https://youtube.com/playlist?list=PLMrJAkhIeNNQ0BaKuBKY43k4xMo6NSbBa&

最初の動画をうめこんでおきます。
Physics Informed Machine Learning: High Level Overview of AI and ML in Science and Engineering
Course: Physics-Informed Machine Learning
https://youtu.be/JoFW2uSd3Uo?

AIのGeminiの使い方や、AIを使った文献検索のやり方などを教えてくれる動画が公開中(5月19日月曜日朝9時まで)です!

【第88回】大学等におけるオンライン教育とデジタル変革に関するサイバーシンポジウム
19日朝9時までタイムシフト視聴可能
https://www.youtube.com/live/ygTbeScwg20?

YouTubeのサイトからプログラムを転載します。
◆プログラム
2:54
1.「はじめに」
喜連川 優 情報・システム研究機構長

5:37
2.「京都大学のGoogleテナントでの生成AI活用に向けた取り組み」
古村 隆明 京都大学 情報環境機構

29:12
3.「教育のデジタル化を推進するための教員研修の高度化と教員の授業改善支援」
小﨑 誠二 奈良教育大学大学院教育学研究科 教授

56:11
4.「適応的学習支援のための能力値推定手法の開発」
堤 瑛美子 法政大学 理工学部創生科学科・専任講師

1:27:14
5.「生成AIを用いた文献調査ツールの動向」
矢田 竣太郎 筑波大学 図書館情報メディア系・准教授

1:56:12
6.「ディスカッション」

最初の動画ではGeminiの使い方などが学べます。動画の中で紹介されていた公開中のGemini利活用方法というpdfはこちらで公開中とのことです。
https://u.kyoto-u.jp/gemini-use
生成AIも日進月歩なので、こういうまとめの動画はありがたいですね。
19日朝までにご覧になれない場合は、ほどなく再公開されると思いますのでそれまで待ちましょう。

山本典史先生による学生のためのAI活用講座の資料が公開されています。必見です!

量子化学についていつもよい記事やプログラムその他を公開されている山本 典史先生のツイートです。

 

生成AIを学生向けに紹介する記事ですが、一般人にも大いに役立つ内容です。是非読んで参考にされることをおすすめします。
https://yamnor.me/2025-05-14-1150/

山本先生は最近、量子化学の講義もYouTubeで公開されています。
量子化学2(第1回)講義動画1
講義は6回まですすんでいるようです。
https://youtu.be/Q6irpczkbws?

https://www.youtube.com/@noriyama/videos