ChatGPTを使いながらUbuntuにR環境を設定しています。

今、Linuxのディストリビューションでもっとも普及しているUbuntuにプログラミング言語Rの環境設定を行っています。一昨日、UbuntuにRをインストールしました。引き続き、CRANから全ライブラリパッケージをダウンロードしてインストールする作業を行ってみました。これは昨日の午前中にはじめたのですが、昨日の記事に書いたように今朝起きた時には終わっているとおもいきや、まだ続いていました。今日は一日中、ずーっとLinuxのPCを動かしたままでみていたのですが、夕食後にやっとダウンロードとパッケージの展開、インストールが終わりました。門田先生の「トランスクリプトーム解析」(共立出版」)という教科書に従って作業したのですが、9年も前の本なので、CRANのパッケージ数が増えているので時間がほぼ一日半もかかったのだと思います。またBioconductorの中のパッケージのインストール方法も変わってしまっており、本に書いてあるbiocLiteを使う方法は使えなくなっていて、BiocManagerを使う方法に変更しなくてはいけませんでした。Rのコンソールで作業していましたが最初のCRANの全パッケージの導入作業が終わったあとにはwarningsが50以上ありましたというメッセージが表示されていました。これを全部ファイルにおとして後で、ゆっくり見るにはどうしたらいいのかをChatGPTに聞いてみました。sink関数を使う方法をすぐ教えてくれます。また50以上のwarningsを後でみることはできないので、インストールするまえにこれこれのコマンドを与えておくとファイルにwarningをセーブすることができるといったアドバイスもしてくれるのは助かります。時にはうまく動かないコマンドも教えてくれますが、動かないとchatすると、すぐに謝って違う提案をしてくれるので、たいていは数分以内に問題が解決します。BioconductorのUbuntuへの導入法、RStudioの入れ方なども懇切丁寧に教えてくれて大変便利です。Rのコードも書いてくれるので、試してみるとたいていはすぐ動きます。教えてくれたコードのわからない部分について解説してとチャットで依頼すると、丁寧に解説してくれるのは感動ものです。エラーメッセージについて解説をお願いしてみると、特定のエラーについて解説してくれるだけでなく、一般的なエラーメッセージの読み方、その対処法の調べ方なども教えてくれて、プログラムの勉強の最強の家庭教師になっていると思います。英語の勉強、プログラミングの勉強、数学の勉強などなどChatGPTはたしかに役立つものだと いまさらながら、実感しています。

昨日のニュースで流行語大賞トップテンに生成AIが選ばれていたそうですが、ビジネスパーソンの中では生成AIが9割得票のトップの流行語だったそうです。

来年はもっとすごいことになるかもしれませんね。

理化学研究所と編集工学研究所のコラボ企画 科学道100冊傑作選が発表されました。

今年も理化学研究所と編集工学研究所の発表する推薦本の紹介、科学道100の季節がやってきました。
今年は
「科学道100冊」シリーズベスト盤、「科学道100冊 傑作選」を発表
-理研の研究者 × 本のプロ・編工研が選ぶ、良書100冊-

というタイトルで、「シリーズ第7弾となる今回は、これまでの「科学道100冊」シリーズを総括した「傑作選」を発表します。」ということです。https://www.riken.jp/pr/news/2023/20231130_2/index.html

こちらにはhttps://kagakudo100.jp/lineup-masterpiece
今回の傑作選の100冊の他に、今まで各年に選ばれた100冊のリストも載っています。

選ばれた本の画像をクリックすると、本の内容や推薦コメントがみられます。面白そうな本をみつけて是非読んでみてください。
今年の傑作選をみると、私は30冊ほどは読んでいるのがわかりました。

昨年のこのブログでの紹介はこちらから読めます。

科学道100冊 2022年版が発表されています―面白い科学の本をみつけましょう!

実は今、Ubuntuの最新版LTSに最新版のRと、CRANのパッケージ全部をインストールしています。午前中からはじめていますが、いまだにpackageのインストールのほうが終わりません。多分明朝には終わっているでしょう。

Stephen Wolfram の新しい科学の定式化についての動画がありました‥‥。

Stephen WolframはThe Royal Institutionで講演していたんですね。この動画です。 サイトには3 November 2020の講演となっています。
Computation and the Fundamental Theory of Physics – with Stephen Wolfram
https://youtu.be/qoDZKlcdPNM?si=K7GG5EoHDkfox2Lx
日本語字幕もついているので日本語で字幕を読みながら視聴することも可能です。cellular automataの実演による解説などわかりやすい動画です。

彼は Mathematica、Wolfram Alpha、および Wolfram 言語の作成者として有名な科学者です。オートマトンの理論家で多くの著書もあります。最近ではChatGPTの一般向け解説書「ChatGPTの頭の中」を書いていて、日本語にも翻訳されているので読んだ方も多いと思います。https://www.hayakawa-online.co.jp/shopdetail/000000015521/
この本の内容は英語なら無料で読めます。以前の記事をご覧ください。

ChatGPTのWolframによる解説や、いろんな機能を持ったAIを探せるサイトなどがありました。

Wolframはこの講演で彼の本のA Project to Find the Fundamental Theory of Physics (English Edition)の内容について触れているのだと思います。この本はKindle unlimitedで読めるようですので契約している方はご覧になるとよいと思います。
この彼のプロジェクトは着実に進んでいるようです。
こんな動画をみつけました。私には理解できない内容ですが、Wolfram流の物理の定式化であるhypergraphから一般相対性理論が導けるという動画だそうです。
How to derive general relativity from Wolfram Physics with Jonathan Gorard
https://youtu.be/1tjhE0U-mgc?si=yHGdoIDqNUDpyzp7

量子力学もでてくるとか‥‥。
How to derive quantum mechanics from Wolfram Physics with Jonathan Gorard
https://youtu.be/YZhCYLZanEE?si=c7eH-FodA5RVKl1J
ほんとうなら面白いですね。

AlphaFold2がアップデートされているそうです。糖鎖生物学にも役立つと期待できます。

今日は毎週開講されている神戸大学計算科学教育研究センター提供の遠隔講義、計算生命科学の基礎10の講義の日でした。今日は「タンパク質人工設計の基礎」という講義で、
講師は古賀 信康 先生 (大阪大学蛋白質研究所)でした。タンパク質を設計して天然にない構造のものもつくれるという実例も面白かったですが、なによりも蛋白質の折りたたみ、立体構造のルールを物理化学的な研究で明らかにしたという研究は刺激的でした。またタンパク質のfoldingの原理もよくわかる講義でした。またAlphaFold2のような機械学習のAIは既存のタンパク質の立体構造を学習して予測するため、天然に存在しない新たなタンパク質を作って、それらの構造を予測させると誤ることが多くなる(予測構造と実際の構造とが一致しない)というのもなるほどと思いました。そのAlphaFoldですが、東京医科歯科大学教授の清水 秀幸先生のツイートでさらに強力にバージョンアップしていることを知りました。


ツイートにあるサイトをみると、https://deepmind.google/discover/blog/a-glimpse-of-the-next-generation-of-alphafold/
私たちが研究している糖鎖生物学にもこれからずいぶん役立ちそうです。新型コロナウイルスのスパイクタンパク質(糖タンパク質です)の抗体と結合したモデルの動画などもこの記事にのっています。この記事内のRead our progress updateというリンクにある最新情報入りのpdfには、糖鎖付加したタンパク質の糖鎖を含めた構造も予測できるようになっている例や精度についての評価ものっています。
https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/a-glimpse-of-the-next-generation-of-alphafold/alphafold_latest_oct2023.pdf
もちろん動的な糖鎖の動きを知るのは先の話ですが、とりあえずは糖鎖を含めた蛋白質の構造のスナップショットがうまくいけば原子サイズレベルで予測できると期待できるようです。糖鎖生物学の新しい展開を期待しています。

国立国会図書館のデジタルコレクションは宝の山です。でもオーウェルの有名な本『1984年』はなさそうです。

国立国会図書館のデジタルコレクションのタイトル数が増えました。でもオーウェル『1984年』はなさそうです。今注目されているオーウェルの小説『1984年』はこちらに全訳が完成して無料公開されています。https://cruel.hatenablog.com/entry/2023/11/25/005207
山形浩生さんの「山形浩生の「経済のトリセツ」」というサイトです。https://cruel.hatenablog.com/

https://www.ndl.go.jp/jp/news/fy2023/231128_01.html

こちらにどんな本や博士論文などが個人送信資料で読めるかのリストがありますのでダウンロードして検索するとよいでしょう。エクセルファイルもありますので、検索キーワードに著者名やタイトル名の一部などをいれて検索すると、思わぬ掘り出し物が見つかると思います。
インターネット公開されているのは36万点の本です。https://www.ndl.go.jp/jp/dlib/standards/opendataset/index.html#opendataset01

NHKのラジオ番組が聴けるらじるらじるの聴き逃し配信で高瀬正仁先生の数学史の番組が聴けます。おすすめです

私が中学生の時には、FMラジオでNHKの朗読の時間の放送を寝る前によく聴いていました。最近はラジオを聞かなくなったのですが今日、ツイートで高瀬正仁 先生(九大におられました)の「カルチャーラジオ 科学と人間 数学者たちに見る「情緒」の世界」という番組があることを知りました。全13回の放送で、現在は8回目までが聴き逃し配信されていました。 初回の放送は、2023年12月1日(金) 午後9:00配信終了とのことですので、聞きたい人は急がなくてはならないようです。https://www.nhk.or.jp/radio/ondemand/detail.html?p=3065_01
岡潔についても二回ほど触れられているそうです。ガウスとかアーベルとかの話もあって、数学とその歴史に興味のある方には聴き逃せない放送です。是非お聴きください。

NHKの聴き逃し配信の番組リストはこちらにあります。https://www.nhk.or.jp/radio/ondemand/
朗読も聴くことができて、芥川龍之介の「秋」とか宮沢賢治の「やまなし」や「なめとこ山の熊」その他の童話や詩集も聴けます。
音楽や高校講座、語学講座などもあってこのサイトは楽しめそうです。

GPUってなに?と思ったときに参考になる記事や動画があります。

AIの時代になったので、GPUを使うと計算が超高速化できるというのでGPUについて耳にすることが多くなりました。AlphaFold2などでも自宅のPCで動かすときにはGPUの設定をしなくてはなりません。このGPUについての基礎知識を身につけたいと思っています。そんな目的のためには、Gigazineの11月23日の記事はとてもわかりやすくて良い記事だと思います。

GPU・CUDAを活用して数値計算やAIのトレーニングを高速化するのに必要な基礎知識のコード例付きまとめ
https://gigazine.net/news/20231123-gpu-survival-toolkit/

この記事はこちらの英語のブログの紹介です。https://journal.hexmos.com/gpu-survival-toolkit/
Gigazineの記事を読みながら、この英語の記事を読むとよくわかると思います。

またGPUについては、日本語での講義が公開されています。計算物理春の学校2023のこちらの動画です。
https://youtu.be/vp_rM8kFYNc?si=rspK1TD-77-EQ0Bo

スライドもこの動画のページにリンクが乗っているのでダウンロードできます。
GPUコンピューティング入門スライド: https://hohno0223.github.io/comp_phys_spring_school2023/materials/Intro_GPU_computing.pdf
ハンズオン Lab1 スライド: https://hohno0223.github.io/comp_phys_spring_school2023/materials/Lab1.pdf
ハンズオン Lab2 スライド: https://hohno0223.github.io/comp_phys_spring_school2023/materials/Lab2.pdf

計算物理春の学校2023についてはこちらの記事をご覧ください。

計算物理春の学校2023の動画や講義資料が公開されました。

Linear Algebra Done Right (4th edition)が無料公開されました。また東大から初学者向けの強化学習の資料も公開されています。

今日の記事の前半では、昨日のマクマリー 有機化学第10版に続き、無料公開されている教科書Linear Algebra Done Right 第4版を紹介します。後半では、東京大学から公開された強化学習についての初学者向け資料にについて紹介しています。

2022年1月にLinear Algebra Done Rightという本について以下のような記事を書きました。

2022/1/22
今日は数学の無料本を一つ紹介しておきます。大学院レベルのオープンアクセスの電子書籍でSheldon Axler先生の書いたMeasure, Integration & Real Analysisというものです。Springerから印刷された本としても出版されています。このサイトから最新版と正誤表などがダウンロード可能です。
同じ著者のLinear Algebra Done Rightという本は昔は一時無料公開されていてこのブログでも紹介しました。今は講義動画のみ無料で学べます。
https://linear.axler.net/LADRvideos.html

コロナの感染拡大の時には、この本は無料でダウンロードできたのですが、もう読めなくなっているという記事です。
その後、著者のSheldon Axler 先生のツイート
https://nitter.net/AxlerLinearには、着々と第4版の準備をされている様子、出来上がった部分の公開などの進捗状況が逐次ツイートされていました。
とうとう今年の10月末にLinear Algebra Done Right第4版が公開されたという次のようなツイートがでました。

先生の次のサイト
https://linear.axler.net/
にリンクがあります。

この本の講義ビデオへのリンクもこのサイトにのっています。また同じ著者の他のオープンアクセス版の教科書Measure, Integration & Real Analysisのダウンロードリンクが以下にあるのでご覧ください。
https://measure.axler.net/
それぞれ数学科の学部生や院生むけの教科書なので、生命科学のウエットの学生、研究者には難しいかもしれません。ダウンロードしてみて、読めそうだったら利用するとよいと思います。

Linear Algebra Done RightはSpringer Natureから紙の本が販売されているので、もちろんSpringer Linkからも無料でpdfがダウンロードできます。
https://link.springer.com/book/10.1007/978-3-031-41026-0

また昨日、東京大学の松尾研究室の博士課程に在籍されている今井翔太さんの次のツイートがでました。


スライドはこちらにあります。わかりやすそうです。 OpenAIの噂の人工知能Q*と関係があるアルゴリズムなんでしょうか?興味がつきない内容です。
https://speakerdeck.com/imai_eruel/reinforcement-learning-for-everyone

100万人以上の学生が使った教科書 「マクマリー有機化学」の最新版(2023年9月発行の第10版)がなんと完全無料公開されました!

この頃の教科書の値段が高すぎるという声が世界中で聞かれます。そんな教科書の値段の昂騰(高騰 こうとう)を憂えている教育・研究者が無料の教科書を公開する例が増えています。今日はそうした教科書の一つで最近公開された世界の標準教科書を紹介します。

有名な有機化学の教科書John McMurryの Organic Chemistry は2015年発行の第9版まで100万部以上が売れた有機化学の定番教科書です。第9版の日本語版も広く読まれています。マクマリー有機化学(上・中・下)第9版 (東京化学同人)です。https://www.tkd-pbl.com/book/b278911.html

今回無料で公開されたのは2023年9月発行の英語版教科書Organic Chemsitry 第10版です。教科書価格の昂騰に苦しむ学生を助ける目的の他に、McMurryさんの嚢胞性線維症(のうほうせいせんいしょう)で亡くなった息子さん(Peter McMurryさん 12/10/1968-12/12/2019)にささげる意味も含めて無料公開されたそうです。ダウンロードリンクや本の説明、補足資料、正誤表などが以下のサイトにありますのでご覧ください。
https://openstax.org/details/books/organic-chemistry?Book%20details
これは大変よくできた、親切な学びの場を提供しているサイトです。是非ご覧ください。
ダウンロードリンクをクリックすると、寄付のお願いなどが表示されますが、寄付しなくても一番下のGo to your Fileのボタンを押せばダウンロードできるので試してみてください。もちろん寄付されてもよいと思います。
今ダウンロードしたpdfを見ましたが、フロンティア分子軌道法についても詳しく解説しているなどアップデートされたわかりやすい教科書です。

第9版からの変更点その他詳しいこの教科書の解説は以下をご覧ください。
https://openstax.org/blog/john-mcmurry-organic-chemistry-a-tenth-edition-now-available-from-openstax-free-online

オープンアクセスの教科書を出版しているOpenStaxのツイートも参考になります。https://nitter.net/openstax

 

OpenAIの創業にかかわったAndrej Karpathyさんの大規模言語モデル (LLM)入門の1時間の講演動画は必見です。

OpenAIのアルトマン解任騒動は決着したようでよかったです。なんか汎用人工知能AGIに近づくような画期的人口知能システムQ*が開発されてその扱いをめぐって解任騒動が起こったという噂もあるようですね。本当でしょうか?

ちょうど本日、YouTubeに、OpenAIの創業にかかわったAndrej Karpathyさんの大規模言語モデル (LLM)入門の1時間の講演がアップロードされました。
[1hr Talk] Intro to Large Language Models
https://youtu.be/zjkBMFhNj_g?si=MjMQAZBXZYgZPEzg

もともとはAI Security Summit (今年の11月14-16日開催。参加は招待されたもののみ可能)での講演だったのですが、講演は評判が良く、聞きたかったという人が大勢いたそうです。そこで新たに講演を再現したdirector’s cut版の講演動画を作り、スライドもダウンロードできるようにしたうえでYouTubeに公開したそうです。
Andrej KarpathyさんはOpenAIの中の人なので、これはおすすめの動画です。講演はオープンソースの Llama 2 70Bを例にとってのLLMの解説から始まります。LLMの中身にはどんなフォルダがあるのか、興味津々ですよね。中身の二つのフォルダ(巨大なパラメーターを記述したフォルダと、LLMを動かすコードを記述したフォルダ)をMac Bookにダウンロードして、一方のフォルダにあるC言語でかかれたコードを動かすと、ネットにつながっていなくても自分のパソコンでLLMが動くのだそうです。もっともHDD容量がものすごく必要ですし、回答がでるまでには結構時間がかかるのはパソコンですからしかたがありません。こんな説明の後には、LLMの動作原理、transformerの話、ハルシネーションの話などが続きます。ニューラルネットワークのパラメータがどのように相互作用してAIがちゃんとした回答をするのかの詳細はほとんどわかっていないそうです。制御できるのは、どうやってより正しい回答をするようにAIを訓練、調整するかだそうです。 ChatGPTのトレーニングはどのように行われているかとか、適切なプロンプトの与え方についての説明も役立ちます。もちろん最近使えるようになってGPTsの紹介もあります。注目すべきは、今後のAIの発展の話です。あと数年以内に現在のChatGPTにSystem 2が追加された形の汎用人工知能もどきが登場するようです。見て、話して、自分でネットを調べて、正確な推論ができる人工知能の登場は間近だそうです。最初に書いた、今噂のQ*のことなのでしょうか。面白い動画です。またAIのセキュリティの話(爆弾を作る方法とか人類を滅亡させる方法を教えてとLLMに問いかけても、答えを教えないようになっているのをどうやって答えさせるか(いわゆるjail breakのやり方)の話もあります。またプロンプトインジェクションの話もしっかり入っていて、これは必見の動画です。是非ご覧になることをおすすめします。