英語をChatGPTで書くために役立つサイトと、統計初心者向けの日本語スライドや、英語の講義スライドの日本語版について紹介します。

昨日紹介したnoteについての追記です。限界助教さんのnitter  「ChatGPTで論文作成と科研費申請」
https://nitter.net/genkAIjokyo
に有用な情報がたくさん掲載されているのでご覧ください。noteのほうには、
「医学英語論文をAI(ChatGPT)で作成する方法(用法を守ってご利用ください) 」
という有料の記事もあります。これは役立ちそうです。
https://note.com/genkaijokyo/n/nb3992750a49a
noteの記事の
「ChatGPTのGPTsで英文校正GPTを作ってみた 」
https://note.com/genkaijokyo/n/ndcd52fc2c4b3
は昨日紹介しました。GPTsというのは続々公開されていますが、使うのにはChatGPT plusの契約が必要のようです。

「ChatGPTによる英文校正のプロンプト比較」という記事にはarxiv.orgに掲載された英文の文法チェックをChatGPTやChatGPT 3.5で行ってみてその能力を評価した論文についても掲載されていました。
https://note.com/genkaijokyo/n/n151d57c44864
arxiv.orgのプレプリントはこちらです。
https://doi.org/10.48550/arXiv.2303.14342
タイトルと著者も引用しておきます。
Analyzing the Performance of GPT-3.5 and GPT-4 in Grammatical Error Correction
Steven Coyne, Keisuke Sakaguchi, Diana Galvan-Sosa, Michael Zock, Kentaro Inui

限界助教さんは、GPTも公開されていますが、DeepLやGoogle翻訳越え!という「アカデミック文章の和英翻訳に特化したGPTを作成しました」ということです。

こちらのリンクからChatGPT plusユーザーなら使えます。https://chat.openai.com/g/g-RKXe3aooI-he-ying-fan-yi-gpt

また全然別の話題で恐縮ですが、ネットをみていたら
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」」というスライドが公開されていました。Slideshareのサイトなのでログインしないとダウンロードはできないので不便ですが(私はログインはしません)全部を画面でみることは可能です。初心者に役立つ資料だと思います。https://www.slideshare.net/matsukenbook/rev012

また統計エキスパート養成のための大学院生向け日本語教材が、「統計エキスパート人材育成コンソーシアム」のサイトに掲載されているのを知りました。
https://stat-expert.ism.ac.jp/training/discussionpaper/ のページにある
SSE-DP-2023-3 「統計的学習(講義スライド) – Statistical Learning -」国友 直人、趙 宇、湯浅 良太(訳)、Trevor Hastie, Robert Tibshirani (原著)という資料です。
以下からダウンロードできます。
https://stat-expert.ism.ac.jp/wp/wp-content/uploads/2023/05/SSE-DP-2023-3.pdf
これはこのブログで以前講義動画や教科書へのリンクを紹介したTrevor HastieさんとRobert Tibshiraniさんの二人による講義で使われている、講義スライド(英語)の日本語訳版です。
以下の今年7月の記事には教科書や動画へのリンクがあるので、参考にしてください。

RやPythonを使って統計学と機械学習を一挙に学べる入門書(英語版)が無料公開されています。

ChatGPTやBardなどはプログラミング学習や英語論文の校正、教科書の学習などに どれくらい役立つでしょうか?

私はプログラミング初心者なので、プログラムを書いたり、解説してもらうのに大規模言語モデル(Large Language Model=LLM)がどの程度有効かが知りたいと思いました。ネット検索してみると、九州大学の伊東栄典先生がこちらの動画で、プログラムを書くのに大規模言語モデルChatGPTや Google Bardがどの程度有効かを語っておられますのでご覧になると参考になると思います。
「中級プログラマによる生成AIの活用事例紹介」          伊東 栄典 九州大学情報基盤研究開発センター 准教授
https://youtu.be/7mGbbasLRdM?si=YMw_7uMS0IsDcquL

初級、中級のプログラミングにはこれらはめちゃめちゃ役立つようです。上級レベルになると、質問する人の知識が少ないので適切なプロンプトがつくれなかったり、またLLM自体のの学習データが、上級レベルのプログラミングについては手薄になっているような印象とのことで、上級レベルのプログラムを作ってもらうのに使いこなすのは難しいようです。どんなのが初級、中級、上級かというのは動画をご覧になってください。自分がわからないプログラムコードを入力して説明してくださいと頼むと、ChatGPTが懇切丁寧に説明してくれるのはとても便利ですね。

昔はプログラミングの教科書に練習問題があって、その答えがない教科書は独学している初心者には役立たなかったものです。今やそんな教科書でも練習問題の答えあわせは、ChatGPTなどのLLMで可能になっています。プログラミングではありませんが、私も昔解けなかった数学の教科書の問題をChatGPT (Wolframプラグイン入りにしてあります)にきいてみたところ、なるほどという解答がかえってきたのには感動しました。量子化学や解析力学、分子動力学などを学ぶときにもLLMを併用すると、学習効率が飛躍的に上がると思います。もちろん生化学や糖鎖生物学の学習にも役立ちます。そのへんのところは、ときどきこのブログに書きますので読んでください。

あと英文校正については、いつも紹介している京都大学の柳瀬陽介先生のブログ記事やツイートが役立ちます。
https://yanase-yosuke.blogspot.com/
https://nitter.net/yosukeyanase

また昨日紹介したGPTsで作られた英文校正GPTもいろいろ公開されているようです。最初に知ったのはこちらのツイートでした。

こちらのnoteの記事も書いておられます。
https://note.com/genkaijokyo/n/ndcd52fc2c4b3?sub_rt=share_b

ChatGPT Plusに実装された GPTのカスタムバージョンを作れる新機能 (GPTs)は画期的です!

ChatGPT Plusの能力がどんどん進歩していますね。さっきGPTsというGPTのカスタムバージョンを手軽に作成できるという機能を使ってみました。こちらの紺野 大地先生のツイートで初めてその存在を知った新機能です。

”「論文のURLかPDFを与えると解説してくれる」というだけなら既存のChatGPTでも出来ますが、細かい解説のフォーマットを自由に設定できる点や、繰り返し利用が便利な点などがGPTsの利点です。”との追記も上のツイートについておりました。

GPTsの使い方についてはこちらなどをご覧ください。ChatGPT研究所の昨日の記事です。
【誰でも簡単】GPT の作り方  https://chatgpt-lab.com/n/nb7ca3c406730

自分でこのアプリはどんなことをするかをChatGPT Plusにあらかじめ指示しておくと、その作業用のGPTが作れて、指示した作業が簡単に完了されることができるようになっています。DALL·Eというお絵かき用のGPTアプリを使えば、それを起動してどんな絵を描いてほしいか (日本語可)を指示するだけでお望みの絵がかけたりします。あるいはデータ分析をしてほしいエクセルファイルなどをData analysis 用のアプリ(Data Analysis)にいれれば自動でデータ解析してくれます。もちろん解析の手法や出力方法などもあらかじめ指定しておけるので、lこのアプリを開いてデータファイルを次々と放り込むだけですべての解析終了ということも可能になるわけです。上のツイートにあるように、論文のpdfを論文要約用のアプリにアップロードしてやると、あっと言う間に要約が帰ってくるようにもできます。

Open AIがあらかじめつくっておいてくれたお絵かきアプリDALL·Eとか、英文執筆コーチアプリCreative Writing Coachとか、データ分析アプリData Analysisとかもありますし、自分でアプリを作るのも5分もかからず簡単に完成させたり改良したりすることができます。完成したアプリは公開することもできますし、今月後半にはアプリストアができるのでそこアップロードして、収益を得ることもできるようになるそうです。

写真は私がはじめてDALL·EというGPTで作った70年代の京都、北山の古民家の画像です。日本語でいろいろ指示をあたえて描いてもらいました。ここのところをちょっと変えてとか日本語で指示するとそれに応じて絵も変化させられます。なかなかきれいな画像になっています。

ダークエネルギーやダークマターの存否を調べるための宇宙望遠鏡Euclidの最初の撮影画像が公開されてダウンロードできるようになっています。

今年の7月初めに SpaceX Falcon 9で打ち上られた宇宙望遠鏡Euclidがはじめて撮影した画像を送ってきたのがニュースになっています。この望遠鏡はラグランジュ点2に設置されているもので大きな視野を一発で撮影できる近赤外線宇宙望遠鏡です。宇宙の95%を構成するとされるダークマターやダークエネルギーの存否を明らかにすることを目的に、宇宙の詳細な3Dマップを作るための観測を主に行う予定の望遠鏡です。
Euclidが撮影した最初の画像を公開する生中継の様子が動画で公開されていました。私はライブではみていませんが、面白そうです。
Euclid’s first images: the dazzling edge of darkness
https://www.youtube.com/live/hHWbe82zM8o?si=nPKtCrfsshQQRiiX

実際送られてきた最初の撮影画像5枚はこちらにありますのでご覧ください。
Euclid’s first images: the dazzling edge of darkness
https://www.esa.int/Science_Exploration/Space_Science/Euclid/Euclid_s_first_images_the_dazzling_edge_of_darkness

一番遠くの宇宙から近くまでの5枚の撮影画像がのっています。それぞれダウンロードしてみることもできますよ。

たとえば1375光年はなれたオリオン座の馬頭星雲の動画や画像をダウンロードして見ることもできます。
https://www.esa.int/Science_Exploration/Space_Science/Euclid/Euclid_s_view_of_the_Horsehead_Nebula
から動画を、
https://www.esa.int/ESA_Multimedia/Images/2023/11/Euclid_s_view_of_the_Horsehead_Nebula
から画像を高解像度版でダウンロードできるので試してみてください。

ほかにも地球から2億4千万光年はなれたペルセウス座銀河団の1000個の銀河が、背景のもっと遠い10万個の銀河とともに映っている写真があって圧倒されます。
https://www.esa.int/ESA_Multimedia/Images/2023/11/Euclid_s_view_of_the_Perseus_cluster_of_galaxies
これもページの右にある赤い枠内のDownloadのプルダウンメニューからダウンロードできます。

下の写真は、上のリンクからダウンロードした馬頭星雲の写真です。

 

その下は私の子供が望遠鏡でお正月に撮影した馬頭星雲の写真です。私のスマホの着信画面にしています。

英国医学研究会議MRCの分子生物学研究所LMBの動画視聴のおすすめです。

英国CambridgeにあるMRC LMB (英国医学研究会議  分子生物学研究所)のセミナーがZoomで公開されている場合は、なるたけ視聴するようにしています。
11月20日には、次のようなセミナーがあるそうです。

Zoomでだれでも見ることができるので、生命科学に興味のある方はご覧になることをすすめます。

また、先日開催された科学者でない一般向けのLMBセミナーもYouTubeで公開されています。バクテリアのバイオフィルムについての講演です。面白そうですね。私もこの講演は見逃していました。


YouTubeではこちらから見ることができます。
Bacterial Biofilm: The Death Star of Human Infection by Tanmay Bharat
https://youtu.be/fxC4E6sAGAo?si=X1_G-qMnhO4HNI9b

糖蛋白質や糖脂質についている糖鎖が見えるようになったというすごい論文がでています。

糖鎖はタンパク質や脂質、RNAなどに結合して、糖タンパク質、糖脂質、glycoRNAなどの複合糖質となって生体内で働いています。糖鎖はDNA/RNA、タンパク質にならぶ生命の第三の鎖ともよばれる重要な生体分子です。その糖鎖の配列を決定するのは今まで困難だったのですが、最近は質量分析法と糖鎖を切断する酵素などを組み合わせて、配列決定がしだいにスピードアップするようになってきました。先日有名な科学雑誌のScienceに掲載された次の論文は、Electrospray Ion Beam Deposition Scanning Tunneling Microscopy (ESIBD-STM) という、Electron spray方式の質量分析法とscanning tunneling microscopy(走査型トンネル顕微鏡)を組み合わせた新開発の手法で、糖脂質(ガングリオシドなど)や糖蛋白質(ヒトの腸で微生物と相互作用している重要な糖蛋白質であるムチンなど)に付加されている糖鎖を世界ではじめて脂質部分やタンパク質部分と同時に可視化できたというものです。
Kelvin Anggara et al.,
Direct observation of glycans bonded to proteins and lipids at the single-molecule level.
Science382,219-223(2023).DOI:10.1126/science.adh3856
https://www.science.org/doi/10.1126/science.adh3856

このScienceの論文はPay Wallの向うにあるので契約している機関やお金を払ってしか読めませんが、PubMed Centralにのっている原稿は誰でも読むことができます。
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7615228/
また上にリンクをはったScienceのサイトにあるsupplementary materialsのpdfは誰でもダウンロードできますのでご覧ください。

糖鎖はこんな風に見えるそうです。本文の図2を引用しておきます。図はCC BY 4.0のcreative common ライセンスで利用できるとのことです。

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7615228/figure/F2/
An external file that holds a picture, illustration, etc. Object name is EMS189541-f002.jpg

こちらから図を順に見ることができます。ムチンについている糖鎖の写真に圧倒されます。
こちらは図3でN型糖鎖の可視化です。
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7615228/figure/F3/
次はO型糖鎖の典型、ムチンの糖鎖の図4です。
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7615228/figure/F4/

図1は顕微鏡の原理と糖ペプチドやグリコサミノグリカン(GAG)の糖鎖の可視化例です。
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7615228/figure/F1/

Mac向けに書かれたバイオインフォマティクス本でよく使われるHomeBrewはUbuntuその他のLinuxにもインストールできます。HomebrewはMacユーザーの特権ではなく、今やLinuxやWindows WSLでも使えるというお話です。

バイオインフォマティクスの日本語でかかれたハウツー本の多くは坊農先生のもので代表されるようにMacを使って解析するものです。私はLC520あたりまではマックを使っていたのですが、新しいモデルがでたときにそれまで購入していたソフトが動かないことがわかったのと(そういうことは決してないので安心してくれというふれこみの広告をみて買ったのでしたが、見事に裏切られました)、価格がべらぼうに高くなっていったのでMacは購入しなくなりました。ただiPod系列のiPadとかiPhoneとかは便利に使っています。しかしこのところiPhoneがべらぼうに高額になってきていて、またぞろAppleの悪い癖がでてきたように思います。コストパフォーマンスを考えるともはやiPhoneは選択肢に入らなくなってしまいました。奥さんもアンドロイドに機種変更して使い始めています。

話がそれましたがMacでバイオインフォマティクスする本をLinuxを使っている私たちが読み進める時の一番の障壁は、ソフトのインストールの時に使うパッケージ管理システムのHomebrewでした。昔はLinuxでHomebrewが使えなかったのでバイオインフォマティクスのソフトウエアを、Macを使う教科書に書いてあるようにはインストールできません。結局、各ソフトのホームページにいってLinux用のソフトのインストール方法を英語で読んで、必要ならmakeしてバイナリをこしらえなくてはならなかったのです。大変不便でした。しかし2019年2月ごろからLinuxでHomebrewが動くようになっているので、自分の使っているLinuxのディストリビューションに応じた方法でHomebrewをインストールしておけば、Macをつかうバイオインフォマティクスの教科書どおりに必要なソフトをインストールして読み進めることができます。Homebrewでインストールできるのは、別にバイオインフォマティクスのソフトウエアだけではないので、Macのように簡単にソフトがインストールできるLinux用のHomebrewは役立ちます。もちろんWindowsのWLSで動くLinuxにもインストールできます。

インストールの仕方はこちらの日本語解説

LinuxにHomebrewを導入

などを参考にするとよいでしょう。
https://scribble.washo3.com/linux-homebrew.html
コマンドラインでインストールをはじめると、いろいろ指示が表示されるのでそれを見ながら、上のサイトの日本語解説と照らし合わせながらインストールするのが簡単です。UbuntuのAPTパッケージマネージャーをつかうより簡単にインストールできることも多いし、インストールできるソフトがより新しいバージョンである場合も多いので使えると思います。是非インストールして使ってみてください。

nitterでtwitter (X)のアカウント主がフォローしているアカウントを表示する方法があります。

今日は快晴でしたが暑かったです。夏日で室内でも27度もありました。外では日差しが刺すようで、もっと温度が上がっていました。さっき38年ぶりに阪神が日本シリーズで優勝したそうで、大阪も一番熱い夜をむかえていますね!

さて、今日はnitterの話です。twitterがXになって、ログインしなくてはツイートが見られなくなりました。お気に入りのアカウントを普通のtwitterのアカウント名で見ようとすると、なにやら古いツイートのオンパレードになっています。
たとえば奥村先生のサイトをみようとするとこんなありさまです。
https://twitter.com/h_okumura

以前twitterがみられなくなったとき、マスクがしばらくしたら見られるようにもどすとかいっていたのですが守られていませんね。それでnitterを使っているのですが、どのサイトでnitterをみるかによってフォローしているアカウントを表示することができるfollowingボタンが動いたり、動かなかったりするということに今日気付きました。

どのnitterの提供サイト(インスタンス instance)が動いているかはこちらで確認できます。
Nitter Instance Uptime & Healthというサイトです。
https://status.d420.de/
表示される画面の上の部分のスクリーンショットを載せておきます。動いている国が国旗で示されていてグリーンの棒がならんでいるのが正常稼働していることを示しています。応答時間なども表示できるので、一番したのチェックボックスを押して表示させてみました。

ではノーベル化学賞を受賞した糖鎖生物学者のベルトジさんのtweetをnitterでみてみましょう。
https://twitter.com/CarolynBertozziが本家ですので、twitter.comの部分を上のサイトにあるnitterアドレスに変更します。
たとえばhttps://twitter.com/CarolynBertozzi
https://nitter.uni-sonia.com/CarolynBertozziとか
https://nitter.d420.de/CarolynBertozzi
https://nitter.privacydev.net/CarolynBertozziとかに変更するわけです。

こうしてアクセスしてみると、followingの部分をクリックしてフォローしているツイッター(X)アカウントが見られるinstanceとみられないインスタンスがあることがわかります。
https://nitter.privacydev.net/CarolynBertozzi/following
ではみられますが、
https://nitter.d420.de/CarolynBertozziではみられません。
サイトの設定に依存しているのだと思いますが、いますこしやってみたところでは、nitter.privacydev.netだけfollowingしているアカウントがみられるようです。なお今試したところ、このインスタンスはアクセスするとルートエラーが出ることがあります。ブラウザの再読み込みボタンを何回か押しているとつながるのがわかりました。followingで表示されるアカウントがフォローしているアカウントをみるといろいろ知らなかったアカウントがわかるので、情報収集に役立ててください。

あと、今試していてわかったのですが、ベルトジさんのhttps://twitter.com/CarolynBertozziが本家Xのurlで、このサイトでは奥村先生のサイトのように過去のツイートが表示されることはないようです。最新のツイートが表示されていました。ただ他のUSAのアカウントをみてみると、最新のツイートが表示されないアカウントもあるので、どういう基準でこんなことになっているのかはわかりません。

材料科学向けの機械学習の入門動画が慶応大学から公開されていました。おすすめの講義です。

慶応大学は「基礎科学チュートリアル」という講義シリーズをはじめているそうです。その一つとして、材料科学の機械学習についての講習会を次のように行っており、第一回が先日実施されたようです。https://www.kll.keio.ac.jp/ktm/pre/500/
リンクをご覧になるとわかるように、機械学習を材料科学に応用する方法を講義と実習をつかって紹介する企画です。最初に講義プラス演習があり、Google Colaboratoryをつかって実習する様子がみられます。YouTube動画では資料のリンクがないようなのでお話になりますが、機械学習をまったく知らないひとでも動画をみたあとは、感じがわかるようになるよい入門動画になっていると思います。一度ご覧ください。中級編は数日後に開催されるようで、無料ですので興味のあるかたは登録されると実習ができると思います。
以下は初級編のYouTubeの動画についていた説明の引用になります。

「Pre- KEIO TECHNO-MALL 2023(第1回)「基礎科学チュートリアル: すぐできるマテリアルズ・インフォマティクス ~材料×機械学習の融合~」Day1
2023年10月24日(火)に開催しました。
KEIO TECHNO-MALL 2023(第24回慶應科学技術展)の開催に先立つプレイベント1回目のアーカイブです。
概要:材料の情報(分子種や合成条件など)を入力することで、材料の性質を出力する「モデル」が出来れば、未実験の材料の性質の予測―つまりコンピュータ内でのハイスループットスクリーニングーが可能になります。このような材料に関する「モデル」を機械学習を用いて作成し、材料の発掘や設計に活かす研究分野をマテリアルズ・インフォマティクス(MI)と言います。本チュートリアルでは、化学系・材料系の研究者を対象に、機械学習の基礎から材料化学への適用法について、講義と演習を通して概説しました。本動画はDay1(初級編)の様子です。実際にMIを活用した材料開発を推進している先生からもご講演をいただきました。」
https://youtu.be/KxnKXBeWSjY?si=JZgmLxTfUK4BPOsh

よい講義というのは、その講義をきいたあと展望がひらけてその講義テーマを独学できるようになるものだと、私は思っています。この動画もそうしたよい講義だと思います。

ジュール・ヴェルヌの代表作『海底二万里』の話

今日は海底二万里の話です。国立国会図書館のツイートにジュール・ヴェルヌの代表作『海底二万里』の挿絵入り英訳本の紹介がありました。


海底二万里は私が小学生のころ夢中になって読んだ本です。多分子供向けに書き直された本を読んだと思いますが、とても面白い本でした。最後の場面で、大渦巻の中にまきこまれたネモ船長の潜水艦ノーチラス号がどうなったのかが知りたかったのを思い出します。ネモ船長はこの後、「神秘の島」にも登場しますので無事にこの大渦巻を切り抜けたのだとわかります。私の子供が、小学生のときに神秘の島の完訳本を読んでいて教えてくれました。上のツイートにある月報は以下からダウンロードできます。記事の中にネモ船長の「神秘の島」での再登場についても書かれているとおりです。

https://dl.ndl.go.jp/view/download/digidepo_13046053_po_geppo2311.pdf?contentNo=1#page=3
こちらから国立国会図書館月報2023年11月号がダウンロードできます。
この月報で初めて知ったのですが、ヴェルヌの海底二万里には、ネモ船長のノーチラス号がアトランティスの遺跡を訪れる場面があるんですね。この作品が、プラトンの書き残しているアトランティスの話に人々の興味を惹きつけてその後のアトランティスブームを巻き起こしたのだそうです。英訳本はタイトルが月報にあるので、Internet Archiveで探してみました。
こちらが月報にある本にあたるとおもわれます。ダウンロード可能です。
https://archive.org/details/twenty-thousand-leagues-under-the-seas/page/n3/mode/2up
海底二万里は、映画化もされていてYouTubeで見ることができます。最初のディズニー版と1997年版どちらもYouTubeにありました。興味のある人はTwenty thousand leagues under the seasというphraseで検索してみてください。結末はずいぶん原作とはちがうのがわかると思います。

写真は英訳本の挿絵をスクショしたもの2枚です。