タンパク質配列解析方法の革命となると思われる新技術がNatureで発表されました!

今までタンパク質のアミノ酸配列を決定する方法としては Edman 分解や質量分析法を使うのが定番でした。DNAの塩基配列の決定法に革命をおこしたナノポアシークエンス法が、ついにタンパク質のアミノ酸配列の決定に実用的に使えるようになってきたという論文が9月19日号の雑誌Natureに掲載されました。巧みな方法でタンパク質の3次元構造を巻き戻して一次元の構造になったタンパク質鎖をナノポアに通して2アミノ酸単位でナノポアを通過していくときの電位変化からアミノ酸を決定するという手法です。リン酸化や糖鎖付加の位置も検出できるようで、これが製品化されればまさに革命的だと思われます。論文はオープンアクセスになっているので、誰でも読めますしダウンロードもできます。
Motone, K., Kontogiorgos-Heintz, D., Wee, J. et al.
Multi-pass, single-molecule nanopore reading of long protein strands. Nature 633, 662–669 (2024). https://doi.org/10.1038/s41586-024-07935-7
筆頭著者は大阪大学の
元根 啓佑先生 (工学研究科 附属フューチャーイノベーションセンター,助教、若手卓越教員(PI))ですね!今もこの研究を発展させておられるようで今後の発展に目が離せません。

 
論文はこちらです。

https://www.nature.com/articles/s41586-024-07935-7

この論文を著者たちが解説している動画がYouTubeにあるので論文を読む前に動画を見ることをお薦めします。

9月22日はマイケル・ファラデーの誕生日です!

今日9月22日はマイケル・ファラデー(Michael Faraday)の誕生日にあたります(1791年生まれ)。
科学版の「今日は何の日」のサイト Today in Science Historyにでているので興味のある方はご覧ください。
https://www.todayinsci.com/9/9_22.htm
このサイト  https://todayinsci.com/は昔このブログで紹介したことがあります。 日を指定するとその日に生まれた科学者がわかります。また科学者の有名な言葉も調べることができるようになっています。
Faradayの有名な言葉として You will soon be able to tax it! というのがあります。ファラデーの実験についての説明を聞いた政治家が、それが何の役に立つのかと聞いたとき、ファラデーが『すぐにそれに税金をかけられるようになりますよ!』と答えたというエピソードで引用される言葉です。これはファラデーの書いたものにはない言葉で、こちらのサイトによると、
W.E.H. Lecky の Democracy and Liberty という本の序文にある次の文章で初めて世にでた言葉だそうです。この本の序文のGladstoneという政治家について語っている部分にある次の文章由来の言葉だそうです。
There were, it is true, wide tracts of knowledge with which he (Gladstoneのことです) had no sympathy. The whole great field of modem scientific discovery seemed out of his range. An intimate friend of Faraday once described to me how, when Faraday was endeavouring to explain to Gladstone and several others an important new discovery in science Gladstone’s only commentary was ” but, after all, what use is it ? “
‘Why, sir,’ replied Faraday,
‘ there is every probability that you will soon be able to tax it ! ‘
この序文はInternet Archiveで読めます。以下のリンクをご覧ください。ダウンロードも可能です。
Introduction to Democracy and Liberty
by Lecky, William Edward Hartpole, 1838-1903
https://archive.org/details/cu31924024864617

この文によると、科学における重要な新発見をGladstoneに説明しようとしていたとあるだけでそれが電気関係の発見なのか、電気分解の発見なのかあるいいは他の発見なのかについては全くわかりません。またGladstoneはファラデーの存命のときには首相ではなかったので、よく首相がたずねたという風に書いてあるものは間違いということになります。

ファラデーについてはロウソクの化学をはじめとするさまざまな本がネットでよめるので、このブログの過去記事を「ファラデー」や「Faraday」などのキーワードで検索してみてください。ファラデーの実験日記とか、書簡集とかいろんな本がダウンロードできることを紹介しています。

例えばこんな記事です。

マイケル・ファラデーの著作集がダウンロードできます―Faradayの日記(Faraday’s Diary)も全巻公開されました!

ファラデーの実験日記のダウンロードリンクも貼っておきます。全5巻 3272ページのpdfがダウンロードできます。
https://archive.org/details/diary182061/Diary%201820-61/

最後に国立国会図書館のデジタルコレクションでもファラデー関係の本がいろいろ読めます。たとえばこちらから検索してみてください。
https://ndlsearch.ndl.go.jp/search?cs=bib&display=panel&from=0&size=20&sort=published:desc&keyword=%E3%83%95%E3%82%A1%E3%83%A9%E3%83%87%E3%83%BC&f-ht=internet&f-mt=dtbook

Pythonで量子化学計算

Pythonで量子化学の計算をする方法を紹介しているサイトがあります。ラボコードというサイト(LabCode) にある記事です。
【PySCF】Pythonで始める量子化学計算【一点計算】
https://labo-code.com/python/quantum-chemical-calculation/pyscf-sp/
この最初の記事からはじめてみてはいかがでしょうか。私もやってみたいと思います。
現在のところ以下のリンクにあるように、全部で6つの記事があります。
https://labo-code.com/python/quantum-chemical-calculation/

PySCFというpythonモジュールを使って量子化学計算をする方法が詳しく解説されています。
PySCFはオープンソースの量子化学計算用モジュールで、https://pyscf.org/に詳しい説明があります。pySCFの他にPsi4というのもあるそうです。こちらはこれを使った量子化学入門書がでています。
『Pythonで動かして始める量子化学計算』
野田 秀俊 公益財団法人微生物化学研究会 D.Sc. 著(コロナ社)
https://www.coronasha.co.jp/np/isbn/9784339066685/

ロバート・フックの顕微鏡図譜Micrographiaについての動画が面白かったので紹介します。

YouTubeをみていたらロバート・フックのMicrographia (顕微鏡図譜)についての動画をみつけました。
Hooke’s Micrographia
MITx Videos MITの材料科学のLorna Gibson教授による動画です。
https://youtu.be/fu3qH7xpSgE?si=lM_zbP0EbCgt5bni

絹やコルク、のみや昆虫の複眼の観察結果を現代の走査電子顕微鏡の画像と比較していますが、驚くほど似ています。フックのものすごい観察力に感動します。
次の動画も面白いです。
Freaky Micrographia – Objectivity 43
https://youtu.be/SvWSNEO8aww?si=FpQDWIay30jnpSxY

こちらの動画は、Micrographiaの実物を手に取って紹介しています。結構大きな本です。またこの動画の最初にニュートンの毛髪の入った箱を開けて見せてくれています。ニュートンの毛髪なんていうものが残されているのは初めて知りました。
また世界で初めて生きたバクテリアを観察したレーウェンフックの本や手稿もみせてくれます。

フックの本はインターネットで無料でダウンロードできます。それについての以前の記事はこちらです。

無料の電子書籍 free eBooksをProject Gutenbergで探してみよう!

Micrographiaの本のダウンロードリンクはこちらになります。
https://www.gutenberg.org/ebooks/15491
私はKindleバージョンをダウンロードしてiPadに入れて読んでいます。やり方は簡単で、こちらのページを開いて、ダウンロードしたepub型式のファイルをドラッグアンドドロップするだけです。
https://www.amazon.co.jp/sendtokindle

機械学習で起こる致命的エラーを防ぐための本が公開されています。

Interpretable Machine Learning
A Guide for Making Black Box Models Explainable
という機械学習を使うときに知っていた方がよい大事な注意点に焦点を当てた本の翻訳版がネット上で公開されています。2021年公開ですので初版の翻訳になっていると思われます。
https://hacarus.github.io/interpretable-ml-book-ja/

原本は第二版がこちらに同じく公開されています。
https://christophm.github.io/interpretable-ml-book/
pdf版などは有料ですがオンライン版は無料で読めます。またこの本にでてくるコードはこちらにあつめられているので自分で動かしながら読めるようになっているのも魅力的ですね。
https://github.com/PacktPublishing/Interpretable-Machine-Learning-with-Python-2E

とりあえず初版の最初の物語の部分を日本語版で読んでみるとよいと思います。
https://hacarus.github.io/interpretable-ml-book-ja/storytime.html
機械学習の結果が、思わぬ事故を引き起こす話は必読です。単なるブラックボックスとしてAIを使う危険性がよくわかる話になっています。

複雑系科学の入門動画が昨日公開されました。

複雑系の科学で有名なSanta Fe Institute (サンタフェ研究所)の所長David C. Krakauerさんの講演動画がYouTubeで公開されました。
彼が書いた本The Complex Worldが9月16日に出版されたのを記念して開催された一般向け講演会の第一部です。第二部は明日公開予定だそうです。

本についてはこちらをご覧ください。
https://www.santafe.edu/news-center/news/sfi-press-announces-the-complex-world
SFI Press announces “The Complex World”
この本はまだペーパーバック版しか出ていなくてebookは年末にでるようです。

動画はこちらです。
Part One: Complex World
https://www.youtube.com/live/Jow0vVEOdrk?si=oUVmAyXb6erYvng6

複雑系の科学の勃興から現代に至る歴史をたどりながら、今後の複雑系科学を展望する講演です。
ダーウインの進化論、エントロピー、バベッジの解析機関と彼の協力者エイダが書いた世界初のプログラムなどもスライドでみせてくれます。The Complex Worldは、複雑系科学の入門書としてよい本のようでこの動画をみたら読みたくなりますね。

昔よくみかけた東京図書の数学新書シリーズの多くが国立国会図書館デジタルコレクションで読めます。

今日は旧暦の8月15日、中秋の名月の日だそうです。福岡でも秋の空が澄みわたり、きれいな月がかかっています。月のすぐそばには土星が光っています。
さて今日の記事です。
このブログでは国立国会図書館デジタルコレクションの個人送信資料でオンラインで読める本をいろいろ紹介しています。今日は東京図書から昔でていた数学の解説書シリーズ、数学新書を紹介します。このシリーズは主にソ連の数学の解説書を翻訳しているシリーズでした。国立国会図書館で検索すると多数の本がヒットしますが、残念なことに数学新書84などと表示されるだけでタイトルが一覧できません(ちなみに、この本は「十四人の数学者―微積分の創造」という数学史の本です)。それでどんな本があるのかがとてもわかりにくいのです。幸い、こちらのブログに数学新書のタイトルをまとめてくださっています。
『 『数学新書 1-100』、東京図書、1960-1972』
http://blog.livedoor.jp/dan4423/archives/5521677.html
いろいろ面白そうなタイトルがあるので個人送信資料で読めるかどうか、チェックしてみてください。たとえばこんな本が読めます。

E.T. ベル著、田中勇・銀林浩訳、『数学をつくった人びと(I-IV)』、東京図書 1962-1966 数学新書 28-31
森毅著、『積分論入門』、東京図書 1968.3 数学新書 70
『数学新書』第70,東京図書,1968. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/1371438 (参照 2024-09-17)
フレイマン著、松野武・山崎昇訳、『71十四人の数学者 : 微積分の創造』、東京図書 1969 数学新書 84
『数学新書 複素数とベクトル』第58,東京図書,1966. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/1371429 (参照 2024-09-17)

ただこのブログに掲載されている100冊が全部個人送信サービスで読めるわけではないので注意してください。読めない本もありました。

似た立体構造のタンパク質をFoldseekで探してみよう!

昨日紹介したAlphaFold DatabaseでのFoldseekの使い方をスクショを交えて説明してみます。
こちらをクリックしてみてください。https://alphafold.ebi.ac.uk/entry/P06620

人工雪を作るときの核になるバクテリアがもっているタンパク質InaZのサイトのurlで、クリックして開くのがこんなページです。

下の方に立体構造が3Dで表示されています。マウスで回転させたり拡大縮小表示したりできることを確認してください。
もっと下の方に画面をスクロールすると、Foldseekの結果が表示されているのがわかります。

Similar structuresという部分を見てください。PDBに登録されているものでヒットは0です(PDB structures (0)と表示されている部分)が、右のAFDB50 structures  (367)とある部分をクリックすると367個のヒットを見ることができます。

この図では、7個のヒットが表示されています。表になっていますが一番右の列Align in 3DがInaZとヒットしたタンパク質を重ねて立体表示するためのスイッチです。-になっているのは表示されていない状態を示します。クリックしてやるとクリックしたタンパク質がInaZの立体構造に重ねて表示されます。

前の図と較べると、チェックが入っているタンパク質の立体構造が並べて表示されているのがわかります。複数の行でクリックすると、クリックしたタンパク質が全部アラインして表示されます。右下のAligned in 3Dの部分の下をみると、タンパク質のIDの右にRMSD (root mean square deviation)が表示されており、この例では、24.64Åとなっています。RMSDの値が低いほどよくアラインしていることを示します。

では昨日書いたストレスタンパク質をInaZにアライメントしてみましょう。

右上のバネのように巻いている部分にアラインしているのがわかります。RMSD値は低いですね。


緑のバネのような部分がStress Proteinです。InaZはこの部分では青になっています。
もっと拡大して、一部分にカーソルを当ててみましょう。

矢印のカーソルの部分が赤く囲まれています。この部分の説明が右下にでています。マウスカーソルの矢印が当たっている部分のアミノ酸はイソロイシン(アミノ酸の略号がILE)で240番目のアミノ酸であることがわかります。

以上のような要領で、自分の好きなタンパク質を表示して遊んでみてください。もちろんアライメントの座標などもダウンロードすることができます。

FoldseekがAlphaFoldデータベースに組み込まれました!類似の立体構造を持つタンパク質が一発で探せます。

自分が研究しているタンパク質の立体構造をAlphaFoldで推定します。推定結果がでたら次にやってみたいことは、その立体構造と似たタンパク質がないか調べることではないでしょうか。PSI-BLASTなどの相同性検索でアミノ酸配列レベルではあまり似ていないのに立体構造が似ているタンパク質を探すのが今まで行われていた一つの方法です。今回、なんとAlphaFold DataBase (AFDB: AlphaFold Protein Structure Database https://alphafold.ebi.ac.uk/ )に、
推定された立体構造をもとに類似の立体構造を探索する有名なプログラムFoldseekが組み込まれたと発表されました。これはすごいことで、今私の興味があるタンパク質でやってみたところ、衝撃的な類似がみつかりました。

Foldseekは開発者のサーバーにいってpdbファイルをアップロードして使うか、
https://search.foldseek.com/search
Uniprotから使うなどの方法で利用できたのですが、
https://qiita.com/Ag_smith/items/63799b3beaa07c3990fe
AFDBに一本化されたのは画期的です。AFDBでタンパク質を表示させると似た構造の一覧が自動で下の方に列挙されると思います。列挙されなければ類似構造を探すボタンがあるのでそれを押してみてください。
皆さんも一度使ってみてください。思わぬ類似がみつかるといいですね!

試してみるタンパク質が思いつかないという方は、例えば昔このブログで紹介した、雪の結晶の種になるタンパク質inaZを試してみてはどうでしょう?

ブラウザで分子を立体表示する方法の紹介。

こちらのリンクに AFDBのIce nucleation protein inaZのページがあります。
https://alphafold.ebi.ac.uk/entry/P06620
このページの下の方にFoldseekの結果へのリンクがあるはずですのでご覧ください。なければボタンを押したらFoldseekが動いて数分後には結果が表示されます。
AlphaFoldで予測したタンパク質の中にはFoldseekでヒットする、他の細菌のice nucleation proteinがいっぱいあります。
しかしあとの方を見ていくと、思いがけない分子、たとえばStress protein DDR48 などというタンパク質が驚くほど似た立体構造(部分的に似ている)をもっているのがわかってFoldseekのすごさを実感できます。詳しいやりかたは明日、スクショを含めた記事を書きますのでそちらをご覧ください。

昔からの定番教科書の改訂版がでていますね。しかしちょっと値段が高すぎます!

今日、発生生物学の教科書の定番 Scott Gilbert他著のDevelopmental Biologyの第13版が去年出版されている知りました。Amazonでみかけたのですが、なんと値段が37449円! しかし日本のOxford University Pressから買うと45396円なのでAmazonで買う方が安いです。Kindle版のEnhanced E-Bookというのは14920円となっています。Developmental Biology XE (English Edition) Kindle版で検索して「サンプルを読む」の部分をクリックすると、今回の版でどんな新しい内容が追加されたかの一覧がみられます。結構いろいろ進歩しているのがわかると思います。でもKidle版で動画などみられましたっけ?

発生生物学を勉強している学生さんには、以前の版(第10版)の日本語訳がでているのでそちらを読むのをおすすめします。日本語版翻訳時に最新情報が追加されているので英語の第10版より内容は翻訳書のほうが新しいです。こういう基本教科書はまず日本語版で読んで、基本的な用語や概念を理解するという読み方をおすすめします。学部生や一般の方は、第13版は図書館で借りて読んだり、先生に買ってもらったりして読むとよいのではないでしょうか。医学系や生命科学系の院生や研究者の人は、電子ブックを買うとよいでしょう。

また、有名な生化学の教科書StryerのBiochemistryも第10版がでていました。Amazonで17298円という値段で高いですね。生化学の教科書については私は以前紹介した次の本がよいと思います。日本生化学会おすすめの教科書です。学部生は翻訳版を買って勉強しましょう!

ミースフェルド生化学の第二版(英語版)を買ってみました。