PymolをUbuntu にインストールして使おう!

日替わりリンクなどのページのほうに簡単に書いたUbuntu (Linuxのもっとも普及しているディストリビューション)への分子グラフィックスソフトPyMOLのインストール法をまとめておきます。写真はPymolで表示したInaZというバクテリアのタンパク質の立体構造(AlphaFold2による予測構造)です。驚くような不思議な構造をしていますね!
https://alphafold.ebi.ac.uk/files/AF-P06620-F1-model_v2.pdbからInaZタンパク質の立体構造情報が記述されているpdbファイルをダウンロードして、PyMOLの画面(一番下の写真)にドラッグアンドドロップすれば表示されます。タンパク質を立体的に表示することができて、自由に拡大、回転、反転もできます。さらに立体構図の描画方法も様々に変化させて表示することができます。構造生物学には必須のソフトウエアです。

Ubuntu の最新版LTS20.04へのインストール法は簡単です。デスクトップ左端にあるAと書いてあるアイコン(Ubuntu Softwareという、Ubuntuでソフトウエアをインストールするときに使うツールのアイコンです)をクリックします。開いたウインドウで検索窓にpymolといれてエンターを押すとpymol-ossというソフトウエアがヒットします(下の写真)。
上の写真ではインストール済みとなっていますが、初めてのインストール時には、インストールボタンが表示されているので、それを押すとインストールが始まります。インストール中と表示されて、インストールの進み具合がインストール中24%などと表示され、100%になると、権限の設定画面がでます。デフォルトでチェックが入っていない、USB上のファイルの読み書きを許可すると言う英語の表示にもチェックをつけて、閉じるボタンを押したらおしまいです。ソフトを起動すると以下のような画面になります。

この画面に立体構造を表示したいpdfファイルをドラッグアンドドロップすればただちに立体構造が表示されます。これでPyMOLが使えるようになりました。この後は、東京大学の森脇 由隆先生のpymol bookを読むといいでしょう。日本語でほんとうに丁寧に説明されていますし、ページ右上のprinterのアイコンを押せば印刷もできます。そのときプリンタをpdf printerに指定すればpdf版の本もできます。

一週間分の日替わりリンクなどを掲載しておきます。

元旦から毎日更新の固定ページをつくりました。まだご存知ない方が多いようなので、一週間分の掲載内容をトップページにもまとめておきます。庭の水仙が咲きだしました。

2022/1/8
NHKでシャーロック・ホームズのドラマを毎週みています。オンラインで日本語でシャーロック・ホームズの日本語訳を読めるのはここがよさそうです。https://221b.jp/


2022/1/7
機械学習の教科書の紹介です。 Dive into Deep Learning (Dが二つ続くのでD2Lと省略して紹介されることも多い本です)という教科書で、スタンフォード大、マサチューセッツ工科大、ハーバード大、ケンブリッジ大など世界の300の大学で採用されている教科書だそうです。Jupyter notebookで手を動かしながら学んでいくというスタンスの教科書で評価の高いものだそうです。
https://github.com/d2l-ai/d2l-enのサイトにある、Book Websiteをクリックして開くページで、MXNetやPyTorch, Notebooks,Coursesなどとあるタブの最初のMXNetをクリックするとpdf版がダウンロードできます。Coursesをクリックすると授業のシラバスやスライドなども見られます。最初のほうの日本語訳もできているようでここから見られます
2022/1/6
ものすごい図鑑 NHKのサイト
これは子供だけでなく大人も楽しめるデジタル昆虫図鑑です。
カブトムシ、モンシロチョウ、ハンミョウ、キリギリス、ノコギリクワガタなど、いろんな虫を画面上で回転、拡大、縮小して立体的に観察することができます。複眼の電子顕微鏡写真もあったりして、楽しいサイトです。お子さんと一緒にどうぞ。
2022/1/5
動画編集にはどんなソフトを使っていますか?以前、Scientific Americanという雑誌をパラパラみていたら、DaVinci Resolve  17という動画編集ソフトの広告がでていて、ハリウッドで使われているソフトで、なんと無料で利用できるとありました。Blackmagic Design Pty. Ltd.社の製品ですが最近日本語のリファレンスマニュアルが無料で公開されているのを知りました。チュートリアルとかも充実しているので時間のある方は試してみるのもいいと思います。Windows, Mac-OSX, Linux対応のソフトです。HDビデオの編集程度ならさほど高スペックなコンピュータはいらないもようです。
2022/1/4
Juliaというプログラミング言語が注目を集めています。前もちょっと紹介しましたが、Pythonより早くて使いやすいそうです。Juliaをつかったデータサイエンスの入門書(英語)が以下に公開されています。興味のある方はご覧ください。

Introduction to Datascience: Learn Julia Programming, Math & Datascience from Scratch

2022/1/3
今日は、わかりやすい量子化学計算の解説ページを紹介しておきます。元旦に紹介した「ノーコードではじめる機械学習」の著者である久我涼子さんのホームページで、pythonによるアプリケーション開発などの記事もあってきわめて参考になります。このブログの記事から生まれた本は

ゼロからわかる!! 独習 量子化学計算: 理論からはじめない新しい量子化学計算の本

というKindle本で、これは解りやすい本です(紙の本はありません)。またこちらのページには、tsujimotterさんこと辻順平さんによる、簡単な分子軌道法の入門解説記事があります。

2022/1/2
QDくんの過去ツイまとめ(機械学習、時系列分析、確率・統計に関する有益記事紹介)というtwitterの記事に有益なリンクがまとめられています。日本語字幕付きのハーバード大学コンピュータサイエンス入門講義の動画とか、いろいろありますので参考になります。
2022/1/1
機械学習に興味がある方へ
:プログラミングなしで機械学習が学べるOrange 3というのをご存知ですか?日本語の解説書としては「ノーコードではじめる機械学習」がよさそうです。Kindleなど電子書籍版と紙の本が最近発行されたばかりですが、買ってみる価値があると思います。YouTube動画を見るのも参考になります。
https://www.youtube.com/watch?v=HXjnDIgGDuI 

無料動画講座の紹介です―WordPressの使い方を知ろう

今日はクリスマスイブですね。雨が降っていますが、夜明け前に雪にはならないようです。暖かいです。今夜は多くの家にサンタさんが来ることと思います。メリークリスマス!
写真は10日ほど前に撮った前回紹介した、丘の上のイルミネーションです。昼間、散歩にいって丘の上のベンチに腰をおろしていると、近くでブーブーという鳴き声がして、あわてて丘を下りました。多分イノシシです‥‥。

さて、このブログはWordPressで作成しています。今私が勉強しているUdemyのWordPressの講座(「WordPress開発マスター講座」)の中に、無料でみられる「WordPressの使い方を知ろう―ボーナスレクチャー」というタイトルの動画(36本、トータルで3時間14分の動画)が公開されました。上のリンクをクリックして開くページで、「WordPressの使い方を知ろう―ボーナスレクチャー」の部分をクリックすると、動画の一覧がでてきますので、見たいものをプレビューのリンクをクリックして視聴できます。講師のたにぐち まこと(ともすた)先生はとてもわかりやすく上手に講義されるので、WordPressでブログを作ろうと思う方や、今作っている方に参考になると思います。

有料や無料の動画講座の紹介です

明日と明後日の19時から21時まで早稲田大学の早見先生による、PowerPointスライド作成実演ライブがYouTubeで開催されるそうです。面白そうなのでYouTubeで視聴されるとよいと思います。下の一つ目の動画は録画に替わっていますので、「ライブ配信準備中です」とでている部分をとばしてみれば11月20分の第一回目がみられます。

早見先生は「離散数学入門(グラフ理論の世界にようこそ)」という全14回の講義をYouTubeで公開されおり、とてもわかりやすいと評判です。グラフ理論は生命科学でも活用されている分野ですので興味のある方はご覧になるのをおすすめします。

今年になって知ったのですが、有料の講座にもいろいろ面白いものがあります。昔は定年になったら放送大学の講義を学ぶという方も多かったようですが、今では放送大学よりもっとわかりやすい有料講座や無料講座、無料講義がいろいろ公開されています。私も今年に入ってからUdemyという有料講座のコースをいろいろ購入して勉強をはじめました。こちらは定価は24000円のとか高い値段のコースが多いのですが頻繁にセールをやっていて、しばらく待っていると24000円のコースが1200円とか1600円とかで購入できる場合が多いです。時々サイトをチェックしてみて、安いときに購入するのがお勧めです。ちょうど今、ブラックマンデーセール(11月26日まで対象コースが1200円より)というのをやっていて、はじめるのには最適の時期だと思います。数学、RやRStudioを含む統計、Pythonなどのプログラミング、GitやGitHub、Docker入門講座もありますし、物理、化学、英語、フォトショップ、ヘルスやエクササイズの講座などなど、日本語の講座や英語の講座がいろいろありますので面白いです。Udemyのコースは修了期限がないので、安い値段のときに購入しておいてあとで時間ができたときに勉強することが可能です。コースの動画の一部が無料公開されているので、購入する前に、コースの動画を何本か視聴してみて、気に入れば購入するというのがいいと思います。

MRC LMBでのセミナー:DeepMindによるAIの科学への応用とAlphaFoldによるタンパク質立体構造予測についての講演会ビデオ公開のお知らせ

私が短期留学していたことがある英国CambridgeにあるMRC LMB (分子生物学研究所)ではコロナ下の現在、多くのセミナーをネットで公開しています。先日、10月13日午後10時半から夜中の1時まで(日本時間)、タンパク質の立体構造予測で有名なAlphaFoldの開発者John Jumperさんと、AlphaFoldや有名な碁の人工知能ソフトAlphaGOの開発元DeepMind社の創設者でCEOのDemis Hassabisさんの講演がライブでありました。今回の講演は、ライブ限定でネットでは公開しないということで眠いのを我慢して視聴していたのですが、本日YouTubeで2つの講演ともに公開されましたのでお知らせします。わかりやすい講演ですので是非ご覧ください。
どちらの講演もYouTubeの再生画面の下のほうにある字幕ボタンを押せば、英語字幕が自動生成されますので字幕オンでご覧になるのをおすすめします。日本語の講演の自動字幕生成機能はまだまだ使い物にならないことが多いですが、英語の講演の字幕自動生成機能は結構信頼性が高いです。

MRC LMBのYouTubeチャンネル(ここをクリック)にはその他の面白い動画もありますので、いろいろ探して視聴されるとよいと思います。

Kendrew Lecture 2021 pt1 – Using AI to accelerate scientific discovery – Demis Hassabis

Kendrew Lecture 2021 pt2 – Highly accurate protein structure prediction with AlphaFold – John Jumper

機械学習とかディープラーニングの学習のてびき

タンパク質の立体構造を予測するAIが生んだプログラムAlphaFold2は、AIの有効性を実感させてくれました。がぜんAIに対する興味がでてきたのですが、ディープラーニングとか機械学習とかの勉強にはこんな本はいかがでしょうか。
「高校数学からはじめるディープラーニング―初歩からわかる人工知能が働くしくみ」(講談社ブルーバックス。金丸隆志著)
私はAmazon Kindle版をポイント半額付加セールのときに買いました。Kindleは安売りがあるので紙の本よりいい時がありますね。内容はとてもわかりやすくておすすめの本だと思います。Excelのマクロもダウンロードできるようになっていて理解が深まるいい本です。

また統計やデータサイエンスの勉強には総務省統計局のサイト(先生向け)が面白そうです。小学校から中学、高校向けの教材、補助教材などがそろっていて、統計ではRの紹介もされています。高校向けの機械学習の補助教材の部分にある教科書とそれに付随するPythonコードは、Google Colaboratoryのジュピター・ノートブックの環境で実行することにより動作しますと書かれていて、結構本格的な教材のようです。内容には。線形回帰、サポートベクターマシン、決定木・ランダムフォレスト、ニューラルネットワーク、ナイーブベイズ法、K近傍法、因子分析、主成分分析、クラスター分析、アソシエーション分析が含まれており、教材、データなどが自由にダウンロードして使えます。

左の写真はお盆のころに山際に咲いていた百合の花です。今は右の写真のように種ができています。

Mathematicaの紹介です!

ヒマワリもアサガオもそろそろ花の数が減ってきて秋を感じさせる毎日です。さて今日はMathematicaの紹介です。MathematicaはStephen Wolframという人が開発した有料ソフトで数値計算と数式処理ができますし、最近では画像や音声、信号処理、機械学習、統計解析、バイオインフォマティクスなど広範囲で利用されています。Pythonなどのプログラミング言語に比べてプログラムが格段に簡単で、自然言語での入力も可能になるなど科学の研究、学習には必須といってよいソフトでしょう。先日、微分方程式の解き方の講演があったのでオンライン参加してみました。講師の丸山 耕司先生は理論物理(御専門は量子情報、量子制御理論など)出身の方で、Wolfram社のブログなどの他、雑誌「数理科学」に寄稿されたり、「動かして学ぶ量子コンピュータプログラミング」(O’Reilly Japan)という本の監修、そして量子力学の定番教科書サクライの現代の量子力学 第2版(最近原書の第3版がでています)の問題解説(演習 現代の量子力学 第2版 J.J.サクライの問題解説)(吉岡書店)の著者の方でした。微分方程式の解き方の基本のキから学べる講義でしたので、以下のリンクから無料登録して講演をご覧になるのをお勧めします(2021/10/31までの期間限定での公開ですので注意してください)https://www.bigmarker.com/series/solving-differentialequations-ja/series_details?utm_bmcr_source=twitterまたWolfram Japanのtwitterにこの講義の他、Mathematicaによる微分積分学入門など関連したいろいろな情報がでているので参考にしてください。リンクはこちらです。
https://twitter.com/WolframJapan

MathematicaはWolfram言語というプログラミング言語で動くソフトです。Wolfram言語は、日常言語とかわらない命令もうけつけるように設計されていて、プログラミング初心者にもきわめてやさしい、そして短いコードで、高度なプログラムが書けるすぐれたソフトウエアです。Wolfram言語の入門書としては開発者のWolframの書いたAn Elementary Introduction to the Wolfram Language 第2版がおすすめです。この開発者自身が書いたWolfram 言語(Mathematicaで使われているプログラム言語)の解説本は以下のリンクで無料で読める他、オンラインでWolfram 言語を使って学習できるので興味のある方は下のリンクにアクセスしてみてください。
https://www.wolfram.com/language/elementary-introduction/2nd-ed/

癌の糖鎖生物学―NIH videocastの紹介です

秋が深まってきたようで、近所では稲刈りの真っ最中です。今日からこのブログのスタイルをちょっと変更して、短い記事をこまめに投稿していこうと思います。長い記事は書くのに時間がかかるので、こちらは今までと同じ頻度になると思います。

いつも紹介しているNIHのvideo castのサイトに今月(2021年)9月16日と9月17日にわたって開催されたGlycobiology of Cancerという講演会の動画リンクがアップロードされています。初日の16日の分がこちら2日目の17日の分がこちらにありますので画面左下の+Moreの部分をクリックして開く画面で、Downloadのボタンをクリックしてダウンロードしてご覧ください。画質はビットレートで、1240k、1440k、1840kの三種類が選べます。ダウンロードした動画は、f4vファイルという形式で作成されており、1840kの場合は2ギガちょっとのサイズですのでダウンロード先の空き容量を確かめてからダウンロードしてください。f4vファイルはMPC-HCなどの無料版動画プレーヤーで再生できます。英語がちょっとと思われる方は同じDownload画面に、スクリプトのダウンロードリンクもありますので、まずは英語の講演のスクリプトをダウンロードして、それを眺めながら自分の興味のある講演だけをみるとよいと思います。
下には講演の演目を並べておきます。

一日目(September 16, 2021)1:00-5:00p.m., EDT
Session I: Cancer Progression & Metastasis(Chair, Dr. Karl Krueger, Program Director, NCI)
1:00p.m., Dr. Gerard C. Blobe, Duke University Medical School
Loss of ALK4 Function Promotes Cancer Progression Through Reprogramming of Receptor Glycosylation
1:30p.m., Dr. Kevin Yarema, Johns Hopkins Medical School
Metabolic Glycoengineering Labeling of Sialic Acid for Early Cancer Detection
2:00p.m., Dr. Prakash Radhakrishnan, University of Nebraska Medical Center
Cancer-associated Short O-glycans in Pancreatic Cancer Malignancy
2:30p.m., Dr. Charles Dimitroff, Florida International University
The Role of Hypoxia Driving Melanoma Glycobiology Signature

Session II: Diagnostics & Therapeutics(Chair, Dr. Neeraja Sathyamoorthy, Program Director, NCI)
3:15p.m., Dr. Joseph Contessa, Yale University Medical School
Developing an Inhibitor of N-glycosylation for Cancer Therapy
3:45p.m., Dr. Steven Banik, Stanford University
Targeted Protein Degradation from the Extracellular Space
4:00p.m., Dr. Mia L. Huang, Scripps Department of Molecular Medicine
Tools to Discover and Surveil Glycoconjugate Targets in Cancer Biology
4:15p.m., Dr. Dannielle Engle, Salk Institute for Biological Studies
Interception of the Aberrant Glycan CA19-9 in Pancreatic Disease
4:30p.m., Dr. Edgar Engleman, Stanford University School of Medicine
Targeting Dectin-2 for Tumor Immunotherapy
5:00p.m., Adjourn

二日目(September 17, 2021)1:00-5:15p.m., EDT
Session III. Cell Signaling (Chair, Dr. Neeraja Sathyamoorthy, Program Director, NCI)
1:00p.m., Dr. Mauricio Reginato, Drexel University
O-GlcNAcylation: Linking Signaling and Metabolism in Cancer
1:30p.m., Dr. Virginia Shapiro, Mayo Rochester
ST8Sia6 Promotes Tumor Growth in Mice by Inhibiting Immune Responses
2:00p.m, Dr. Anita Hjelmeland, University of Alabama Birmingham
A Protumorigenic Role for ST6Gal1-Mediated Sialylation in Brain Tumor Initiating Cells
2:30p.m., Dr. Thomas Clausen, University of California San Diego
Binding of Malarial VAR2CSA to Oncofetal Chondroitin Sulfate Depends on Sulfation and Ligand Accessibility

Session IV. Glycoproteomics & Informatics (Chair, Dr. Karl Krueger, Program Director, NCI)
3:15p.m., Dr. Richard Drake, Medical University of South Carolina
Integrated Workflows for Carbohydrate Antigen Immunohistochemistry, N-glycan Imaging Mass Spectrometry and Targeted Glycoproteomics on the Same Tumor Tissue Slide
3:45p.m., Dr. Stacy Malaker, Yale University
Revealing the Cancer-Associated Mucinome
4:00p.m., Dr. Hui Zhang, Johns Hopkins School of Medicine
Characterization of Human Cancers by Glycoproteomics
4:30p.m., Dr. Raja Mazumder, George Washington University
Exploring Cancer Mutations and its Effect on Glycosylation Sites Using GlyGen Supersearch
4:45p.m., Dr. Lingjun Li, University of Wisconsin
Development and Application of Chemical Tags for Quantitative Glycomics and Glycoproteomics
5:15p.m., Adjourn
今日も長くなりましたが、面白そうな講演なので是非聴いてみてください。

AlphaFoldを試してみています―生物学の革命:タンパク質の立体構造を驚異的精度で予測するGoogleのAI

7月16日早朝、アミノ酸配列を入力すると、その配列をもつタンパク質(蛋白質)の立体構造をほぼ完璧に予測できるというGoogleのDeep Mind系列の人工知能ソフトAlphaFold2の論文とソフトが公開されて、ものすごい反響を呼んでいます。
生物学の革命を今まのあたりにしているのだと思います。タンパク質の立体構造を予測するプログラムのコンテストで驚異の成績で優勝したソフトです。コンテストは、構造解析の実験で立体構造がわかっているがまだ立体構造が未公開のタンパク質のアミノ酸配列を問題として与えて、参加したグループが立体構造の予測を競うというものです。ここのところあまり良い結果がでていなかったそうです。そこに突如参加したAlphaFoldというGoogleのグループが初回でトップの成績をあげ、二回目の去年の大会では、改良版AlphaFold2がほとんどの問題で実験結果とぴったりの予測に成功して世間を震撼させたのでした。このソフトとアルゴリズム、AIの学習データセットの公開が待たれていたのですが、ついに公開されて全世界でAlphaFoldがブームになっているようです。7月16日早朝、雑誌Natureに論文が公開されて
https://www.nature.com/articles/s41586-021-03819-2
プログラムも一般公開されました。
https://github.com/deepmind/alphafold

プログラムの導入方法や使い方については、以下の森脇 由隆さんの記事が最高にわかりやすいのでご覧ください。
https://qiita.com/Ag_smith/items/7c76438906b3f665af38

Twitterも参考になります。https://twitter.com/Ag_smith
上の記事によると使用するコンピュータはlinuxの動くパソコンでメモリが32ギガバイトから64ギガバイト(それ以上ならなおよいでしょう)、ディスク容量はデータベースをダウンロードする必要があるので4テラバイト以上必要です。計算スピードが必要なので高速のSSDドライブを使うのがいいそうです。M.2 SSDという最新型のドライブ(メモリーみたいに差し込むだけで使えるのでSSDをつなぐケーブルとかがないものです)のパソコンがおすすめです。グラフィックボードはRTX3060以上がよいそうです。この森脇先生はRyzen9 5900X, RTX3090, HDD 8TBで使った場合、二時間余りで立体構造の計算結果がでるとTwitterに書かれていました。

残念ながら私のパソコンはこのスペックではなかった(ディスク容量不足など)ため、新たに購入する必要がありそうです。ただグラフィックボードはビットコインのマイニングで品薄となっていて昔10万したものが倍の値段になっていたりするので、あまりこれにお金はかけずに第四世代のPCIe (PCI express:Peripheral Component Interconnect Express)対応のマザーボードとPCIe 4.0対応のM.2 SSDで高速化を図るほうがよいと、阪大の先生からアドバイスをもらいました。

ということで、自分のパソコンでは動かないので、パソコンを組み立てる前に、Google Colaboratoryで利用できAlphaFold2を使ってみることにしました。Googleのアカウントを取得しておいて、以下のurlからアカウントとのログイン名とパスワードを使ってログインして使います。
https://colab.research.google.com/drive/1LVPSOf4L502F21RWBmYJJYYLDlOU2NTL
使い方は簡単で、アミノ酸配列を入力部分にペースト、上のほうにあるランタイムのプルダウンメニューからランタイムのタイプを変更を選んでGPUを使うに設定し保存、その後入力アミノ酸配列を確認して、ランタイムからすべてのセルを実行を選んで開始します。

さっそく私達が解析していたN型糖鎖の合成の第一段階で働く酵素DPAGT1の線虫版algn-7遺伝子産物を解析してみました。2時間弱で解析がおわりました。結果が冒頭の写真です。5つの予測結果が返ってきてダウンロード可能です。このサイトに書いてあるように、GPUの割当が不足で計算が途中で止まることもある(たとえば全長2300アミノ酸のタンパク質を解析しようとしたらだめでした)ようですが、1000アミノ酸程度の長さのものなら1-2時間で解析が終わります。

ところがビッグニュースが今日とびこんできました。なんと21の生物種のプロテオームのAlphaFold2による解析がすでに終了しており、その解析結果がダウンロード可能になっています。要するに21種の生物の全タンパク質のAlphaFold2による立体構造解析結果が一括でダウンロードできるというわけです。
ヒト、マウス、ゼブラフィッシュ、シロイヌナズナ、大腸菌、線虫C. elegansなど主なモデル生物種が網羅されています(以下のリンクをクリックしてください)。私は早速 線虫のタンパク質の解析結果をダウンロードしました。
https://alphafold.ebi.ac.uk/download

For downloading all predictions for all species, visit the FTP site:
ftp://ftp.ebi.ac.uk/pub/databases/alphafold
だそうですので、ftpでダウンロードするのもよいでしょう。

ダウンロードしたプロテオームファイルはtar圧縮ファイルなのでWindowsのパソコンなら7-zipなどの解凍ソフトで解凍します。
解凍されたファイル(まだgz拡張子がついた圧縮ファイルです)にはファイル名にUniprotのタンパク質登録名が入っています。たとえば上で解析したN型糖鎖合成の第一段階をつかさどる酵素(algn-7遺伝子の作る酵素)の立体構造解析の結果を調べたいとします。このタンパク質はUniprotではQ9U1Z2という登録名なので、解凍したフォルダのなかでQ9U1Z2という名前の入っているファイルを検索します。
するとファイル名がAF-Q9U1Z2-F1-model_v1.pdb.gzとAF-Q9U1Z2-F1-model_v1.cif.gzという二つの圧縮ファイルが見つかりました。これらをそれぞれ7-zipで解凍してできるのがAlphaFoldによる予測結果です。
解凍してできたpdbファイルはオンラインでは
https://www.ncbi.nlm.nih.gov/Structure/icn3d/full.html
にアクセスしてパソコンのファイルを指定してloadすれば、立体構造を手軽にみることができます。以下の写真がダウンロードしたpdbファイルを表示した写真です。私が昨日解析した上の結果とほとんど同じです。

またcifファイルはJmolとかで読み込めば立体構造が簡単にみられます。Jmolのダウンロードは以下から可能です。
http://jmol.sourceforge.net/
Jmolの使い方はここにあります。要するにjmol.batというファイルをダブルクリックしたら使えるので簡単です。
https://katakago.sakura.ne.jp/soft/jmol/jmol-pc.html

Uniprotにもヒトのタンパク質についてはAlphaFold2の予測結果は掲載されているようですが、まだ掲載されていない生物種も多いのでこのダウンロードファイルは貴重ですね。

(おまけの追記です。2021/07/24)
以下のリンクに詳しい説明とダウンロードリンクもあります。
https://insideuniprot.blogspot.com/2021/07/alphafold-structure-predictions-freely.html
このリンクにある記事を参考にヒトのタンパク質のAlphaFoldによる解析例を紹介します。ヒトの遺伝子の例として、私達が以前研究していたコンドロイチン合成酵素chondroitin synthase 1 (CHSY1)についてみてみましょう。UniprotでCHSY1とhumanの二語を検索窓に入れて検索すると、一番上の検索結果にQBX52というのがあります。
https://www.uniprot.org/uniprot/Q86X52
これをクリックしてみると、このタンパク質についてのすべてが載っているのですが、Structureの項目を探してみると、そこにAlphaFold2による予測結果が載っています。そこにあるAlphaFoldというリンクをクリックすると予測結果のページが表示されますのでご覧ください。
https://alphafold.ebi.ac.uk/entry/Q86X52

データサイエンス向けにおすすめの統計学の教科書の紹介です

インターネットをみていると、初心者向きの統計学の教科書を見つけました。「データ分析のための統計学入門 原著第4版 “OpenIntro Statistics Fourth Edition”」という本で、日本統計協会から翻訳本が市販されています。この本は訳者のお一人である国友直人先生のweb pageにpdfがおいてあるので無料でダウンロードして読むことができます。
原本のOpenIntro Statisticsという本は無料公開されており、上の訳本の中でも関連サイトが詳しく紹介されています。この訳本では問題の解答は省略されていますが、英語の原本pdfには練習問題の一部の解答が載っているので原本をダウンロードして合わせて使うとよいでしょう(上にあるリンクの本の購入ページでYou Pay 15$とある部分のスライダを左に動かして0ドルにしてcartにいれ、購入手続きでemailアドレスをいれるとダウンロードできます。0ドルの領収書がメールで送られてきます)。英語のサイトには解説ビデオ(下のほうにvideoのリンクがあります。クリックするとYouTubeビデオが開くので字幕オンにしてみるとよいです)やRプログラミング言語での勉強用リンクもあります(各章の表題の下の部分にある Software LinesというリンクをクリックするとRやRStudio、Pythonその他でのコードのページが開きます。たとえばChapter  5. Foundations for Inferenceの下にあるIntro to Inferenceの部分をクリックして開いたページでLab: R (Base)とある部分をクリックするとこんなページが開きます。Pythonコードのページとかもありますので適宜利用してください。)また訳者によるRの簡単なイントロも訳本のページ(R・エクセル・基礎数学と題したpdf)にあるのでご覧ください。データそのものはzipファイルでダウンロードできますし、こちらにはR用のデータやデータのcsvファイルなどもそろっています。またRのパッケージとしてもデータが公開されているのでR でパッケージを読み込んで使うこともできます。
医学生物学向きには同様な無料本(Harvard大学の先生が書いたものです)
Introductory Statistics for the Life and Biomedical Sciencesがあります。こちらは英語版ですが、上の本と同様にRのコードへのアクセスリンクもスライドもありますので、よかったらダウンロードして読んでみてください。

4月11日の日曜日は快晴で青空がとても綺麗な一日でした。我が家のリンゴの木にも沢山花が咲きました。

当日は県知事選挙の日。病気で九大病院に入院された小川知事の辞職にともなって実施される福岡県知事選挙の投票に歩いてでかけました。丁度お昼どきだったので会場には投票する人が、私達二人をふくめて3人しかいません。会場のコロナ対策は万全でした。換気万全の投票所ですが、まず入り口にアルコール消毒液が備えられていて手指を消毒、その後非接触型体温計で体温を測り入場します。投票券をマスクの職員の方に手渡すと、手袋した手で受け取り、アクリル遮蔽板を介してやり取りします。あとは投票用の消毒済み鉛筆と投票用紙を手渡されて記入台で候補者名を書いて投票です。鉛筆はそこで回収されます。コロナ蔓延下での選挙も何度も行われているので対策も洗練されてきた感じがします。選挙結果は予想通り、8時の開票と同時に当選確実がでるというものでした。COVID-19下での選挙制度の洗練度を確認できてよかったです。