Mathematicaの紹介です!

ヒマワリもアサガオもそろそろ花の数が減ってきて秋を感じさせる毎日です。さて今日はMathematicaの紹介です。MathematicaはStephen Wolframという人が開発した有料ソフトで数値計算と数式処理ができますし、最近では画像や音声、信号処理、機械学習、統計解析、バイオインフォマティクスなど広範囲で利用されています。Pythonなどのプログラミング言語に比べてプログラムが格段に簡単で、自然言語での入力も可能になるなど科学の研究、学習には必須といってよいソフトでしょう。先日、微分方程式の解き方の講演があったのでオンライン参加してみました。講師の丸山 耕司先生は理論物理(御専門は量子情報、量子制御理論など)出身の方で、Wolfram社のブログなどの他、雑誌「数理科学」に寄稿されたり、「動かして学ぶ量子コンピュータプログラミング」(O’Reilly Japan)という本の監修、そして量子力学の定番教科書サクライの現代の量子力学 第2版(最近原書の第3版がでています)の問題解説(演習 現代の量子力学 第2版 J.J.サクライの問題解説)(吉岡書店)の著者の方でした。微分方程式の解き方の基本のキから学べる講義でしたので、以下のリンクから無料登録して講演をご覧になるのをお勧めします。https://www.bigmarker.com/series/solving-differentialequations-ja/series_details?utm_bmcr_source=twitterまたWolfram Japanのtwitterにこの講義の他、Mathematicaによる微分積分学入門など関連したいろいろな情報がでているので参考にしてください。リンクはこちらです。
https://twitter.com/WolframJapan

MathematicaはWolfram言語というプログラミング言語で動くソフトです。Wolfram言語は、日常言語とかわらない命令もうけつけるように設計されていて、プログラミング初心者にもきわめてやさしい、そして短いコードで、高度なプログラムが書けるすぐれたソフトウエアです。Wolfram言語の入門書としては開発者のWolframの書いたAn Elementary Introduction to the Wolfram Language 第2版がおすすめです。この開発者自身が書いたWolfram 言語(Mathematicaで使われているプログラム言語)の解説本は以下のリンクで無料で読める他、オンラインでWolfram 言語を使って学習できるので興味のある方は下のリンクにアクセスしてみてください。
https://www.wolfram.com/language/elementary-introduction/2nd-ed/

癌の糖鎖生物学―NIH videocastの紹介です

秋が深まってきたようで、近所では稲刈りの真っ最中です。今日からこのブログのスタイルをちょっと変更して、短い記事をこまめに投稿していこうと思います。長い記事は書くのに時間がかかるので、こちらは今までと同じ頻度になると思います。

いつも紹介しているNIHのvideo castのサイトに今月(2021年)9月16日と9月17日にわたって開催されたGlycobiology of Cancerという講演会の動画リンクがアップロードされています。初日の16日の分がこちら2日目の17日の分がこちらにありますので画面左下の+Moreの部分をクリックして開く画面で、Downloadのボタンをクリックしてダウンロードしてご覧ください。画質はビットレートで、1240k、1440k、1840kの三種類が選べます。ダウンロードした動画は、f4vファイルという形式で作成されており、1840kの場合は2ギガちょっとのサイズですのでダウンロード先の空き容量を確かめてからダウンロードしてください。f4vファイルはMPC-HCなどの無料版動画プレーヤーで再生できます。英語がちょっとと思われる方は同じDownload画面に、スクリプトのダウンロードリンクもありますので、まずは英語の講演のスクリプトをダウンロードして、それを眺めながら自分の興味のある講演だけをみるとよいと思います。
下には講演の演目を並べておきます。

一日目(September 16, 2021)1:00-5:00p.m., EDT
Session I: Cancer Progression & Metastasis(Chair, Dr. Karl Krueger, Program Director, NCI)
1:00p.m., Dr. Gerard C. Blobe, Duke University Medical School
Loss of ALK4 Function Promotes Cancer Progression Through Reprogramming of Receptor Glycosylation
1:30p.m., Dr. Kevin Yarema, Johns Hopkins Medical School
Metabolic Glycoengineering Labeling of Sialic Acid for Early Cancer Detection
2:00p.m., Dr. Prakash Radhakrishnan, University of Nebraska Medical Center
Cancer-associated Short O-glycans in Pancreatic Cancer Malignancy
2:30p.m., Dr. Charles Dimitroff, Florida International University
The Role of Hypoxia Driving Melanoma Glycobiology Signature

Session II: Diagnostics & Therapeutics(Chair, Dr. Neeraja Sathyamoorthy, Program Director, NCI)
3:15p.m., Dr. Joseph Contessa, Yale University Medical School
Developing an Inhibitor of N-glycosylation for Cancer Therapy
3:45p.m., Dr. Steven Banik, Stanford University
Targeted Protein Degradation from the Extracellular Space
4:00p.m., Dr. Mia L. Huang, Scripps Department of Molecular Medicine
Tools to Discover and Surveil Glycoconjugate Targets in Cancer Biology
4:15p.m., Dr. Dannielle Engle, Salk Institute for Biological Studies
Interception of the Aberrant Glycan CA19-9 in Pancreatic Disease
4:30p.m., Dr. Edgar Engleman, Stanford University School of Medicine
Targeting Dectin-2 for Tumor Immunotherapy
5:00p.m., Adjourn

二日目(September 17, 2021)1:00-5:15p.m., EDT
Session III. Cell Signaling (Chair, Dr. Neeraja Sathyamoorthy, Program Director, NCI)
1:00p.m., Dr. Mauricio Reginato, Drexel University
O-GlcNAcylation: Linking Signaling and Metabolism in Cancer
1:30p.m., Dr. Virginia Shapiro, Mayo Rochester
ST8Sia6 Promotes Tumor Growth in Mice by Inhibiting Immune Responses
2:00p.m, Dr. Anita Hjelmeland, University of Alabama Birmingham
A Protumorigenic Role for ST6Gal1-Mediated Sialylation in Brain Tumor Initiating Cells
2:30p.m., Dr. Thomas Clausen, University of California San Diego
Binding of Malarial VAR2CSA to Oncofetal Chondroitin Sulfate Depends on Sulfation and Ligand Accessibility

Session IV. Glycoproteomics & Informatics (Chair, Dr. Karl Krueger, Program Director, NCI)
3:15p.m., Dr. Richard Drake, Medical University of South Carolina
Integrated Workflows for Carbohydrate Antigen Immunohistochemistry, N-glycan Imaging Mass Spectrometry and Targeted Glycoproteomics on the Same Tumor Tissue Slide
3:45p.m., Dr. Stacy Malaker, Yale University
Revealing the Cancer-Associated Mucinome
4:00p.m., Dr. Hui Zhang, Johns Hopkins School of Medicine
Characterization of Human Cancers by Glycoproteomics
4:30p.m., Dr. Raja Mazumder, George Washington University
Exploring Cancer Mutations and its Effect on Glycosylation Sites Using GlyGen Supersearch
4:45p.m., Dr. Lingjun Li, University of Wisconsin
Development and Application of Chemical Tags for Quantitative Glycomics and Glycoproteomics
5:15p.m., Adjourn
今日も長くなりましたが、面白そうな講演なので是非聴いてみてください。

AlphaFoldを試してみています―生物学の革命:タンパク質の立体構造を驚異的精度で予測するGoogleのAI

7月16日早朝、アミノ酸配列を入力すると、その配列をもつタンパク質(蛋白質)の立体構造をほぼ完璧に予測できるというGoogleのDeep Mind系列の人工知能ソフトAlphaFold2の論文とソフトが公開されて、ものすごい反響を呼んでいます。
生物学の革命を今まのあたりにしているのだと思います。タンパク質の立体構造を予測するプログラムのコンテストで驚異の成績で優勝したソフトです。コンテストは、構造解析の実験で立体構造がわかっているがまだ立体構造が未公開のタンパク質のアミノ酸配列を問題として与えて、参加したグループが立体構造の予測を競うというものです。ここのところあまり良い結果がでていなかったそうです。そこに突如参加したAlphaFoldというGoogleのグループが初回でトップの成績をあげ、二回目の去年の大会では、改良版AlphaFold2がほとんどの問題で実験結果とぴったりの予測に成功して世間を震撼させたのでした。このソフトとアルゴリズム、AIの学習データセットの公開が待たれていたのですが、ついに公開されて全世界でAlphaFoldがブームになっているようです。7月16日早朝、雑誌Natureに論文が公開されて
https://www.nature.com/articles/s41586-021-03819-2
プログラムも一般公開されました。
https://github.com/deepmind/alphafold

プログラムの導入方法や使い方については、以下の森脇 由隆さんの記事が最高にわかりやすいのでご覧ください。
https://qiita.com/Ag_smith/items/7c76438906b3f665af38

Twitterも参考になります。https://twitter.com/Ag_smith
上の記事によると使用するコンピュータはlinuxの動くパソコンでメモリが32ギガバイトから64ギガバイト(それ以上ならなおよいでしょう)、ディスク容量はデータベースをダウンロードする必要があるので4テラバイト以上必要です。計算スピードが必要なので高速のSSDドライブを使うのがいいそうです。M.2 SSDという最新型のドライブ(メモリーみたいに差し込むだけで使えるのでSSDをつなぐケーブルとかがないものです)のパソコンがおすすめです。グラフィックボードはRTX3060以上がよいそうです。この森脇先生はRyzen9 5900X, RTX3090, HDD 8TBで使った場合、二時間余りで立体構造の計算結果がでるとTwitterに書かれていました。

残念ながら私のパソコンはこのスペックではなかった(ディスク容量不足など)ため、新たに購入する必要がありそうです。ただグラフィックボードはビットコインのマイニングで品薄となっていて昔10万したものが倍の値段になっていたりするので、あまりこれにお金はかけずに第四世代のPCIe (PCI express:Peripheral Component Interconnect Express)対応のマザーボードとPCIe 4.0対応のM.2 SSDで高速化を図るほうがよいと、阪大の先生からアドバイスをもらいました。

ということで、自分のパソコンでは動かないので、パソコンを組み立てる前に、Google Colaboratoryで利用できAlphaFold2を使ってみることにしました。Googleのアカウントを取得しておいて、以下のurlからアカウントとのログイン名とパスワードを使ってログインして使います。
https://colab.research.google.com/drive/1LVPSOf4L502F21RWBmYJJYYLDlOU2NTL
使い方は簡単で、アミノ酸配列を入力部分にペースト、上のほうにあるランタイムのプルダウンメニューからランタイムのタイプを変更を選んでGPUを使うに設定し保存、その後入力アミノ酸配列を確認して、ランタイムからすべてのセルを実行を選んで開始します。

さっそく私達が解析していたN型糖鎖の合成の第一段階で働く酵素DPAGT1の線虫版algn-7遺伝子産物を解析してみました。2時間弱で解析がおわりました。結果が冒頭の写真です。5つの予測結果が返ってきてダウンロード可能です。このサイトに書いてあるように、GPUの割当が不足で計算が途中で止まることもある(たとえば全長2300アミノ酸のタンパク質を解析しようとしたらだめでした)ようですが、1000アミノ酸程度の長さのものなら1-2時間で解析が終わります。

ところがビッグニュースが今日とびこんできました。なんと21の生物種のプロテオームのAlphaFold2による解析がすでに終了しており、その解析結果がダウンロード可能になっています。要するに21種の生物の全タンパク質のAlphaFold2による立体構造解析結果が一括でダウンロードできるというわけです。
ヒト、マウス、ゼブラフィッシュ、シロイヌナズナ、大腸菌、線虫C. elegansなど主なモデル生物種が網羅されています(以下のリンクをクリックしてください)。私は早速 線虫のタンパク質の解析結果をダウンロードしました。
https://alphafold.ebi.ac.uk/download

For downloading all predictions for all species, visit the FTP site:
ftp://ftp.ebi.ac.uk/pub/databases/alphafold
だそうですので、ftpでダウンロードするのもよいでしょう。

ダウンロードしたプロテオームファイルはtar圧縮ファイルなのでWindowsのパソコンなら7-zipなどの解凍ソフトで解凍します。
解凍されたファイル(まだgz拡張子がついた圧縮ファイルです)にはファイル名にUniprotのタンパク質登録名が入っています。たとえば上で解析したN型糖鎖合成の第一段階をつかさどる酵素(algn-7遺伝子の作る酵素)の立体構造解析の結果を調べたいとします。このタンパク質はUniprotではQ9U1Z2という登録名なので、解凍したフォルダのなかでQ9U1Z2という名前の入っているファイルを検索します。
するとファイル名がAF-Q9U1Z2-F1-model_v1.pdb.gzとAF-Q9U1Z2-F1-model_v1.cif.gzという二つの圧縮ファイルが見つかりました。これらをそれぞれ7-zipで解凍してできるのがAlphaFoldによる予測結果です。
解凍してできたpdbファイルはオンラインでは
https://www.ncbi.nlm.nih.gov/Structure/icn3d/full.html
にアクセスしてパソコンのファイルを指定してloadすれば、立体構造を手軽にみることができます。以下の写真がダウンロードしたpdbファイルを表示した写真です。私が昨日解析した上の結果とほとんど同じです。

またcifファイルはJmolとかで読み込めば立体構造が簡単にみられます。Jmolのダウンロードは以下から可能です。
http://jmol.sourceforge.net/
Jmolの使い方はここにあります。要するにjmol.batというファイルをダブルクリックしたら使えるので簡単です。
https://katakago.sakura.ne.jp/soft/jmol/jmol-pc.html

Uniprotにもヒトのタンパク質についてはAlphaFold2の予測結果は掲載されているようですが、まだ掲載されていない生物種も多いのでこのダウンロードファイルは貴重ですね。

(おまけの追記です。2021/07/24)
以下のリンクに詳しい説明とダウンロードリンクもあります。
https://insideuniprot.blogspot.com/2021/07/alphafold-structure-predictions-freely.html
このリンクにある記事を参考にヒトのタンパク質のAlphaFoldによる解析例を紹介します。ヒトの遺伝子の例として、私達が以前研究していたコンドロイチン合成酵素chondroitin synthase 1 (CHSY1)についてみてみましょう。UniprotでCHSY1とhumanの二語を検索窓に入れて検索すると、一番上の検索結果にQBX52というのがあります。
https://www.uniprot.org/uniprot/Q86X52
これをクリックしてみると、このタンパク質についてのすべてが載っているのですが、Structureの項目を探してみると、そこにAlphaFold2による予測結果が載っています。そこにあるAlphaFoldというリンクをクリックすると予測結果のページが表示されますのでご覧ください。
https://alphafold.ebi.ac.uk/entry/Q86X52

カエルの王様バラの中に―Wikipediaのダウンロード法

お昼前に買い物から帰って家に入るとき、奥さんが「わっ、 カエルがいる!」と叫んでカメラをとりにきました。さっそく見にいくと、バラの花の中にアマガエルがくつろいでいました。写真は奥さんが撮影した薔薇の花の中でくつろぐ、アマガエルです。去年も5月にアマガエルをみかけましたので、花の中で虫を取っているのかもしれません‥‥。

さて今日の本題です。Wikipediaのデータをダウンロードしておいて、インターネットにつながずに利用する方法があるそうです。やってみると今後いろいろWikipediaの利用法が拡がると思います。やりかたはKiwixというフリーソフトをダウンロードしておいて、これでWikipediaのデータ(zimファイルというファイル形式です)をダウンロードして利用するだけです。日本語のページはこちらです。英語版の完全版だと83Gくらいのデータのダウンロードが必要ですので、もっとサイズの少ない日本語版とか、ずっと小さなサイズの分野別Wikipediaとかをつかって練習してみてから、巨大ファイルのダウンロードに挑戦するべきでしょう。

以下はKiwixの日本語版ページからの引用です。
「Kiwixは非常に簡単です。Kiwixは利便性を考えたさまざまな機能があります。

  • 全文章からの検索
  • お気に入りとメモ
  • HTTPサーバー
  • PDF形式、HTML形式にエクスポート
  • 100言語以上のUI(ユーザーインターフェース)
  • タブによるネットサーフィン
  • 記事をまとめたウィンドウマネージャーとダウンローダー
  • その他さまざまな機能…
    WikipediaだけではなくてWiktionaryなどもダウンロードできます。英語版、フランス語版、ドイツ語版その他各国語版のWikipediaもありますので必要なものからダウンロードして使ってみてください。

データサイエンス向けにおすすめの統計学の教科書の紹介です

インターネットをみていると、初心者向きの統計学の教科書を見つけました。「データ分析のための統計学入門 原著第4版 “OpenIntro Statistics Fourth Edition”」という本で、日本統計協会から翻訳本が市販されています。この本は訳者のお一人である国友直人先生のweb pageにpdfがおいてあるので無料でダウンロードして読むことができます。
原本のOpenIntro Statisticsという本は無料公開されており、上の訳本の中でも関連サイトが詳しく紹介されています。この訳本では問題の解答は省略されていますが、英語の原本pdfには練習問題の一部の解答が載っているので原本をダウンロードして合わせて使うとよいでしょう(上にあるリンクの本の購入ページでYou Pay 15$とある部分のスライダを左に動かして0ドルにしてcartにいれ、購入手続きでemailアドレスをいれるとダウンロードできます。0ドルの領収書がメールで送られてきます)。英語のサイトには解説ビデオ(下のほうにvideoのリンクがあります。クリックするとYouTubeビデオが開くので字幕オンにしてみるとよいです)やRプログラミング言語での勉強用リンクもあります(各章の表題の下の部分にある Software LinesというリンクをクリックするとRやRStudio、Pythonその他でのコードのページが開きます。たとえばChapter  5. Foundations for Inferenceの下にあるIntro to Inferenceの部分をクリックして開いたページでLab: R (Base)とある部分をクリックするとこんなページが開きます。Pythonコードのページとかもありますので適宜利用してください。)また訳者によるRの簡単なイントロも訳本のページ(R・エクセル・基礎数学と題したpdf)にあるのでご覧ください。データそのものはzipファイルでダウンロードできますし、こちらにはR用のデータやデータのcsvファイルなどもそろっています。またRのパッケージとしてもデータが公開されているのでR でパッケージを読み込んで使うこともできます。
医学生物学向きには同様な無料本(Harvard大学の先生が書いたものです)
Introductory Statistics for the Life and Biomedical Sciencesがあります。こちらは英語版ですが、上の本と同様にRのコードへのアクセスリンクもスライドもありますので、よかったらダウンロードして読んでみてください。

4月11日の日曜日は快晴で青空がとても綺麗な一日でした。我が家のリンゴの木にも沢山花が咲きました。

当日は県知事選挙の日。病気で九大病院に入院された小川知事の辞職にともなって実施される福岡県知事選挙の投票に歩いてでかけました。丁度お昼どきだったので会場には投票する人が、私達二人をふくめて3人しかいません。会場のコロナ対策は万全でした。換気万全の投票所ですが、まず入り口にアルコール消毒液が備えられていて手指を消毒、その後非接触型体温計で体温を測り入場します。投票券をマスクの職員の方に手渡すと、手袋した手で受け取り、アクリル遮蔽板を介してやり取りします。あとは投票用の消毒済み鉛筆と投票用紙を手渡されて記入台で候補者名を書いて投票です。鉛筆はそこで回収されます。コロナ蔓延下での選挙も何度も行われているので対策も洗練されてきた感じがします。選挙結果は予想通り、8時の開票と同時に当選確実がでるというものでした。COVID-19下での選挙制度の洗練度を確認できてよかったです。

福岡では桜が満開です―iPadのTipsの本と動画の紹介

(注:このブログでは、12ポイント太字の部分はリンクです。クリックすると該当ページが開きます。)
今年は福岡の桜の開花が早く、もはや満開を迎えてはらはらと散り始めているところもあります。卒業式も終業式も終わって、今は春休み。一昨日、昨日、今日と近所でお花見をしましたが、春休みの小学校の前では、この4月に新一年生になるお子さんが、満開の桜のもとでランドセルを背負って記念撮影してもらっていました。春爛漫です。

図書館でiPadについての新刊を借りてきました。iPadクリエイティブという本です。紙の本と電子ブック両方があります。これはおすすめです。たとえばiPadで読んでいる電子ブックの必要ページをpdfにする方法とか、アップルペンシルの賢い使い方などいろんなtipsが満載で、買って損がない本です。著者のamity_senseiの本の紹介動画とtipsの動画の一例を、下に貼り付けておきます。

こちらは、
「みんなが知らない、純正アプリのiPad読書術。【Kindle × Apple Books】」という動画で、Apple BooksやKindleといった電子ブックの紹介、およびpdf化のやりかたの紹介です。


是非チャンネルをご覧ください。
あと、YouTubeですが、Braveというブラウザでみると広告が抑制されているようです。広告スキップがうっとおしいと思われる方は試してみると良いと思います。広告ブロック機能が強力なブラウザですし、FirefoxやChromeなどからのブックマークの移行も自動で行われて便利です。プライバシーに配慮したブラウザで、なんとプライベートブラウジングモードはTorを使っています。

Pythonや物理数学の無料本―春のおすすめ本

(注:このブログでは、12ポイント太字の部分はリンクです。クリックすると該当ページが開きます。)
暖かくて春めいた日が続きます。4月上旬の暖かさとか。九州大学でも前期日程の合格発表が昨日(3/08)あったそうで、ニュースで合格した学生さん達の喜びの声を報道していました。
写真は散歩の途中でみつけたスミレと つくしです。近所では1週間以上前にうぐいすの初鳴きを聞きました。

最近、Pythonの教科書を京大が公開しているのを知りました。プログラミング演習Python2019という講義の教材です。初歩からはじめてグラフィックインターフェイスでのプログラムまでやさしく指導してくれる本で本篇とコラムを集めた本の二冊があります。以前紹介した本の後に読むのに最適だと思います。Anacondaのインストールをした後、この本からPythonの勉強をはじめることも可能だと思います。

また以前紹介していた学習院大学の田崎先生の「数学:物理を学び楽しむために」という本もバージョンアップされていますので紹介しておきます。これは序文によると「物理学(とそれに関連する分野)を学ぶ方を対象にした、大学レベルの数学の入門的な教科書である。高校数学の知識を前提にして、大学生が学ぶべき数学をじっくりと解説する。」という本です。著者の田崎先生のtwitterでは「大学入試が終わって入学までの時間をもてあましている理数系のみなさんに特におすすめします。1章に目を通した後はお好きなところをどうぞ。」と紹介されています。またtwitterには物理や数学よりデータ科学や AI に興味があるという人は 7 章から始める(必要なら前の章を読む)のも一興かも。高校数学から消えた最強武器である行列がガチで学べて、主成分分析、マルコフ連鎖、Google Page Rank への応用まで!」とあります。面白そうでしょう!

Clonezillzaの使い方―LinuxやWindowsのまるごとバックアップのやり方

(注:このブログでは、12ポイント太字の部分はリンクです。クリックすると該当ページが開きます。)
日経Linux2020年11月号の付録にClonezilla 2.6.7-28のISOファイルがついていました。このソフトはLinuxやWindows(MacやChromeOS、アンドロイドなども可能)のシステムを、まるごとバックアップをするフリーソフトでここからダウンロード可能です(最新版は2.7.0-10)。使用しているブロックだけをバックアップするので、短時間でイメージやクローンがつくれます。ちょうど今まで利用していたLinux LTS版(ubuntu 16.04 LTS)のサポートがきれていたので、現在の環境をClonezillaでバックアップしておいて、最新版のLTSを入れなおすことにしました。
このソフトはNorton GhostとかTrue Imageとかいう有料ソフトと同様なソフトで、Windows やLinux、Macなどのイメージをつくっておいて、必要になったらそのイメージから現在のシステムを復活する(リストアする)ことができます。
注意点ですが、このソフトでは、まずバックアップ先を指定した後、バックアップするシステムを指定するという順番でバックアップします。つまりバックアップ用の外付けハードディスあるいはUSBメモリなどをまず指定し、その後、現在使っていてバックアップしたいドライブ(バックアップ元といわれるもので、複数同時指定可能)を指定してバックアップするのです。
ネット検索してみても日本語で使い方の詳しい説明をしているサイトがあまりなかったので、以下に具体的なやり方をまとめておきます。
1)まずClonezillaのサイトからClonezilla LiveのISOイメージファイル (ubuntuベースのものでなくて、DebianベースのものでOKです)をダウンロードします。ダウンロードしたISOファイルから起動用USBメディアをEtcherというソフトを使って作成します。EtcherというこのソフトはWindows, Mac, Linuxなどに対応しており、一発で起動用USBを作成できるソフトです。イメージファイルのありかを指定し、USBメモリを選び、ボタンを押すだけでブート用USBメモリができあがります。前に紹介したRufusというソフトも利用できますが、Etcherのほうが簡単です。(もちろんClonezillaのISOイメージをCDやDVDに焼いて、CDやDVDから起動して利用することもできます。)
2)次に、システムのイメージを保存するUSBドライブあるいはハードディスクドライブなどを決めて、その中にイメージ保存用のフォルダを作っておいてください。英語名のフォルダを作っておきます。(私は今回はCloneZilla_demoという名前のフォルダにしました。)ディスクにパーティションを切ってある場合は、どのパーティションを保存先に選ぶかを、容量や大事なファイルの有無(万が一のエラーでファイルが壊れることもあるかと思います)などを考慮してきめます。重要なファイルが入っているディスクやパーティションは壊れると怖いので、大事なファイルは別の場所にバックアップしておくことを薦めます。私は何もファイルがはいっていないパーティションにイメージ保存用のフォルダを作りました。まっさらのUSBメモリだとより安心ですね。保存用のフォルダを中に作成できたら、準備は完了です。

3)上の1)で作成したブート用USBメモリをパソコンに差し込んで起動します。Clonezillaが起動します。起動しない場合はUEFIのブートメニューを(F11キーなどマザーボードに応じたキーを押して)表示してUSBメモリを選べば起動します。古いパソコンでBIOSのもの(legacy BIOS)では起動順序をUSB優先に変えなくてはいけないかもしれません。うまくブートメディアから起動したら次に進みます。
4)上の写真のような起動画面が表示されますので、一番上のデフォルト(Clonezilla live)のままエンターを押す、あるいはしばらく放置しておくと下の写真のような言語選択画面になります。矢印キーで日本語を選びます。enterを押して次に進みます。
5)「キーボードのレイアウトを変更?」の画面、デフォルトのキーボードレイアウト(英語キーボード)を維持の選択のままenter。
6)Clonezillaを開始します のメニューがでます。そのままenter。
7)Clonezilla-オープンソース複製システム(OCS)という画面が開きます。今回はディスクイメージを作って保存したいので、開いたメニューで一番上にある「device-image ディスク/パーティションイメージ」(デフォルトで選ばれている)を選んだままenter。
8)Clonezilla  イメージディレクトリのマウントという画面がでます。(ここからがイメージの保存先の設定になります)一番上の「local_dev ローカルディスク(例=ハードディスク、USBドライブ)をマウント」が選ばれているのでそのままenter。
すると、次の写真のように「Clonezilla イメージリポジトリとしてUSBディバイスを使用したい場合」というメッセージが下部に表紙されるので、イメージ保存用のUSBディバイスを接続します。5秒以上待つとUSBディバイスが認識されるのでenter。
9)すると画面がかわって、現在認識されているストーレッジの一覧が表示されます。イメージを作ろうとしているハードディスクと、さっき接続したイメージ保存用のUSBディバイスが表示されているのを確認してください。皆さんのパソコンによりますが、例えば/dev/sda、/dev/sdb、/dev/sdcなどと表示されると思います。私のパソコンの場合、sdaがSSDでメインディスク、sdbが補助のハードディスクで、sdcは今接続した外付けハードディスクです。これで全部のドライブが表示されているのでCtrl-Cを押します(Ctrlキーとcを同時に押します)。上の写真ではsda、sdb、sdcなどの後に表示されているハードディスクの型番などを消してあります。

10) こんどは「Clonezilla-オープンソース複製システム(OCS)|モード」という画面になります。
さきほど表示されたsda、sdb、sdcのそれぞれのディスクの詳細が表示されています(上の写真)。私の場合はsdcのパーティションsdc2にイメージを保存する予定なので矢印キーでsdc2を選びます。enter。(註:この写真の場合、sda1は200.9Gのext4形式でフォーマットされているSDDであり、sdb1は1.8テラバイトのディスク、sdc1は2Tバイトのntfs形式でフォーマットされているボリューム(パーティション)、sdc2も同様で、sdc3は1.6Tバイトのntfs形式でフォーマットされたボリューム(パーティション)だとわかります。写真ではsda1, sdb1などのディバイスのメーカー型番などは消してありますが本当はIn_以下の部分に詳しく表示されています。)
11) 次は「Clonezilla イメージリポジトリ用のディレクトリブラウザ」という画面になります。私の場合、sdc2を選んだのでその内容が表示されています。いちばん上にあるゴミ箱recycling binが選択されていますが、あらかじめ2)で作っておいたCloneZilla_demoというディレクトリにイメージを保存するので、矢印キーでそれを選びます。選んだらenter。
12)次は保存先の最終確認画面になります。/dev/sdc2[/CloneZilla_demo/]というように、保存先として選んだディレクトリが表示されているので、画面の指示どおり、Tabキーを押してDoneを選択します。そしてenter。するとこの画面の画面下部に黒地に白で保存先の容量と名称などが表示されます(下の画像)。OKなのでenter。
13)画面が替わって、「Clonezilla-オープンソース複製システム(OCS)」の画面で初心者モードを選べる画面となります。デフォルトで選択されている初心者モードを選んでenter。
14)次は「モードを選択してください」 の画面です。「ローカルディスクをイメージに保存」を選びます。enter。(他にパーティションをイメージに保存するモードも選べます。)
15)すると「イメージの保存名を入力してください」という画面になります。西暦と月日からなる保存名がついています。そのままでもいいです。enter。

16)ここからは、 いよいよ保存したいローカルディスク(コピー元)の選択画面となります。私の場合は、sdaとsdbを保存したいのでスペースを押してまずsdaを選択。次に矢印キーで下のsdbを選び、スペースを押してsdbも選択します。選択完了したドライブには先頭に星印*がつきます。17)次の画面は、「Clonezilla 拡張パラメータ| モード savedisk」という画面で、圧縮オプションの選択画面となります。一番上の「zip 並列 GZIP圧縮を使用(マルチコア/SMP用)」でOKなのでこれを選んでenter。(画像は省略しました)
18)次は、ファイルシステムの保存前のチェックの画面となります。これはNTFSシステムを使っているwindowsでは使えません。Linuxなどではチェック可能ですなどと書かれています。今回はディスクに問題はないので、「元ファイルシステムのチェック/修復をスキップする」を選んでenter。

19) イメージ保存後、保存イメージが復元可能かどうかのチェックをするかどうかのオプションです。「はい 保存イメージをチェックします」を選んでenter
20) 画面が替わって、イメージを暗号化しますか?の画面となります。暗号化しないのでそちらを選んでenter。
21)すべての処理の完了後に実行される操作の選択画面です。一番上の「すべての処理の完了時に実行する、再起動シャットダウン他を選択してください」というメニューのままでenter。下に黒地で緑のメッセージが表示されます。確認してenter。
22)すると緑のメッセージの下に、ずらーっとメッセージがならんで表示されます。この中には、これからイメージを作成するドライブについての情報があるので確認しましょう。黒地に黄色の文字で「次のステップは、このマシンのハードディスク・パーティションをイメージとして保存することです。本当に続けてよろしいですか?(y/n)」と聞いてきます。よろしければyを押します。これでイメージ作成が始まります。
23)進行状況の画面がしばらく表示されます。数時間以上かかると思いますので気長に待ちましょう。以下のようにイメージは復元可能ですというメッセージがでたらほぼ完了です。確認してenter。
24)すると次の画面がでます。この画面で矢印キーを使って、電源offを選んでenterで終了です。再起動その他も選べます。

Pythonの勉強用におすすめの本(12/09動画について追記しました)

PythonはRとならんでおすすめのプログラミング言語です。医学部で教えている野村研の卒業生もPythonの講義をしているそうです。物理科学系だけではなく生命科学分野でもPythonを使えると断然有利になります。まったく初心者の方への入門書としては、いちばんやさしいPythonの教本 第2版 人気講師が教える基礎からサーバサイド開発までなどはどうでしょうか。第2版はみていないのでわかりませんが、プログラミングに使うエディターはAtomよりはVSCode(Visual Studio Code)のほうが良いと思います。まず初心者用の入門書で概要がわかったら、次は「すっきりわかるPython入門」をおすすめします。この本はAnacondaをつかってPythonをインストールしていくという、最近主流の入門スタイルで書かれています。大変よくわかるとうちの奥さんのおすすめ本です。出版社のサイトのリンクを下に書いておきます。この本のサイトの「掲載ツール導入・利用ガイド」の項目には、AnacondaやJupyterLabのインストールのやりかたが書いてあるので参考にしてみてください。電子書籍版もあります。
https://sukkiri.jp/books/sukkiri_python
なお九州大学の方(九大図書館にログインして、データベースにあるMaruzen eBook Libraryにアクセスしてみてください)やこのサービスを契約している組織の方は、ここで紹介した本を(一日60ページの制限がありますが)パソコンにダウンロードして読むことができます。すこし読んでみてよかったら購入するのがいいと思います。(残念ながら九大では「いちばんやさしいPythonの教本」は初版しかダウンロードできません)私はどちらもpdfで読んでみて、結局紙の本を購入しました。このライブラリには他のpythonの入門書もいろいろありますので、試し読みしてみて自分に向いている本を選ぶとよいかもしれません。入門用の動画ですがNGSハンズオン2015の動画の中にPython入門の動画がありますので、
https://togotv.dbcls.jp/20151110.html
入門前にこれを見てみるのもおすすめです(私はこれをみてPythonをはじめました)。

あと、最近はやりのJuliaというプログラミング言語の入門書も上のMaruzen eBook Libraryにあって読むことができます。「1から始めるJulia プログラミング」(コロナ社)という本です。Juliaを学びたい方にはおすすめです。Juliaはpythonのように書けてCにまさるとも劣らないスピードで実行できる画期的なプログラミング言語だそうです。
(写真は一週間ほどまえにみかけた皇帝ダリアです。)

ヒトの細胞の世界:世界で一番詳しい解説図が公開されています

世界一詳しいヒトの細胞の図解が2018年に公開されています。細胞を構成している分子についての知識は飛躍的に増えていて、X線結晶構造解析、核磁気共鳴(Nuclear Magnetic Resonance: NMRと略します)、クライオ電顕などを使って、細胞内での生体分子の様子がずいぶんわかってきました。その成果の集大成の図といえるでしょう。

こんな図です。きれいですね。秘密の花園みたいにきれいです。図には二つの細胞が描かれています。図の右上隅の細胞は、カドヘリンを介して画面のほとんどを占めている細胞と接着しています(この記事の下から二番目の図にカドヘリンのある場所がしめしてあるのでご覧ください)。画面左上からカドヘリンによる接着部位に向かって広がっているのは細胞膜とその膜上および膜外(細胞外基質)にあるいろいろな分子です。画面左下の黄色いバスケットのように見える部分(核膜孔)の周りの膜は、核膜などでその下は核の内部です。青い紐はDNAでいろんな転写因子も描かれています。

Cellular landscape cross-section through a eukaryotic cell, by Evan Ingersoll & Gael McGill – Digizyme’s Molecular Maya custom software, Autodesk Maya, and Foundry Modo used to import, model, rig, populate, and render all structural datasets
こちらには同じ図ですが、図のあちこちをクリックすると分子の名前だとか分子の詳しい説明などがみられる図(クリックしてサイトを開いてみてください)が掲載されています。ページを開くと上の図が大きく表示されていますが、下に6枚、上の図の部分図が表示されています。絵で描かれている分子の部分をクリックすると、分子の名前が英語で表示され、ダブルクリックすると分子の情報を英語で詳細に書いてあるページが開きます。以下の図はこのサイトの使い方の一例です。
図の中の細胞と細胞の接着部位にある分子をクリックしてみましょう。

マウスカーソルが指に変わって、n-cadherinという分子名が表示されます。これはN-cadherinです。

下の図に示すように、各図の左上にSelect a pathwayと書かれているプルダウンメニューがあります。プルダウンして、Cell Structureを選んでみましょう。以下のような細胞の構造に関わっている分子とその分子名が一斉に表示されます。これでチューブリンだのアクチンだのがどこにあるかが一目瞭然ですね。それぞれの分子をクリックすると分子の解説ページが開きます(何故かN-cadherinの場合は開きませんでした)。

この図で灰色っぽい白に表示されているのは、細胞膜です。上の細胞と下の細胞が結合している部分にN-カドヘリンがびっしり膜から生えているように見えるのがわかると思います。この接着部位は、接着結合(adherens junctions)あるいはその一例である 細胞をぐるっと取り囲む接着帯(adhesion beltあるいはzonula adherensとも言う)と呼ばれています。図の細胞膜の表面(図の左上のすみのほう)には、プロテオグリカンの一種であるperlecanが描かれています。図をひらいてみていろいろクリックしてみて細胞がどんな分子で構成されていて、それぞれの分子がどこにあるかなどをみてみてください。
このMcGillさんたちが作った図では分子の密度は実際のものより薄まっていると書かれています。実際はもっと細胞内は分子が込み合っているようです。