Mathematicaの紹介です!

ヒマワリもアサガオもそろそろ花の数が減ってきて秋を感じさせる毎日です。さて今日はMathematicaの紹介です。MathematicaはStephen Wolframという人が開発した有料ソフトで数値計算と数式処理ができますし、最近では画像や音声、信号処理、機械学習、統計解析、バイオインフォマティクスなど広範囲で利用されています。Pythonなどのプログラミング言語に比べてプログラムが格段に簡単で、自然言語での入力も可能になるなど科学の研究、学習には必須といってよいソフトでしょう。先日、微分方程式の解き方の講演があったのでオンライン参加してみました。講師の丸山 耕司先生は理論物理(御専門は量子情報、量子制御理論など)出身の方で、Wolfram社のブログなどの他、雑誌「数理科学」に寄稿されたり、「動かして学ぶ量子コンピュータプログラミング」(O’Reilly Japan)という本の監修、そして量子力学の定番教科書サクライの現代の量子力学 第2版(最近原書の第3版がでています)の問題解説(演習 現代の量子力学 第2版 J.J.サクライの問題解説)(吉岡書店)の著者の方でした。微分方程式の解き方の基本のキから学べる講義でしたので、以下のリンクから無料登録して講演をご覧になるのをお勧めします。https://www.bigmarker.com/series/solving-differentialequations-ja/series_details?utm_bmcr_source=twitterまたWolfram Japanのtwitterにこの講義の他、Mathematicaによる微分積分学入門など関連したいろいろな情報がでているので参考にしてください。リンクはこちらです。
https://twitter.com/WolframJapan

MathematicaはWolfram言語というプログラミング言語で動くソフトです。Wolfram言語は、日常言語とかわらない命令もうけつけるように設計されていて、プログラミング初心者にもきわめてやさしい、そして短いコードで、高度なプログラムが書けるすぐれたソフトウエアです。Wolfram言語の入門書としては開発者のWolframの書いたAn Elementary Introduction to the Wolfram Language 第2版がおすすめです。この開発者自身が書いたWolfram 言語(Mathematicaで使われているプログラム言語)の解説本は以下のリンクで無料で読める他、オンラインでWolfram 言語を使って学習できるので興味のある方は下のリンクにアクセスしてみてください。
https://www.wolfram.com/language/elementary-introduction/2nd-ed/

癌の糖鎖生物学―NIH videocastの紹介です

秋が深まってきたようで、近所では稲刈りの真っ最中です。今日からこのブログのスタイルをちょっと変更して、短い記事をこまめに投稿していこうと思います。長い記事は書くのに時間がかかるので、こちらは今までと同じ頻度になると思います。

いつも紹介しているNIHのvideo castのサイトに今月(2021年)9月16日と9月17日にわたって開催されたGlycobiology of Cancerという講演会の動画リンクがアップロードされています。初日の16日の分がこちら2日目の17日の分がこちらにありますので画面左下の+Moreの部分をクリックして開く画面で、Downloadのボタンをクリックしてダウンロードしてご覧ください。画質はビットレートで、1240k、1440k、1840kの三種類が選べます。ダウンロードした動画は、f4vファイルという形式で作成されており、1840kの場合は2ギガちょっとのサイズですのでダウンロード先の空き容量を確かめてからダウンロードしてください。f4vファイルはMPC-HCなどの無料版動画プレーヤーで再生できます。英語がちょっとと思われる方は同じDownload画面に、スクリプトのダウンロードリンクもありますので、まずは英語の講演のスクリプトをダウンロードして、それを眺めながら自分の興味のある講演だけをみるとよいと思います。
下には講演の演目を並べておきます。

一日目(September 16, 2021)1:00-5:00p.m., EDT
Session I: Cancer Progression & Metastasis(Chair, Dr. Karl Krueger, Program Director, NCI)
1:00p.m., Dr. Gerard C. Blobe, Duke University Medical School
Loss of ALK4 Function Promotes Cancer Progression Through Reprogramming of Receptor Glycosylation
1:30p.m., Dr. Kevin Yarema, Johns Hopkins Medical School
Metabolic Glycoengineering Labeling of Sialic Acid for Early Cancer Detection
2:00p.m., Dr. Prakash Radhakrishnan, University of Nebraska Medical Center
Cancer-associated Short O-glycans in Pancreatic Cancer Malignancy
2:30p.m., Dr. Charles Dimitroff, Florida International University
The Role of Hypoxia Driving Melanoma Glycobiology Signature

Session II: Diagnostics & Therapeutics(Chair, Dr. Neeraja Sathyamoorthy, Program Director, NCI)
3:15p.m., Dr. Joseph Contessa, Yale University Medical School
Developing an Inhibitor of N-glycosylation for Cancer Therapy
3:45p.m., Dr. Steven Banik, Stanford University
Targeted Protein Degradation from the Extracellular Space
4:00p.m., Dr. Mia L. Huang, Scripps Department of Molecular Medicine
Tools to Discover and Surveil Glycoconjugate Targets in Cancer Biology
4:15p.m., Dr. Dannielle Engle, Salk Institute for Biological Studies
Interception of the Aberrant Glycan CA19-9 in Pancreatic Disease
4:30p.m., Dr. Edgar Engleman, Stanford University School of Medicine
Targeting Dectin-2 for Tumor Immunotherapy
5:00p.m., Adjourn

二日目(September 17, 2021)1:00-5:15p.m., EDT
Session III. Cell Signaling (Chair, Dr. Neeraja Sathyamoorthy, Program Director, NCI)
1:00p.m., Dr. Mauricio Reginato, Drexel University
O-GlcNAcylation: Linking Signaling and Metabolism in Cancer
1:30p.m., Dr. Virginia Shapiro, Mayo Rochester
ST8Sia6 Promotes Tumor Growth in Mice by Inhibiting Immune Responses
2:00p.m, Dr. Anita Hjelmeland, University of Alabama Birmingham
A Protumorigenic Role for ST6Gal1-Mediated Sialylation in Brain Tumor Initiating Cells
2:30p.m., Dr. Thomas Clausen, University of California San Diego
Binding of Malarial VAR2CSA to Oncofetal Chondroitin Sulfate Depends on Sulfation and Ligand Accessibility

Session IV. Glycoproteomics & Informatics (Chair, Dr. Karl Krueger, Program Director, NCI)
3:15p.m., Dr. Richard Drake, Medical University of South Carolina
Integrated Workflows for Carbohydrate Antigen Immunohistochemistry, N-glycan Imaging Mass Spectrometry and Targeted Glycoproteomics on the Same Tumor Tissue Slide
3:45p.m., Dr. Stacy Malaker, Yale University
Revealing the Cancer-Associated Mucinome
4:00p.m., Dr. Hui Zhang, Johns Hopkins School of Medicine
Characterization of Human Cancers by Glycoproteomics
4:30p.m., Dr. Raja Mazumder, George Washington University
Exploring Cancer Mutations and its Effect on Glycosylation Sites Using GlyGen Supersearch
4:45p.m., Dr. Lingjun Li, University of Wisconsin
Development and Application of Chemical Tags for Quantitative Glycomics and Glycoproteomics
5:15p.m., Adjourn
今日も長くなりましたが、面白そうな講演なので是非聴いてみてください。

ハワイの国立天文台すばる望遠鏡からのライブ中継

楽しかったオリンピックも終わってしまいましたね。夏空を眺めるには絶好の季節ですが、もうすぐペルセウス座流星群がみられます(もう始まっていて、極大は8月13日4時頃だそうです)。(末尾に2021/08/14の追記があります)

夜空を見上げるのも楽しい季節ですが、ネットでは国立天文台すばる望遠鏡(ハワイにあります)からみた夜空のライブ中継が今見られます。朝日新聞と国立天文台のYouTubeでのコラボのようです。きれいなペルセウス流星群の流星がみられるかもしれませんね。ライブ中継ですので終わって見られなかった人はこのリンクから当日のライブ中継を探してください。朝日新聞宇宙部のチャンネルです。

竹内薫さんによると、宮澤賢治の「銀河鉄道の夜」の舞台、銀河の祭り(ケンタウル祭り)の夜は、ペルセウス座流星群の舞う8月12日深夜から8月13日未明にあたるだろうとのことです。

銀河鉄道の夜は青空文庫などで読めます。いろんな版がありますが、ここにはもっとも古い版の「銀河鉄道の夜」へのリンクをはっておきます。

(以下は2021/08/14追記しました。)
昔、宮澤賢治の作品が読めて、「銀河鉄道の夜」の初稿から最終版までの変遷などもわかりやすくまとめていただいているサイト、「森羅情報サービス」(和歌山在住の宮澤賢治の研究家 渡辺宏さんの作成されたホームページhttp://why.kenji.ne.jp/)を推薦していたのですが、ご病気で更新がなくなりサイトもなくなってしまいました。ただInternet ArchiveのWayback Machineにはこのサイトのほとんどのページが残っていますので興味のある方は是非ご覧ください。貴重な素晴らしいサイトです。

例えば童話は
https://web.archive.org/web/201604170716さん54/http://why.kenji.ne.jp/douwa/douwa_f.html

ホームページトップは以下に保存されています。
https://web.archive.org/web/20160410021135/http://why.kenji.ne.jp/index.html

英単語の発音を調べるサイト―FASTA, GWAS, RNAseq, glycocalyx, Entrezなど正しく発音できますか?

毎日うだるような暑さですがお元気でしょうか。今日は英語の話です。
英語で発表しようとする時や、会話のとき、この単語の発音でいいのかな?と思うことがよくあります。そんなときはYouGlishというサイト(リンク集にいれてあります)にアクセスして、検索窓に発音を調べたい単語を入れて、Say It!というボタンを押しましょう。するとYouTubeの音声コーパスからその単語を含む動画を選び出して再生してくれます。動画の下には、その単語を含む文(字幕)が表示されます。いくつかの動画をみて比較したいときは、次の動画のボタンを押すと別の動画が同様に再生されます。これは便利なサイトです。Improve your English pronunciation using YouTubeというタイトルのサイトです。

ブックマーク必須のサイトですので、是非試してみてください。
以下はこのサイトを使ってみるための 練習問題です。それぞれの単語を検索窓にいれて発音を調べてみてください。面白い動画も見つかると思います。

RNAseq  (アール・エヌ ・エー・セックという人が多いですが‥本当はどう発音するでしょう)
glycocalyx (細胞表面を覆っている糖衣)
sialic acid  (シアル酸)
GWAS (ゲノムワイド関連解析―この解析でABO式血液型物質合成遺伝子と血液凝固に関係があることや、新型コロナウイルスの劇症化とABO式血液型が関連することも解明されています)
FASTA  (塩基配列やタンパク質のアミノ酸配列を記述する標準記載形式です。ファスタという発音も正しいですが、ファストエイと読む人も多いです)
Entrez (NCBIのデータベースの入り口ですが、フランス語として読むようです), genome (ゲノムですが英米人の発音はどうでしょうか?)
Lucretius (ルクレチウス)
などなど、いろいろ遊んでみてください。

出てくる動画は、基本的なものが選ばれているので、動画をはじめから見るのも勉強になりますよ。

写真は散歩の途中でみつけた錦鯉です。なんと川の中を泳いでいます。梅雨入りのころには上流500メートルあたりに泳いていましたが、梅雨の増水で流されたようで少しづつ下流へ移動して今は橋の下で悠々と泳いでいます。これを書いている最中に町内で野生のサルが出没しているので出会ったら家の中に避難するようにという放送が入りました。イノシシやタヌキは時折見かけますが、サルは怖いですね。京都の家の柿の木には毎年サルが実を食べにやってきていました。飼っていた犬が木の上にいるサルに吠えて、まるで絵本のような情景でした。近くの駅では、小学校の下校時にサルが電車の駅のベンチに座っていて、子供たちが逃げるようにして電車に乗り込んでいたそうです。昔の話です。

AlphaFoldを試してみています―生物学の革命:タンパク質の立体構造を驚異的精度で予測するGoogleのAI

7月16日早朝、アミノ酸配列を入力すると、その配列をもつタンパク質(蛋白質)の立体構造をほぼ完璧に予測できるというGoogleのDeep Mind系列の人工知能ソフトAlphaFold2の論文とソフトが公開されて、ものすごい反響を呼んでいます。
生物学の革命を今まのあたりにしているのだと思います。タンパク質の立体構造を予測するプログラムのコンテストで驚異の成績で優勝したソフトです。コンテストは、構造解析の実験で立体構造がわかっているがまだ立体構造が未公開のタンパク質のアミノ酸配列を問題として与えて、参加したグループが立体構造の予測を競うというものです。ここのところあまり良い結果がでていなかったそうです。そこに突如参加したAlphaFoldというGoogleのグループが初回でトップの成績をあげ、二回目の去年の大会では、改良版AlphaFold2がほとんどの問題で実験結果とぴったりの予測に成功して世間を震撼させたのでした。このソフトとアルゴリズム、AIの学習データセットの公開が待たれていたのですが、ついに公開されて全世界でAlphaFoldがブームになっているようです。7月16日早朝、雑誌Natureに論文が公開されて
https://www.nature.com/articles/s41586-021-03819-2
プログラムも一般公開されました。
https://github.com/deepmind/alphafold

プログラムの導入方法や使い方については、以下の森脇 由隆さんの記事が最高にわかりやすいのでご覧ください。
https://qiita.com/Ag_smith/items/7c76438906b3f665af38

Twitterも参考になります。https://twitter.com/Ag_smith
上の記事によると使用するコンピュータはlinuxの動くパソコンでメモリが32ギガバイトから64ギガバイト(それ以上ならなおよいでしょう)、ディスク容量はデータベースをダウンロードする必要があるので4テラバイト以上必要です。計算スピードが必要なので高速のSSDドライブを使うのがいいそうです。M.2 SSDという最新型のドライブ(メモリーみたいに差し込むだけで使えるのでSSDをつなぐケーブルとかがないものです)のパソコンがおすすめです。グラフィックボードはRTX3060以上がよいそうです。この森脇先生はRyzen9 5900X, RTX3090, HDD 8TBで使った場合、二時間余りで立体構造の計算結果がでるとTwitterに書かれていました。

残念ながら私のパソコンはこのスペックではなかった(ディスク容量不足など)ため、新たに購入する必要がありそうです。ただグラフィックボードはビットコインのマイニングで品薄となっていて昔10万したものが倍の値段になっていたりするので、あまりこれにお金はかけずに第四世代のPCIe (PCI express:Peripheral Component Interconnect Express)対応のマザーボードとPCIe 4.0対応のM.2 SSDで高速化を図るほうがよいと、阪大の先生からアドバイスをもらいました。

ということで、自分のパソコンでは動かないので、パソコンを組み立てる前に、Google Colaboratoryで利用できAlphaFold2を使ってみることにしました。Googleのアカウントを取得しておいて、以下のurlからアカウントとのログイン名とパスワードを使ってログインして使います。
https://colab.research.google.com/drive/1LVPSOf4L502F21RWBmYJJYYLDlOU2NTL
使い方は簡単で、アミノ酸配列を入力部分にペースト、上のほうにあるランタイムのプルダウンメニューからランタイムのタイプを変更を選んでGPUを使うに設定し保存、その後入力アミノ酸配列を確認して、ランタイムからすべてのセルを実行を選んで開始します。

さっそく私達が解析していたN型糖鎖の合成の第一段階で働く酵素DPAGT1の線虫版algn-7遺伝子産物を解析してみました。2時間弱で解析がおわりました。結果が冒頭の写真です。5つの予測結果が返ってきてダウンロード可能です。このサイトに書いてあるように、GPUの割当が不足で計算が途中で止まることもある(たとえば全長2300アミノ酸のタンパク質を解析しようとしたらだめでした)ようですが、1000アミノ酸程度の長さのものなら1-2時間で解析が終わります。

ところがビッグニュースが今日とびこんできました。なんと21の生物種のプロテオームのAlphaFold2による解析がすでに終了しており、その解析結果がダウンロード可能になっています。要するに21種の生物の全タンパク質のAlphaFold2による立体構造解析結果が一括でダウンロードできるというわけです。
ヒト、マウス、ゼブラフィッシュ、シロイヌナズナ、大腸菌、線虫C. elegansなど主なモデル生物種が網羅されています(以下のリンクをクリックしてください)。私は早速 線虫のタンパク質の解析結果をダウンロードしました。
https://alphafold.ebi.ac.uk/download

For downloading all predictions for all species, visit the FTP site:
ftp://ftp.ebi.ac.uk/pub/databases/alphafold
だそうですので、ftpでダウンロードするのもよいでしょう。

ダウンロードしたプロテオームファイルはtar圧縮ファイルなのでWindowsのパソコンなら7-zipなどの解凍ソフトで解凍します。
解凍されたファイル(まだgz拡張子がついた圧縮ファイルです)にはファイル名にUniprotのタンパク質登録名が入っています。たとえば上で解析したN型糖鎖合成の第一段階をつかさどる酵素(algn-7遺伝子の作る酵素)の立体構造解析の結果を調べたいとします。このタンパク質はUniprotではQ9U1Z2という登録名なので、解凍したフォルダのなかでQ9U1Z2という名前の入っているファイルを検索します。
するとファイル名がAF-Q9U1Z2-F1-model_v1.pdb.gzとAF-Q9U1Z2-F1-model_v1.cif.gzという二つの圧縮ファイルが見つかりました。これらをそれぞれ7-zipで解凍してできるのがAlphaFoldによる予測結果です。
解凍してできたpdbファイルはオンラインでは
https://www.ncbi.nlm.nih.gov/Structure/icn3d/full.html
にアクセスしてパソコンのファイルを指定してloadすれば、立体構造を手軽にみることができます。以下の写真がダウンロードしたpdbファイルを表示した写真です。私が昨日解析した上の結果とほとんど同じです。

またcifファイルはJmolとかで読み込めば立体構造が簡単にみられます。Jmolのダウンロードは以下から可能です。
http://jmol.sourceforge.net/
Jmolの使い方はここにあります。要するにjmol.batというファイルをダブルクリックしたら使えるので簡単です。
https://katakago.sakura.ne.jp/soft/jmol/jmol-pc.html

Uniprotにもヒトのタンパク質についてはAlphaFold2の予測結果は掲載されているようですが、まだ掲載されていない生物種も多いのでこのダウンロードファイルは貴重ですね。

(おまけの追記です。2021/07/24)
以下のリンクに詳しい説明とダウンロードリンクもあります。
https://insideuniprot.blogspot.com/2021/07/alphafold-structure-predictions-freely.html
このリンクにある記事を参考にヒトのタンパク質のAlphaFoldによる解析例を紹介します。ヒトの遺伝子の例として、私達が以前研究していたコンドロイチン合成酵素chondroitin synthase 1 (CHSY1)についてみてみましょう。UniprotでCHSY1とhumanの二語を検索窓に入れて検索すると、一番上の検索結果にQBX52というのがあります。
https://www.uniprot.org/uniprot/Q86X52
これをクリックしてみると、このタンパク質についてのすべてが載っているのですが、Structureの項目を探してみると、そこにAlphaFold2による予測結果が載っています。そこにあるAlphaFoldというリンクをクリックすると予測結果のページが表示されますのでご覧ください。
https://alphafold.ebi.ac.uk/entry/Q86X52

カエルの王様バラの中に―Wikipediaのダウンロード法

お昼前に買い物から帰って家に入るとき、奥さんが「わっ、 カエルがいる!」と叫んでカメラをとりにきました。さっそく見にいくと、バラの花の中にアマガエルがくつろいでいました。写真は奥さんが撮影した薔薇の花の中でくつろぐ、アマガエルです。去年も5月にアマガエルをみかけましたので、花の中で虫を取っているのかもしれません‥‥。

さて今日の本題です。Wikipediaのデータをダウンロードしておいて、インターネットにつながずに利用する方法があるそうです。やってみると今後いろいろWikipediaの利用法が拡がると思います。やりかたはKiwixというフリーソフトをダウンロードしておいて、これでWikipediaのデータ(zimファイルというファイル形式です)をダウンロードして利用するだけです。日本語のページはこちらです。英語版の完全版だと83Gくらいのデータのダウンロードが必要ですので、もっとサイズの少ない日本語版とか、ずっと小さなサイズの分野別Wikipediaとかをつかって練習してみてから、巨大ファイルのダウンロードに挑戦するべきでしょう。

以下はKiwixの日本語版ページからの引用です。
「Kiwixは非常に簡単です。Kiwixは利便性を考えたさまざまな機能があります。

  • 全文章からの検索
  • お気に入りとメモ
  • HTTPサーバー
  • PDF形式、HTML形式にエクスポート
  • 100言語以上のUI(ユーザーインターフェース)
  • タブによるネットサーフィン
  • 記事をまとめたウィンドウマネージャーとダウンローダー
  • その他さまざまな機能…
    WikipediaだけではなくてWiktionaryなどもダウンロードできます。英語版、フランス語版、ドイツ語版その他各国語版のWikipediaもありますので必要なものからダウンロードして使ってみてください。

科学英語の書き方についての無料オンラインコース(スタンフォード大学医学部)の紹介です

五月になってあたりは緑と花にあふれています。

今日はゴールデンウイークなので無料のオンライン英語コースの紹介です。連休中にちょっと見てみるといいと思います。スタンフォード大学医学部の准教授(疫学や統計学、およびwritingの専門家)のかたがやっているオンラインコースです。

登録して無料で受講することもできますし、
https://www.coursera.org/learn/sciwrite
過去のビデオは下のリンクをクリックしてYouTube動画のリストを表示して見られますので、それを順番にみるだけでも勉強になります。YouTubeでは字幕もだせるので、聞き取りの練習にもなると思います。
https://www.youtube.com/channel/UC-wb-n89yM0lBiP2QltsDaA/videos
が過去ビデオの一覧です。下のビデオはイントロです。

写真は、近所に咲いていた藤の花とキンラン(金蘭)の花です。今年のキンランは例年の花にくらべてとても元気がよくて花もしっかり開いていました。どちらの花も4月下旬の撮影です。拡大するには画像をクリックしてみてください。

データサイエンス向けにおすすめの統計学の教科書の紹介です

インターネットをみていると、初心者向きの統計学の教科書を見つけました。「データ分析のための統計学入門 原著第4版 “OpenIntro Statistics Fourth Edition”」という本で、日本統計協会から翻訳本が市販されています。この本は訳者のお一人である国友直人先生のweb pageにpdfがおいてあるので無料でダウンロードして読むことができます。
原本のOpenIntro Statisticsという本は無料公開されており、上の訳本の中でも関連サイトが詳しく紹介されています。この訳本では問題の解答は省略されていますが、英語の原本pdfには練習問題の一部の解答が載っているので原本をダウンロードして合わせて使うとよいでしょう(上にあるリンクの本の購入ページでYou Pay 15$とある部分のスライダを左に動かして0ドルにしてcartにいれ、購入手続きでemailアドレスをいれるとダウンロードできます。0ドルの領収書がメールで送られてきます)。英語のサイトには解説ビデオ(下のほうにvideoのリンクがあります。クリックするとYouTubeビデオが開くので字幕オンにしてみるとよいです)やRプログラミング言語での勉強用リンクもあります(各章の表題の下の部分にある Software LinesというリンクをクリックするとRやRStudio、Pythonその他でのコードのページが開きます。たとえばChapter  5. Foundations for Inferenceの下にあるIntro to Inferenceの部分をクリックして開いたページでLab: R (Base)とある部分をクリックするとこんなページが開きます。Pythonコードのページとかもありますので適宜利用してください。)また訳者によるRの簡単なイントロも訳本のページ(R・エクセル・基礎数学と題したpdf)にあるのでご覧ください。データそのものはzipファイルでダウンロードできますし、こちらにはR用のデータやデータのcsvファイルなどもそろっています。またRのパッケージとしてもデータが公開されているのでR でパッケージを読み込んで使うこともできます。
医学生物学向きには同様な無料本(Harvard大学の先生が書いたものです)
Introductory Statistics for the Life and Biomedical Sciencesがあります。こちらは英語版ですが、上の本と同様にRのコードへのアクセスリンクもスライドもありますので、よかったらダウンロードして読んでみてください。

4月11日の日曜日は快晴で青空がとても綺麗な一日でした。我が家のリンゴの木にも沢山花が咲きました。

当日は県知事選挙の日。病気で九大病院に入院された小川知事の辞職にともなって実施される福岡県知事選挙の投票に歩いてでかけました。丁度お昼どきだったので会場には投票する人が、私達二人をふくめて3人しかいません。会場のコロナ対策は万全でした。換気万全の投票所ですが、まず入り口にアルコール消毒液が備えられていて手指を消毒、その後非接触型体温計で体温を測り入場します。投票券をマスクの職員の方に手渡すと、手袋した手で受け取り、アクリル遮蔽板を介してやり取りします。あとは投票用の消毒済み鉛筆と投票用紙を手渡されて記入台で候補者名を書いて投票です。鉛筆はそこで回収されます。コロナ蔓延下での選挙も何度も行われているので対策も洗練されてきた感じがします。選挙結果は予想通り、8時の開票と同時に当選確実がでるというものでした。COVID-19下での選挙制度の洗練度を確認できてよかったです。

Pythonや物理数学の無料本―春のおすすめ本

(注:このブログでは、12ポイント太字の部分はリンクです。クリックすると該当ページが開きます。)
暖かくて春めいた日が続きます。4月上旬の暖かさとか。九州大学でも前期日程の合格発表が昨日(3/08)あったそうで、ニュースで合格した学生さん達の喜びの声を報道していました。
写真は散歩の途中でみつけたスミレと つくしです。近所では1週間以上前にうぐいすの初鳴きを聞きました。

最近、Pythonの教科書を京大が公開しているのを知りました。プログラミング演習Python2019という講義の教材です。初歩からはじめてグラフィックインターフェイスでのプログラムまでやさしく指導してくれる本で本篇とコラムを集めた本の二冊があります。以前紹介した本の後に読むのに最適だと思います。Anacondaのインストールをした後、この本からPythonの勉強をはじめることも可能だと思います。

また以前紹介していた学習院大学の田崎先生の「数学:物理を学び楽しむために」という本もバージョンアップされていますので紹介しておきます。これは序文によると「物理学(とそれに関連する分野)を学ぶ方を対象にした、大学レベルの数学の入門的な教科書である。高校数学の知識を前提にして、大学生が学ぶべき数学をじっくりと解説する。」という本です。著者の田崎先生のtwitterでは「大学入試が終わって入学までの時間をもてあましている理数系のみなさんに特におすすめします。1章に目を通した後はお好きなところをどうぞ。」と紹介されています。またtwitterには物理や数学よりデータ科学や AI に興味があるという人は 7 章から始める(必要なら前の章を読む)のも一興かも。高校数学から消えた最強武器である行列がガチで学べて、主成分分析、マルコフ連鎖、Google Page Rank への応用まで!」とあります。面白そうでしょう!

Clonezillzaの使い方―LinuxやWindowsのまるごとバックアップのやり方

(注:このブログでは、12ポイント太字の部分はリンクです。クリックすると該当ページが開きます。)
日経Linux2020年11月号の付録にClonezilla 2.6.7-28のISOファイルがついていました。このソフトはLinuxやWindows(MacやChromeOS、アンドロイドなども可能)のシステムを、まるごとバックアップをするフリーソフトでここからダウンロード可能です(最新版は2.7.0-10)。使用しているブロックだけをバックアップするので、短時間でイメージやクローンがつくれます。ちょうど今まで利用していたLinux LTS版(ubuntu 16.04 LTS)のサポートがきれていたので、現在の環境をClonezillaでバックアップしておいて、最新版のLTSを入れなおすことにしました。
このソフトはNorton GhostとかTrue Imageとかいう有料ソフトと同様なソフトで、Windows やLinux、Macなどのイメージをつくっておいて、必要になったらそのイメージから現在のシステムを復活する(リストアする)ことができます。
注意点ですが、このソフトでは、まずバックアップ先を指定した後、バックアップするシステムを指定するという順番でバックアップします。つまりバックアップ用の外付けハードディスあるいはUSBメモリなどをまず指定し、その後、現在使っていてバックアップしたいドライブ(バックアップ元といわれるもので、複数同時指定可能)を指定してバックアップするのです。
ネット検索してみても日本語で使い方の詳しい説明をしているサイトがあまりなかったので、以下に具体的なやり方をまとめておきます。
1)まずClonezillaのサイトからClonezilla LiveのISOイメージファイル (ubuntuベースのものでなくて、DebianベースのものでOKです)をダウンロードします。ダウンロードしたISOファイルから起動用USBメディアをEtcherというソフトを使って作成します。EtcherというこのソフトはWindows, Mac, Linuxなどに対応しており、一発で起動用USBを作成できるソフトです。イメージファイルのありかを指定し、USBメモリを選び、ボタンを押すだけでブート用USBメモリができあがります。前に紹介したRufusというソフトも利用できますが、Etcherのほうが簡単です。(もちろんClonezillaのISOイメージをCDやDVDに焼いて、CDやDVDから起動して利用することもできます。)
2)次に、システムのイメージを保存するUSBドライブあるいはハードディスクドライブなどを決めて、その中にイメージ保存用のフォルダを作っておいてください。英語名のフォルダを作っておきます。(私は今回はCloneZilla_demoという名前のフォルダにしました。)ディスクにパーティションを切ってある場合は、どのパーティションを保存先に選ぶかを、容量や大事なファイルの有無(万が一のエラーでファイルが壊れることもあるかと思います)などを考慮してきめます。重要なファイルが入っているディスクやパーティションは壊れると怖いので、大事なファイルは別の場所にバックアップしておくことを薦めます。私は何もファイルがはいっていないパーティションにイメージ保存用のフォルダを作りました。まっさらのUSBメモリだとより安心ですね。保存用のフォルダを中に作成できたら、準備は完了です。

3)上の1)で作成したブート用USBメモリをパソコンに差し込んで起動します。Clonezillaが起動します。起動しない場合はUEFIのブートメニューを(F11キーなどマザーボードに応じたキーを押して)表示してUSBメモリを選べば起動します。古いパソコンでBIOSのもの(legacy BIOS)では起動順序をUSB優先に変えなくてはいけないかもしれません。うまくブートメディアから起動したら次に進みます。
4)上の写真のような起動画面が表示されますので、一番上のデフォルト(Clonezilla live)のままエンターを押す、あるいはしばらく放置しておくと下の写真のような言語選択画面になります。矢印キーで日本語を選びます。enterを押して次に進みます。
5)「キーボードのレイアウトを変更?」の画面、デフォルトのキーボードレイアウト(英語キーボード)を維持の選択のままenter。
6)Clonezillaを開始します のメニューがでます。そのままenter。
7)Clonezilla-オープンソース複製システム(OCS)という画面が開きます。今回はディスクイメージを作って保存したいので、開いたメニューで一番上にある「device-image ディスク/パーティションイメージ」(デフォルトで選ばれている)を選んだままenter。
8)Clonezilla  イメージディレクトリのマウントという画面がでます。(ここからがイメージの保存先の設定になります)一番上の「local_dev ローカルディスク(例=ハードディスク、USBドライブ)をマウント」が選ばれているのでそのままenter。
すると、次の写真のように「Clonezilla イメージリポジトリとしてUSBディバイスを使用したい場合」というメッセージが下部に表紙されるので、イメージ保存用のUSBディバイスを接続します。5秒以上待つとUSBディバイスが認識されるのでenter。
9)すると画面がかわって、現在認識されているストーレッジの一覧が表示されます。イメージを作ろうとしているハードディスクと、さっき接続したイメージ保存用のUSBディバイスが表示されているのを確認してください。皆さんのパソコンによりますが、例えば/dev/sda、/dev/sdb、/dev/sdcなどと表示されると思います。私のパソコンの場合、sdaがSSDでメインディスク、sdbが補助のハードディスクで、sdcは今接続した外付けハードディスクです。これで全部のドライブが表示されているのでCtrl-Cを押します(Ctrlキーとcを同時に押します)。上の写真ではsda、sdb、sdcなどの後に表示されているハードディスクの型番などを消してあります。

10) こんどは「Clonezilla-オープンソース複製システム(OCS)|モード」という画面になります。
さきほど表示されたsda、sdb、sdcのそれぞれのディスクの詳細が表示されています(上の写真)。私の場合はsdcのパーティションsdc2にイメージを保存する予定なので矢印キーでsdc2を選びます。enter。(註:この写真の場合、sda1は200.9Gのext4形式でフォーマットされているSDDであり、sdb1は1.8テラバイトのディスク、sdc1は2Tバイトのntfs形式でフォーマットされているボリューム(パーティション)、sdc2も同様で、sdc3は1.6Tバイトのntfs形式でフォーマットされたボリューム(パーティション)だとわかります。写真ではsda1, sdb1などのディバイスのメーカー型番などは消してありますが本当はIn_以下の部分に詳しく表示されています。)
11) 次は「Clonezilla イメージリポジトリ用のディレクトリブラウザ」という画面になります。私の場合、sdc2を選んだのでその内容が表示されています。いちばん上にあるゴミ箱recycling binが選択されていますが、あらかじめ2)で作っておいたCloneZilla_demoというディレクトリにイメージを保存するので、矢印キーでそれを選びます。選んだらenter。
12)次は保存先の最終確認画面になります。/dev/sdc2[/CloneZilla_demo/]というように、保存先として選んだディレクトリが表示されているので、画面の指示どおり、Tabキーを押してDoneを選択します。そしてenter。するとこの画面の画面下部に黒地に白で保存先の容量と名称などが表示されます(下の画像)。OKなのでenter。
13)画面が替わって、「Clonezilla-オープンソース複製システム(OCS)」の画面で初心者モードを選べる画面となります。デフォルトで選択されている初心者モードを選んでenter。
14)次は「モードを選択してください」 の画面です。「ローカルディスクをイメージに保存」を選びます。enter。(他にパーティションをイメージに保存するモードも選べます。)
15)すると「イメージの保存名を入力してください」という画面になります。西暦と月日からなる保存名がついています。そのままでもいいです。enter。

16)ここからは、 いよいよ保存したいローカルディスク(コピー元)の選択画面となります。私の場合は、sdaとsdbを保存したいのでスペースを押してまずsdaを選択。次に矢印キーで下のsdbを選び、スペースを押してsdbも選択します。選択完了したドライブには先頭に星印*がつきます。17)次の画面は、「Clonezilla 拡張パラメータ| モード savedisk」という画面で、圧縮オプションの選択画面となります。一番上の「zip 並列 GZIP圧縮を使用(マルチコア/SMP用)」でOKなのでこれを選んでenter。(画像は省略しました)
18)次は、ファイルシステムの保存前のチェックの画面となります。これはNTFSシステムを使っているwindowsでは使えません。Linuxなどではチェック可能ですなどと書かれています。今回はディスクに問題はないので、「元ファイルシステムのチェック/修復をスキップする」を選んでenter。

19) イメージ保存後、保存イメージが復元可能かどうかのチェックをするかどうかのオプションです。「はい 保存イメージをチェックします」を選んでenter
20) 画面が替わって、イメージを暗号化しますか?の画面となります。暗号化しないのでそちらを選んでenter。
21)すべての処理の完了後に実行される操作の選択画面です。一番上の「すべての処理の完了時に実行する、再起動シャットダウン他を選択してください」というメニューのままでenter。下に黒地で緑のメッセージが表示されます。確認してenter。
22)すると緑のメッセージの下に、ずらーっとメッセージがならんで表示されます。この中には、これからイメージを作成するドライブについての情報があるので確認しましょう。黒地に黄色の文字で「次のステップは、このマシンのハードディスク・パーティションをイメージとして保存することです。本当に続けてよろしいですか?(y/n)」と聞いてきます。よろしければyを押します。これでイメージ作成が始まります。
23)進行状況の画面がしばらく表示されます。数時間以上かかると思いますので気長に待ちましょう。以下のようにイメージは復元可能ですというメッセージがでたらほぼ完了です。確認してenter。
24)すると次の画面がでます。この画面で矢印キーを使って、電源offを選んでenterで終了です。再起動その他も選べます。