AlphaFoldを試してみています―生物学の革命:タンパク質の立体構造を驚異的精度で予測するGoogleのAI

7月16日早朝、アミノ酸配列を入力すると、その配列をもつタンパク質(蛋白質)の立体構造をほぼ完璧に予測できるというGoogleのDeep Mind系列の人工知能ソフトAlphaFold2の論文とソフトが公開されて、ものすごい反響を呼んでいます。
生物学の革命を今まのあたりにしているのだと思います。タンパク質の立体構造を予測するプログラムのコンテストで驚異の成績で優勝したソフトです。コンテストは、構造解析の実験で立体構造がわかっているがまだ立体構造が未公開のタンパク質のアミノ酸配列を問題として与えて、参加したグループが立体構造の予測を競うというものです。ここのところあまり良い結果がでていなかったそうです。そこに突如参加したAlphaFoldというGoogleのグループが初回でトップの成績をあげ、二回目の去年の大会では、改良版AlphaFold2がほとんどの問題で実験結果とぴったりの予測に成功して世間を震撼させたのでした。このソフトとアルゴリズム、AIの学習データセットの公開が待たれていたのですが、ついに公開されて全世界でAlphaFoldがブームになっているようです。7月16日早朝、雑誌Natureに論文が公開されて
https://www.nature.com/articles/s41586-021-03819-2
プログラムも一般公開されました。
https://github.com/deepmind/alphafold

プログラムの導入方法や使い方については、以下の森脇 由隆さんの記事が最高にわかりやすいのでご覧ください。
https://qiita.com/Ag_smith/items/7c76438906b3f665af38

Twitterも参考になります。https://twitter.com/Ag_smith
上の記事によると使用するコンピュータはlinuxの動くパソコンでメモリが32ギガバイトから64ギガバイト(それ以上ならなおよいでしょう)、ディスク容量はデータベースをダウンロードする必要があるので4テラバイト以上必要です。計算スピードが必要なので高速のSSDドライブを使うのがいいそうです。M.2 SSDという最新型のドライブ(メモリーみたいに差し込むだけで使えるのでSSDをつなぐケーブルとかがないものです)のパソコンがおすすめです。グラフィックボードはRTX3060以上がよいそうです。この森脇先生はRyzen9 5900X, RTX3090, HDD 8TBで使った場合、二時間余りで立体構造の計算結果がでるとTwitterに書かれていました。

残念ながら私のパソコンはこのスペックではなかった(ディスク容量不足など)ため、新たに購入する必要がありそうです。ただグラフィックボードはビットコインのマイニングで品薄となっていて昔10万したものが倍の値段になっていたりするので、あまりこれにお金はかけずに第四世代のPCIe (PCI express:Peripheral Component Interconnect Express)対応のマザーボードとPCIe 4.0対応のM.2 SSDで高速化を図るほうがよいと、阪大の先生からアドバイスをもらいました。

ということで、自分のパソコンでは動かないので、パソコンを組み立てる前に、Google Colaboratoryで利用できAlphaFold2を使ってみることにしました。Googleのアカウントを取得しておいて、以下のurlからアカウントとのログイン名とパスワードを使ってログインして使います。
https://colab.research.google.com/drive/1LVPSOf4L502F21RWBmYJJYYLDlOU2NTL
使い方は簡単で、アミノ酸配列を入力部分にペースト、上のほうにあるランタイムのプルダウンメニューからランタイムのタイプを変更を選んでGPUを使うに設定し保存、その後入力アミノ酸配列を確認して、ランタイムからすべてのセルを実行を選んで開始します。

さっそく私達が解析していたN型糖鎖の合成の第一段階で働く酵素DPAGT1の線虫版algn-7遺伝子産物を解析してみました。2時間弱で解析がおわりました。結果が冒頭の写真です。5つの予測結果が返ってきてダウンロード可能です。このサイトに書いてあるように、GPUの割当が不足で計算が途中で止まることもある(たとえば全長2300アミノ酸のタンパク質を解析しようとしたらだめでした)ようですが、1000アミノ酸程度の長さのものなら1-2時間で解析が終わります。

ところがビッグニュースが今日とびこんできました。なんと21の生物種のプロテオームのAlphaFold2による解析がすでに終了しており、その解析結果がダウンロード可能になっています。要するに21種の生物の全タンパク質のAlphaFold2による立体構造解析結果が一括でダウンロードできるというわけです。
ヒト、マウス、ゼブラフィッシュ、シロイヌナズナ、大腸菌、線虫C. elegansなど主なモデル生物種が網羅されています(以下のリンクをクリックしてください)。私は早速 線虫のタンパク質の解析結果をダウンロードしました。
https://alphafold.ebi.ac.uk/download

For downloading all predictions for all species, visit the FTP site:
ftp://ftp.ebi.ac.uk/pub/databases/alphafold
だそうですので、ftpでダウンロードするのもよいでしょう。

ダウンロードしたプロテオームファイルはtar圧縮ファイルなのでWindowsのパソコンなら7-zipなどの解凍ソフトで解凍します。
解凍されたファイル(まだgz拡張子がついた圧縮ファイルです)にはファイル名にUniprotのタンパク質登録名が入っています。たとえば上で解析したN型糖鎖合成の第一段階をつかさどる酵素(algn-7遺伝子の作る酵素)の立体構造解析の結果を調べたいとします。このタンパク質はUniprotではQ9U1Z2という登録名なので、解凍したフォルダのなかでQ9U1Z2という名前の入っているファイルを検索します。
するとファイル名がAF-Q9U1Z2-F1-model_v1.pdb.gzとAF-Q9U1Z2-F1-model_v1.cif.gzという二つの圧縮ファイルが見つかりました。これらをそれぞれ7-zipで解凍してできるのがAlphaFoldによる予測結果です。
解凍してできたpdbファイルはオンラインでは
https://www.ncbi.nlm.nih.gov/Structure/icn3d/full.html
にアクセスしてパソコンのファイルを指定してloadすれば、立体構造を手軽にみることができます。以下の写真がダウンロードしたpdbファイルを表示した写真です。私が昨日解析した上の結果とほとんど同じです。

またcifファイルはJmolとかで読み込めば立体構造が簡単にみられます。Jmolのダウンロードは以下から可能です。
http://jmol.sourceforge.net/
Jmolの使い方はここにあります。要するにjmol.batというファイルをダブルクリックしたら使えるので簡単です。
https://katakago.sakura.ne.jp/soft/jmol/jmol-pc.html

Uniprotにもヒトのタンパク質についてはAlphaFold2の予測結果は掲載されているようですが、まだ掲載されていない生物種も多いのでこのダウンロードファイルは貴重ですね。

(おまけの追記です。2021/07/24)
以下のリンクに詳しい説明とダウンロードリンクもあります。
https://insideuniprot.blogspot.com/2021/07/alphafold-structure-predictions-freely.html
このリンクにある記事を参考にヒトのタンパク質のAlphaFoldによる解析例を紹介します。ヒトの遺伝子の例として、私達が以前研究していたコンドロイチン合成酵素chondroitin synthase 1 (CHSY1)についてみてみましょう。UniprotでCHSY1とhumanの二語を検索窓に入れて検索すると、一番上の検索結果にQBX52というのがあります。
https://www.uniprot.org/uniprot/Q86X52
これをクリックしてみると、このタンパク質についてのすべてが載っているのですが、Structureの項目を探してみると、そこにAlphaFold2による予測結果が載っています。そこにあるAlphaFoldというリンクをクリックすると予測結果のページが表示されますのでご覧ください。
https://alphafold.ebi.ac.uk/entry/Q86X52

Clonezillzaの使い方―LinuxやWindowsのまるごとバックアップのやり方

(注:このブログでは、12ポイント太字の部分はリンクです。クリックすると該当ページが開きます。)
日経Linux2020年11月号の付録にClonezilla 2.6.7-28のISOファイルがついていました。このソフトはLinuxやWindows(MacやChromeOS、アンドロイドなども可能)のシステムを、まるごとバックアップをするフリーソフトでここからダウンロード可能です(最新版は2.7.0-10)。使用しているブロックだけをバックアップするので、短時間でイメージやクローンがつくれます。ちょうど今まで利用していたLinux LTS版(ubuntu 16.04 LTS)のサポートがきれていたので、現在の環境をClonezillaでバックアップしておいて、最新版のLTSを入れなおすことにしました。
このソフトはNorton GhostとかTrue Imageとかいう有料ソフトと同様なソフトで、Windows やLinux、Macなどのイメージをつくっておいて、必要になったらそのイメージから現在のシステムを復活する(リストアする)ことができます。
注意点ですが、このソフトでは、まずバックアップ先を指定した後、バックアップするシステムを指定するという順番でバックアップします。つまりバックアップ用の外付けハードディスあるいはUSBメモリなどをまず指定し、その後、現在使っていてバックアップしたいドライブ(バックアップ元といわれるもので、複数同時指定可能)を指定してバックアップするのです。
ネット検索してみても日本語で使い方の詳しい説明をしているサイトがあまりなかったので、以下に具体的なやり方をまとめておきます。
1)まずClonezillaのサイトからClonezilla LiveのISOイメージファイル (ubuntuベースのものでなくて、DebianベースのものでOKです)をダウンロードします。ダウンロードしたISOファイルから起動用USBメディアをEtcherというソフトを使って作成します。EtcherというこのソフトはWindows, Mac, Linuxなどに対応しており、一発で起動用USBを作成できるソフトです。イメージファイルのありかを指定し、USBメモリを選び、ボタンを押すだけでブート用USBメモリができあがります。前に紹介したRufusというソフトも利用できますが、Etcherのほうが簡単です。(もちろんClonezillaのISOイメージをCDやDVDに焼いて、CDやDVDから起動して利用することもできます。)
2)次に、システムのイメージを保存するUSBドライブあるいはハードディスクドライブなどを決めて、その中にイメージ保存用のフォルダを作っておいてください。英語名のフォルダを作っておきます。(私は今回はCloneZilla_demoという名前のフォルダにしました。)ディスクにパーティションを切ってある場合は、どのパーティションを保存先に選ぶかを、容量や大事なファイルの有無(万が一のエラーでファイルが壊れることもあるかと思います)などを考慮してきめます。重要なファイルが入っているディスクやパーティションは壊れると怖いので、大事なファイルは別の場所にバックアップしておくことを薦めます。私は何もファイルがはいっていないパーティションにイメージ保存用のフォルダを作りました。まっさらのUSBメモリだとより安心ですね。保存用のフォルダを中に作成できたら、準備は完了です。

3)上の1)で作成したブート用USBメモリをパソコンに差し込んで起動します。Clonezillaが起動します。起動しない場合はUEFIのブートメニューを(F11キーなどマザーボードに応じたキーを押して)表示してUSBメモリを選べば起動します。古いパソコンでBIOSのもの(legacy BIOS)では起動順序をUSB優先に変えなくてはいけないかもしれません。うまくブートメディアから起動したら次に進みます。
4)上の写真のような起動画面が表示されますので、一番上のデフォルト(Clonezilla live)のままエンターを押す、あるいはしばらく放置しておくと下の写真のような言語選択画面になります。矢印キーで日本語を選びます。enterを押して次に進みます。
5)「キーボードのレイアウトを変更?」の画面、デフォルトのキーボードレイアウト(英語キーボード)を維持の選択のままenter。
6)Clonezillaを開始します のメニューがでます。そのままenter。
7)Clonezilla-オープンソース複製システム(OCS)という画面が開きます。今回はディスクイメージを作って保存したいので、開いたメニューで一番上にある「device-image ディスク/パーティションイメージ」(デフォルトで選ばれている)を選んだままenter。
8)Clonezilla  イメージディレクトリのマウントという画面がでます。(ここからがイメージの保存先の設定になります)一番上の「local_dev ローカルディスク(例=ハードディスク、USBドライブ)をマウント」が選ばれているのでそのままenter。
すると、次の写真のように「Clonezilla イメージリポジトリとしてUSBディバイスを使用したい場合」というメッセージが下部に表紙されるので、イメージ保存用のUSBディバイスを接続します。5秒以上待つとUSBディバイスが認識されるのでenter。
9)すると画面がかわって、現在認識されているストーレッジの一覧が表示されます。イメージを作ろうとしているハードディスクと、さっき接続したイメージ保存用のUSBディバイスが表示されているのを確認してください。皆さんのパソコンによりますが、例えば/dev/sda、/dev/sdb、/dev/sdcなどと表示されると思います。私のパソコンの場合、sdaがSSDでメインディスク、sdbが補助のハードディスクで、sdcは今接続した外付けハードディスクです。これで全部のドライブが表示されているのでCtrl-Cを押します(Ctrlキーとcを同時に押します)。上の写真ではsda、sdb、sdcなどの後に表示されているハードディスクの型番などを消してあります。

10) こんどは「Clonezilla-オープンソース複製システム(OCS)|モード」という画面になります。
さきほど表示されたsda、sdb、sdcのそれぞれのディスクの詳細が表示されています(上の写真)。私の場合はsdcのパーティションsdc2にイメージを保存する予定なので矢印キーでsdc2を選びます。enter。(註:この写真の場合、sda1は200.9Gのext4形式でフォーマットされているSDDであり、sdb1は1.8テラバイトのディスク、sdc1は2Tバイトのntfs形式でフォーマットされているボリューム(パーティション)、sdc2も同様で、sdc3は1.6Tバイトのntfs形式でフォーマットされたボリューム(パーティション)だとわかります。写真ではsda1, sdb1などのディバイスのメーカー型番などは消してありますが本当はIn_以下の部分に詳しく表示されています。)
11) 次は「Clonezilla イメージリポジトリ用のディレクトリブラウザ」という画面になります。私の場合、sdc2を選んだのでその内容が表示されています。いちばん上にあるゴミ箱recycling binが選択されていますが、あらかじめ2)で作っておいたCloneZilla_demoというディレクトリにイメージを保存するので、矢印キーでそれを選びます。選んだらenter。
12)次は保存先の最終確認画面になります。/dev/sdc2[/CloneZilla_demo/]というように、保存先として選んだディレクトリが表示されているので、画面の指示どおり、Tabキーを押してDoneを選択します。そしてenter。するとこの画面の画面下部に黒地に白で保存先の容量と名称などが表示されます(下の画像)。OKなのでenter。
13)画面が替わって、「Clonezilla-オープンソース複製システム(OCS)」の画面で初心者モードを選べる画面となります。デフォルトで選択されている初心者モードを選んでenter。
14)次は「モードを選択してください」 の画面です。「ローカルディスクをイメージに保存」を選びます。enter。(他にパーティションをイメージに保存するモードも選べます。)
15)すると「イメージの保存名を入力してください」という画面になります。西暦と月日からなる保存名がついています。そのままでもいいです。enter。

16)ここからは、 いよいよ保存したいローカルディスク(コピー元)の選択画面となります。私の場合は、sdaとsdbを保存したいのでスペースを押してまずsdaを選択。次に矢印キーで下のsdbを選び、スペースを押してsdbも選択します。選択完了したドライブには先頭に星印*がつきます。17)次の画面は、「Clonezilla 拡張パラメータ| モード savedisk」という画面で、圧縮オプションの選択画面となります。一番上の「zip 並列 GZIP圧縮を使用(マルチコア/SMP用)」でOKなのでこれを選んでenter。(画像は省略しました)
18)次は、ファイルシステムの保存前のチェックの画面となります。これはNTFSシステムを使っているwindowsでは使えません。Linuxなどではチェック可能ですなどと書かれています。今回はディスクに問題はないので、「元ファイルシステムのチェック/修復をスキップする」を選んでenter。

19) イメージ保存後、保存イメージが復元可能かどうかのチェックをするかどうかのオプションです。「はい 保存イメージをチェックします」を選んでenter
20) 画面が替わって、イメージを暗号化しますか?の画面となります。暗号化しないのでそちらを選んでenter。
21)すべての処理の完了後に実行される操作の選択画面です。一番上の「すべての処理の完了時に実行する、再起動シャットダウン他を選択してください」というメニューのままでenter。下に黒地で緑のメッセージが表示されます。確認してenter。
22)すると緑のメッセージの下に、ずらーっとメッセージがならんで表示されます。この中には、これからイメージを作成するドライブについての情報があるので確認しましょう。黒地に黄色の文字で「次のステップは、このマシンのハードディスク・パーティションをイメージとして保存することです。本当に続けてよろしいですか?(y/n)」と聞いてきます。よろしければyを押します。これでイメージ作成が始まります。
23)進行状況の画面がしばらく表示されます。数時間以上かかると思いますので気長に待ちましょう。以下のようにイメージは復元可能ですというメッセージがでたらほぼ完了です。確認してenter。
24)すると次の画面がでます。この画面で矢印キーを使って、電源offを選んでenterで終了です。再起動その他も選べます。

Pythonの勉強用におすすめの本(12/09動画について追記しました)

PythonはRとならんでおすすめのプログラミング言語です。医学部で教えている野村研の卒業生もPythonの講義をしているそうです。物理科学系だけではなく生命科学分野でもPythonを使えると断然有利になります。まったく初心者の方への入門書としては、いちばんやさしいPythonの教本 第2版 人気講師が教える基礎からサーバサイド開発までなどはどうでしょうか。第2版はみていないのでわかりませんが、プログラミングに使うエディターはAtomよりはVSCode(Visual Studio Code)のほうが良いと思います。まず初心者用の入門書で概要がわかったら、次は「すっきりわかるPython入門」をおすすめします。この本はAnacondaをつかってPythonをインストールしていくという、最近主流の入門スタイルで書かれています。大変よくわかるとうちの奥さんのおすすめ本です。出版社のサイトのリンクを下に書いておきます。この本のサイトの「掲載ツール導入・利用ガイド」の項目には、AnacondaやJupyterLabのインストールのやりかたが書いてあるので参考にしてみてください。電子書籍版もあります。
https://sukkiri.jp/books/sukkiri_python
なお九州大学の方(九大図書館にログインして、データベースにあるMaruzen eBook Libraryにアクセスしてみてください)やこのサービスを契約している組織の方は、ここで紹介した本を(一日60ページの制限がありますが)パソコンにダウンロードして読むことができます。すこし読んでみてよかったら購入するのがいいと思います。(残念ながら九大では「いちばんやさしいPythonの教本」は初版しかダウンロードできません)私はどちらもpdfで読んでみて、結局紙の本を購入しました。このライブラリには他のpythonの入門書もいろいろありますので、試し読みしてみて自分に向いている本を選ぶとよいかもしれません。入門用の動画ですがNGSハンズオン2015の動画の中にPython入門の動画がありますので、
https://togotv.dbcls.jp/20151110.html
入門前にこれを見てみるのもおすすめです(私はこれをみてPythonをはじめました)。

あと、最近はやりのJuliaというプログラミング言語の入門書も上のMaruzen eBook Libraryにあって読むことができます。「1から始めるJulia プログラミング」(コロナ社)という本です。Juliaを学びたい方にはおすすめです。Juliaはpythonのように書けてCにまさるとも劣らないスピードで実行できる画期的なプログラミング言語だそうです。
(写真は一週間ほどまえにみかけた皇帝ダリアです。)

windows7のサポート終了:windowsをやめてLinuxへうつるチャンスです(2)

さて、今日は前回の続きで、windows7を残したままで、外付けHDDやSSD、あるいはUSBメモリからLinuxを起動して使う方法を紹介します。(どんな外付けのSSDがよいかについては、記事の末尾の註1をみてください。) 下のギャラリーの写真は最新のUbuntu Desktop 20.04 LTS日本語版Remix をインストールする手順です。起動直後から日本語入力ができる上にLong Time Support (LTS)版ですので5年間のサポート(2025年4月まで)付です。

今回の記事はウインドウズ7を残したまま、Linuxを外付けSSDやHDD、あるいはUSBメモリにインストールして使う方法と題していますが、もちろんwindows10とかのパソコンに外付けディバイスをつないで(註1)、そこにLinuxをインストールして使いたいという時にも使えます。サポート切れのwindows7のパソコンの場合は、使う時にネット接続を遮断しておき、Linuxを起動したときのみ、Linux側でネット接続するのが安全でしょう(註2)

以下では、windowsユーザーでLinuxを初めて使ってみようと思う人のために、具体的なインストール手順をまとめておきます。

1)まずLinuxのインストール用メディアを作ります。
インストールするLinuxのディストリビューションを決めてインストール用のDVDあるいはUSBドライブを作成します。(この操作は、前に紹介した本の付録などについているインストール用DVDを使うなら不要です。)前回紹介したいろいろなLinuxのディストロの中でまず試してみようと思うもののISOファイルをダウンロードしてください。前回紹介したubuntu Linuxの日本語版のISOファイルとか、Linux mintのisoファイルとか、puppy Linuxのisoファイルとかお好きなものを選んでダウンロードしてください。次にisoファイルをwindowsのburn dvdの機能を利用してDVDに焼きます。usbメモリをインストール用に使う場合は、rufusというソフトをダウンロードして空のUSB(4G以上は必要でしょう。isoファイルのサイズによってはもっと容量の大きいものを用意してください。)をLinuxインストール用のUSBメモリとします。(追記:もっと簡単なソフトとしてEtcherというものもあります。これはISOイメージを選び、USBメモリを選んでボタンを押せばブート用USBメモリが出来上がるという簡単ソフトです。2021/01/11追記)

2)次はwindowsのパソコンにインストール用メディアをいれた後、電源を入れたら、このインストール用メディアからパソコンが起動するように設定します。
インストール用のDVDやUSBが用意できたら、windows7のパソコンの設定を変えて、電源を入れた時にインストール用のDVDやUSBの入っているドライブからパソコンが起動するようにします。やり方はwindows7のパソコンのBIOS (あるいは最近のパソコンならUEFI(Unified Extensible Firmware Interface))の設定を変えて、「まず最初に起動設定を探しにいくドライブ」を、DVDドライブあるいはUSBドライブに設定するのです。やり方は、パソコンの電源を入れた直後の最初の起動画面で、BIOS設定(古いパソコンはこれ)やUEFI設定(最近のパソコンはこっちでしょう)をするにはどのキーをおすかという指示がでます (F2キーとかを押すとよいとか英語で書いてあると思います)。すぐメッセージが消えてwindowsが起動するので、よくわからない人は、起動の様子をムービーで撮影しておいて、あとでムービーを再生して、ゆっくりどのキーを押せばよいのかを確認してください。起動時に押すキーがわかったら、電源を入れた直後にそのキーを押して、BIOS画面やUEFI設定画面を表示させ、最初に起動のときにコンピュータがみにいくドライブを指定します。こうしておけば、USBメモリやUSB接続の起動ディスク(SSDやHDD)をつないで起動したときはLinuxのインストーラー(インストールが終わった後なら、Linux)が起動し、これらをつながないで起動すればwindows7が起動します。

3)以上の設定が終わったらいよいよlinuxのインストール作業に入ります。
パソコンに上の2)で作成したインストール用DVD(USBやCDの場合もあるでしょう)を入れて起動します。先ほどのBIOS(またはUEFI)設定がうまくいっていたら、Linuxインストール用のDVD あるいはLinuxインストール用のUSBからパソコンが起動します。ubuntuのインストーラーの場合では下のギャラリーの1~3のようにいろいろ画面が変化した後、下のギャラリーの4の画面がでてきます(ギャラリーのサムネールをクリックすると写真がみられますので、クリックしながらみてください)。

ubuntu desktop LTS 20.04 Remixのインストール用DVDの場合、2のようにディスクチェック (インストール用DVDのチェックのようです)が最初に行われ4の画面で止まります。4の画面の「Ubuntuを試す」のほうを押すとインストールなしでubuntu Linuxを使ってみることができます。今回は「Ubuntuをインストール」のほうを選んでクリックします。

すると、5のようにキーボードを選ぶ画面がでて、「続ける」ボタンをクリックすると、6の「アップデートと他のソフトウエア」の画面に変わります。ここでは「通常のインストール」で、「Ubuntuのインストール中にアップデートをダウンロードする」を選んでおきましょう。「続ける」ボタンを押して次に進むと7の「インストールの種類」の画面がでてきます。「コンピュータにはwindows7がインストールされています。どのようにしますか?」ときいてきます。ここでは必ず一番下の選択肢「それ以外」を選んでください。一番上の選択肢は一見よさそうでwindows7とLinuxが共存できそうですが、これを選ぶとトラブルが起こった時対処が大変なので選ばないでください。必ず「それ以外」を選んで「続ける」ボタンを押して次に進みます。

次の8の画面ではコンピュータのハードディスクなどの構成が表示されます。いよいよLinuxをインストールするディバイスとパーティションの設定を開始します。8にでているsdaとかsdbなどというのがHDDドライブなどのディバイス類のことで、sda1、sda2などの数字はそのパーティションです。ディスクの大きさ、使用しているサイズ、空サイズ、パーティションの種類(ntsfなどの種類)やサイズが表示されています。写真では私のHDDドライブの使用量や空サイズの部分は念のためぬりつぶして隠してあります。一番下に空のSSDの空き領域128G余りが表示されているのをご覧ください。フォーマットもしていないので空き領域となっているだけで、ここにLinuxをインストールします。まちがってwindows7や10が利用しているドライブやパーティションなどを選ばないことが大事です。写真9の一番下にはブートローダーをインストールするディバイスという項目があります。これがLinuxをインストールするドライブになっていることを確認し、もしwindowsのドライブなど残しておきたいドライブになっていたら、プルダウンで正しいディバイスを選びなおします。写真ではちゃんと128GのSSDがえらばれていることがSSDのメーカーの型番で確認できます。
(注意:もしこの段階のドライブの表示でどれがwindows7の使っているドライブか、どれが新しいSSDかがどうしてもわからないようでしたら今はこれ以降の作業はとりあえず中止してLinuxにもうすこしなれたほうがよいです―記事の末尾にある註3を参照してください。)

では、下のギャラリーの9の画面から128G余りのSSDにLlinuxをインストールするためのパーティションを設定していく例を紹介します。
9の図のように128Gちょっとある空領域を選択します。(買ったばかりで未フォーマットの、まっさらのSSDでまだ空き領域がない場合は空き領域が表示されません。その場合はdev/sdcなどSSDを選びます。この場合、9の画面で選べるのは「新しいパーティションテーブル」だけですので、それをクリックすると、空き領域ができます。)

9の図にある+/-変更というボタンの+ボタンを押します(この画面では選べるのは、+ボタンと元に戻すボタンだけです)。すると10のように「パーティションを作成」という画面がポップアップします。空き領域のサイズが表示されていますね。まずスワップ領域を設定します。基本パーティションと場所は図のとおりにして、利用方法という部分からプルダウンメニューを11のように表示させ、「スワップ領域」を選びます。サイズの部分を変更して、メモリーと同じくらいに設定します。12の図では4G(4000MB)にしてあります(図12)。マウントポイントの項目はきえていますね。OKを押してこの画面を閉じます。

swap 領域が13の図のようにできました。swap領域のしたに約4Gバイトへった空き領域が表示されています。そこで14のように空き領域をクリックして選択し、+ボタンを押すと、ふたたびパーティションを作成する画面15になります。今度は残りの空領域全部を使ってルートパーティションを作成します。128GのSSDの使用可能領域がswapに設定した4G分減少しているのを確認してください。ここでの設定は 15の図のように「基本パーティション」(論理パーティションにチェックがはいっていたら、基本パーティションに変えてください)と「この領域の始点」、そして「ext4ジャーナリングファイルシステム」はデフォルトのままにして、マウントポイントのみをプルダウンメニューから選択して「/」に変えます。OKをクリックします。

すると17のような画面になり、今作ったswapファイルとext4の領域のサイズや名称が表示されます。/dev/sdcがSSDでその中に/dev/sdc1のswap領域、/dev/sdc2のルートパーティションが設定されています。/dev/sdc2にはチェックが入っています。sdcをクリックして選んでおき、一番下のブートローダーの場所がSSDであることを確認します。インストールボタンを押したら18の最終確認画面「ディスクに変更を書き込みますか?」がでてきます。 「続けると以下に挙げた変更はディスクに書きこまれます 云々」という警告が表示されています。ここまでの設定作業は、戻るボタンを押せば一段階づつもどってキャンセルできます。「続ける」ボタンをおすとディスクに変更が加えられて戻せませんので、ここでゆっくり確認してください。ディスク表示されているのがlinuxをインストールするディバイスであることを確認し(この例ではsdc)、そのパーティションが変更されるのでよいかどうか確認し、よければsdc1 がスワップ領域、sdc2がext4というファイル管理システムに設定されるようになっていることを確認してください。サイズもあっていますか?この18の画面で「続ける」を押すと、ディスクに書き込みが始まり、もとに戻れないので注意してください。間違いなければ設定完了です。「続ける」をおしてディスクに変更がはじまったらubuntuのインストールが始まります。

ubuntuのインストールが始まったら、「どこに住んでいますか?」(時刻を日本標準時にする設定)(19)とか、ログイン名とパスワードの設定(20)、などがはじまります。各項目の設定が終わって画面に指示がでたら指示に従って、再起動してください(22)。ubuntuのログイン画面がでてきますので、先ほど設定したパスワードでログインすると、cloudの初期設定とか(24)いろいろ初期設定項目をきいてきますが、私は全部設定をスキップして使っています。これで日本語入力が使えるubuntu の最新版が windows7と同様にグラフィカルインターフェイスで使えます。ブラウザのFirefoxとか電子メールソフトのThunderbirdとかもはじめから入っていますし、無料のMicrosoft Office互換のOffice Suite一式も入っています。またプログラム言語のpythonもはいっていますので、python入門にも最適です。ただ日本語版ではフォルダ名が日本語になっていて、pythonなど英語圏のソフトを使うとき困りますのでフォルダ名は英語にもどしておきましょう。やりかたはたとえばここにありますのでやってみてください。あとwindows7でつかっていた日本語変換辞書のubuntuの日本語入力システムMozc(Google日本語入力)への移行を行えば日本語入力もとてもスムーズにできます。

別のやり方としてはVirtualboxというソフトでwindows7内にLinuxの仮想マシーンを起動するという方法もあります。これは私が授業で「BioLinux8をwindowsで起動してLinuxの使い方を説明したときに使った方法」です。ubuntuとかを動かすにはメモリーが最低4G、普通は8Gいるようです。それでは4Gくらいしかメモリをつんでいない私のパソコンでは動かないので、ubuntuの代わりにLinux mint 32bit版を使っています。これをinstallしてグラフィカルインターフェースを起動したとき、デスクトップの右上にCheck your video drivers. Your system is currently running without video hardware accelerator. Launch Driver Managerというメッセージがでるかもしれません。これをクリックしてもemptyで何も表示されないと思います。この直し方は簡単です。Linux mintをいったんシャットダウンしてからVirtualboxを起動し、歯車印のアイコンの「設定」をクリックして、ディスプレイを選びます。グラフィックスコントローラー(私の場合VMSVGAとなっていました)の下にあるアクセラレーションのチェックボックスに表示されている「3D アクセラレーションを有効化」というチェックボックスにチェックを入れればOKです。Linux mintを起動すると今度は先ほどのメッセージはでないはずです(2021/04/16追記)。

註1:内蔵型のHDDやSSDでもHDD/SSD用のクレードルとかスタンドという名前で売られているUSB接続ケーブルでパソコンとつなぐスタンドを使えば外付けドライブとして使えてLinuxをインストールできます。このクレードルは、古いパソコンからHDDを取り出してHDDの中身を利用したいときにも便利です。私が最近買ったのは、内蔵型の2.5インチのSSDドライブ(480G)と、そのSSDを入れてUSBでPCと接続するケース(USB3.0 2.5インチHDD/SSDケース SATA I/II/III対応)のものです。ケースが1000円ちょっとでSSDが6000円ほどでした。

註2:windows7を起動しているときネット接続を切るには、LANケーブルを抜くとか、wireless接続用のアダプタを無効化する(USB接続のものならUSBポートから抜くか、windowsのネットワーク設定で接続を切る)方法もあります。あるいはNetDsablerとかのソフトをインストールしておいて、クリック一つでネット接続を切る方法もあります。

註3:ここでいったんubuntuのインストールを中止して、ちょっとpuppy LinuxをUSBドライブから起動するようにして、puppy Linuxで遊んでみてください。puppy Linuxではデスクトップにディスクドライブが画像で表示されるのでpuppy LinuxをUSBから起動してしばらく遊んでみて、自分の使っているwindows7のドライブがどれかを理解してから、この作業に挑戦すると間違いないと思います。windowsのパーティションは、パーティションのサイズやntsfなどというフォーマットの種類でわかると思います。(あるいは究極の安全策としてLinuxをインストールする前に、パソコンの箱をあけてwindows7で使っているHDDドライブなどの配線を外しておいてもよいでしょう。しかしそれができる人ならたぶん間違わないでしょうね。)まちがいなくSSDなどLinuxをインストールするドライブやUSBメモリが選べたら、MBRの書き込み先もまっさらのSSD(あるいは自分のインストールにつかうUSBやHDDなどのディバイス)に設定します。
最初私はpuppy Linuxを最初USBにいれて起動する方法を試しました。これはLinuxに慣れるには最適ですし、プログラムの本体自体は300Mb程度、ハーディスクやUSBメモリの容量も10Gもあれば十分つかえるので最初はこれでいいと思いました。しかし私のUSBメモリはエラーを起こしやすかったため、ランプが点滅を繰り返して起動しなくなってフォーマットしなおしたりして面倒なので結局やめました。ちょうど余っていた古いSSD(128G)があったので、これをUSB接続してそこにUbuntu Desktop 日本語 Remix をイントールして使っています。

windows7のサポート終了:windowsをやめてlinuxへうつるチャンスです(1)

福岡では2月17日に、ちらちらと初雪を観測しました。今まで一番遅い初雪の記録2月6日を111年ぶりに更新したそうです。

さて今日はこのところいろいろトライしているウインドウズ7のサポート停止に対する対策を書いておきます。そろそろlinuxを中心にパソコン生活を始めようというわけです。
上の写真はLinux  Mintを起動した時のデスクトップです。windowsとよく似ていますね。linuxといえばターミナルでのコマンド操作というのがよく話題になりますが、windowsとそっくりのデスクトップでマウスで操作するだけで使えますので、まずはこうしたwindowsなみのグラフィカルインターフェイスで使うのがおすすめです。

私はwindows7で動くパソコンをもっているのですが、windows7のサポートが今年の1月14日で終了した(windows defenderの更新はつづいているようです)ので、それに対する対策を講じなくてはなりませんでした。九大図書館などに自宅からwindows7を使っているパソコンでアクセスするとき文献をダウンロードしようとすると、画面一杯に警告画面が表示され、windows10への切り替えを促され、文献のダウンロードはできなくなっています。セキュリティを考慮した措置ですが、まだまだ問題なく使えるwindows7なのにうっとうしいサポート切れ対策を余儀なくされるのにはほとほと、うんざりさせられます。以前windowsXPのサポート切れにともなって、XPからwindows7にアップグレードするときも研究室の多数のXPパソコンをいちいちアップグレードするのは大変でした。今回は大学で使っているwindows7のenterpriseエディションからwindows10へのソフトやデータを残したままでのバージョンアップは結構簡単にできるのですが、それも結構時間と手間がかかるわけです。また使っているパソコンによってはスペックが不足してwindows7のように快適には使えないことがわかりました。windows7でインストールしたソフトもあるし、それがwindows10で動くのかも不明です。パソコン自体はwindows7で問題なく動いているので、無駄な追加投資をしたくないと思い、windows7はネットワークから切り離して利用することとし、ネット接続するときはlinuxを使うことにしました。参考になったのは日経からでているムックの「Windows 7パソコンをLinuxで復活させる本」です。日経Linuxの最近の記事をまとめたものですが、丁度windows7のサポート停止でウインドウズを止めようと思っている方には最適の本だと思います。

要は、windows7のパソコンはネット接続をせずに利用し続け、ネット接続には外付けハードディスク(あるいはSSD, USBでもだいじょうぶです)にインストールしたlinuxを使うという方針です。近頃はほとんどの作業はブラウザでやるので、linuxでブラウザを使う、メールをやりとりするなどができればネットでの作業はことたり、ネット接続していないwindows7を起動すれば、今まで使っていたwindows7で動いていたソフトもそのまま利用できます。(linuxにはwineというソフトがあって、幸運ならwindows7で使っていたソフトもlinuxのwineで動くかもしれません。)

ubuntu などの、日本語入力システム付のlinuxのインストールディスクを使って、USBや外付けのSSDや外付けHDDにlinuxをインストールします。こうしておけば、linuxをインストールした外付けのSSD(HDDでもUSBでもいいです)をwindows7で動くパソコンにとりつけてUSB接続したSSD(HDDあるいはUSBメモリ)から起動すればLinuxが使えますし、USB接続を外して(つまりUSBケーブルを外して)起動すればあいかわらず今まで使っていたwindows7が使えます。(他のwindowsとの共存のやり方としてはデュアルブートといって、起動したらlinuxかwindows7かどちらを使うかを選んでから起動すると言う便利な方法もありますが、これはどちらか一方が壊れたときとかにトラブルがおこることが多いそうですのでやめました。またlinuxの中でwindows7の仮想マシーンを起動して利用するというのもありますが、パソコンのスペックがいるし、windows7の仮想ディスクをつくるのにproduct IDがいるとかいろいろめんどうくさいのでやめました。)というわけで以下は外付けSDDにlinuxをインストールする手順です。

いろいろあるlinuxの配布版(ディストリビューション、ディストロ)のどれを使うか?distributionにはいろいろあってどれを使うか迷うのですが以下のようなdistributionは有名です。

Ubuntu Desktop 日本語 Remix
Linux Mint これには3種類あってCinnamonというのがおすすめです。32bit版と64bit版があります。
・puppy linux日本語版
・Pop!_OS(プライバシーを重んじているlinuxでファイルは自動で全部暗号化され、この配布版を作成している会社にデータを送ることもないそうです。日本語の利用設定も簡単)
・Zorin OS(これはwindowsからの乗換え用をうたっているものです。商用版あり)

これらはwindowsからの乗換えの記事でよくとりあげられています。私は最初 puppy linuxをUSBメモリに入れて使ってみました。linux mintは世界で一番多く利用されているlinuxだそうで、壁紙もきれいなのでこれもおすすめです。私はネットで情報が多い、Ubuntu Desktop 日本語 Remixを採用しました。これも他のdistributionと同じではじめから日本語入力システムMozcがセットでついていて便利ですし、windowsでつかっていたIMEの辞書も簡単に移行できるのでおすすめです。(下はLinux Mintの画面で、windowsのスタートボタンにあたるところをマウスでクリックした様子です)
長くなりましたので、今日はこの程度にして次回からは具体的なインストールの手順を書いていこうと思います。(次回のリンクはここです。

他のやり方としてはVirtualboxというソフトをウインドウズのパソコンにインストールして、仮想マシーンとしてlinuxを動かすこともできます。これは私が大学の授業でlinuxの導入実習で使っていた方法です。以前のブログの記事にはこのやり方とlinuxの入門書があげてありますのでご覧ください。

単一細胞のRNA-Seq(scRNA-Seq)の入門動画とBrenner先生の新技術についての金言の紹介です。

科学の発展には新技術の開発が決定的な役割を果たします。このブログでも次世代シークエンサーの威力と題して、DNase-Seq (ディーエヌエース シークと読みます)などを紹介したことがあります。最近のNIH Videocastの番組で、新技術を紹介している優れた講演がありました。大変勉強になる講演で、スマートフォンからハイビジョンテレビ向けまでの様々な解像度で動画をダウンロードできますので、是非 通勤時間などを利用して動画をご覧ください。

これは、今年の7月24日に行われた講演です。Biowulf Seminar: Single Cell Sequencing: Powerful Applications and Practical Considerations(クリックすると動画サイトにとびます)という題で、一細胞のRNA-Seq (single cell RNA-SeqですのでscRNA-Seqと略します)のいろいろな方法と応用およびバイオインフォマティクスによる解析ツールについてやさしく紹介する優れた入門用の講演です。RNA-Seqというのは、細胞や組織の中にどんなRNAがどれほど存在しているかを、次世代シークエンサーを用いて、網羅的に同定する技術です。演者のMichael Kelly博士はsingle cell biologyの有名な実験研究者で、NIHのLinuxクラスター(9万5000個以上のprocesserと30ぺタバイト以上の容量(1ぺタバイは1000テラバイトです)をもつLinux cluster) Biowulfのユーザーでもあります。それでBiowulfセミナーで講演しているようです。内容は2012/2013年頃及したFluidigm C1 platformとSMARTer chemistryによる一個の細胞のRNA-Seqの方法、スループットが飛躍的に向上した2015年のDrop-Seq/InDropsの方法、そして2017/2018年頃から普及してよりハイスループット、低コストとなったsciRNA-Seq/SPLiT-Seq/Seq-Wellの方法などの紹介からはじまって、単一細胞レベルのRNA-Seqを鳥瞰していて、最適の入門講演と思います。 なおsci-RNA-seq (single-cell combinatorial indexing RNA sequencing)というのは、線虫C. elegansの各細胞のRNA-Seqを行った2017年の論文で使われた方法です。オープンアクセスになっていますので興味のある方は是非読んでみてください。新技術の開発がどれほど科学をすすめるかに感動します。

昔 Current Protocols in Molecular Biologyというプロトコル集を買っていました。その綴じ込みにSydney Brenner先生の言葉:
Progress in science depends on new techniques, new discoveries and new ideas, probably in that order. (科学の進歩は、新しい技術の出現、新しい発見、そして新しいアイデアの誕生によってもたらされる―おそらくこの順番で)
が載っていて感銘をうけました。

たしかに、放射性同位元素の生物学研究への応用、蛍光抗体法、モノクローナル抗体、レーザー共焦点顕微鏡、GFPなどの発明、PCR、DNAシークエンサー、遺伝子クローニングやゲノム編集技術、原子間力顕微鏡、タンパク質や糖鎖、脂質などの質量分析装置による解析技術、核磁気共鳴や電子スピン共鳴、X線結晶回折による生体分子の立体構造の解明、電子顕微鏡、クライオ電子顕微鏡、超高解像度の光学顕微鏡などなど、さまざまな新技術が生命科学の大発展を引き起こしてきています。Brenner先生が言うように、技術ができたらそれで何を研究できるかと考え、それが新発見を生み出し、新発見が新しいアイデアを生み出し、次の技術も開発される‥といった順に科学は発展しているようにみえます。

Current Protocolsの本は寄贈したので手元になく、 Brenner先生の言葉もうろ覚えではっきりしなかったので、ちょっと出典を探してみました。 Google 検索でSydney Brenner  quotesといれて探すとすぐにみつかって、多くの方がこの言葉をなるほどと思ったことがうかがえます。次にGoogle検索でこの言葉を二重引用符に囲んで”Progress in science depends on new techniques, new discoveries and new ideas, probably in that order.”を検索窓にいれて検索しました。するとなんとBrennerさん自身がこの言葉をどこ喋ったかを思い出せず、自分で探しただした、という記事がヒットしました。その記事によると、Brennerさんにこの言葉を引用したいがどこが出典かという問い合わせがあったのですが、自分でもいつどこで言った言葉か思い出せなかったそうです。そこで Alan Mackayという人のA Dictionary of Scientific Quotationsという本を探すと、この言葉がのっていて、 雑誌Natureの1980年5月5日号より、とあったそうです。さっそくNatureを見たのですが、なんとこの日には雑誌が発行されていないことがわかりました。それで結局わからずじまいだったとのことです。ところが数週間後、積み上げられた論文をいろいろみているとき、手書きの講演原稿が見つかったそうです。それはスイスのバーゼルにある Friedrich Miescher Instituteの10周年記念シンポジュウム(1980年開催)でのBrenner先生の講演の手書き原稿でした。ここでしゃべったんだというのがわかったので、このシンポジュウムについて報道していたNatureの記事を探したところ、1980年6月5日に掲載された記事が見つかって、その中にこの言葉がのっていたそうです。Biology in the 1980s, plus or minus a decadeというタイトルの記事です。ここからpdfがダウンロードできます。

先ほどの本は一か月だけ日にちを間違えていたということでした。講演会でのBrenner先生の手書き原稿にはこの文は以下のように書いてあるそうです。“ I will ask you to mark again that rather typical feature of the development of our subject; how so much progress depends on the interplay of techniques, discoveries and new ideas, probably in that order of decreasing importance.”

以下のサイトにはBrennerさんをはじめ、いろんな科学者の言葉が網羅されていて面白そうです。またそれ以外の面白い記事も多いのでおすすめです。
https://todayinsci.com/B/Brenner_Sydney/BrennerSydney-Quotations.htm
https://todayinsci.com/Quotations/QuotationsIndex.htm

夏休みおすすめ本 その2 細胞生物学とLinux入門のブルーバックス、そしてゲノム編集

試験が終わって夏休みを満喫している学生さんも多いかと思います。新学期が始まる前によんでみるとよい本をいくつか紹介しておきます。まず

1) ブルーバックスの「細胞の中の分子生物学 最新・生命科学入門」(森 和俊 著)は、私の大学二年生向けの細胞生物学の講義の参考書に紹介していましたが、とてもわかりやすい本で、生物学専攻でない物理や化学専攻の大学1,2年生におすすめの入門書です。もちろん生命科学関係の学生にもおすすめで、私のラボの院生も読んでとても参考になったといっていました。

2) ブルーバックスでもう一冊のお勧めは、「入門者のLinux 素朴な疑問を解消しながら学ぶ」(奈佐原 顕郎 著)です。こちらも生物学演習の学生さんに薦めていましたが、linux入門には最高の本だと思います。なぜlinuxが必要かというところからはじまって、最後は気象衛星ひまわりの画像をダウンロードして画像をつなげてムービーをつくるところまで勉強できます。私も読みながらコマンドを実行しながら読み進んでいくと、ちゃんとムービーをつくることが出来ました。ubuntuのlinuxを使えばコマンドもすべて本のとおり打ち込めば実行できますので是非お読みください。以下の講演会(平成27年度NGSハンズオン講習会)のビデオ、テキストをみれば、biolinuxをvirtualboxでwindowsにインストールして動かし、この本の実習を行えるだけではなく、簡単なバイオ系ソフトをlinuxで動かしてみることもできます(リンクの事前予習資料一覧のpdfから始めてください。インストールの仕方のスライドもリンクにあります。丁寧なスライドですのでだれでもbiolinuxがインストールできます)。biolinuxをインストールするやり方は詳細にこのページのリンクにありますので、そのとおりやれば簡単にできます。ただしハードディスクの空容量は十分確保してからはじめてください。平成27年度の講演会では、シェルスクリプト入門、pythonやperl入門、Rの入門などいろいろな講義が動画とテキスト付で公開されています。私も通勤電車のなかで全部視聴して大変勉強になりました。その後の講習会は段々と上級者向けへ内容がシフトしていますのではじめるなら27年度の講習会からかなと思います。

このブルーバックスをbiolinuxを動かしながら読んでいくときの注意点です。
biolinuxではこの本の285ページのコマンドは作動しません。この本はシエルがbashなのですが、biolinuxはシェルがzshなのが原因です。これはzshがdirectoryの中身を探しにいっていないのでno matchというエラーを返してくるのです。コマンド実行前に、、biolinuxで
setopt nonomatchとうって実行しておくと、285ページのコマンドもbiolinuxで動きます。zshとbashの違いについてはたとえばここに詳しく書かれています。

3) これも分子発生学の講義などで紹介した本ですが、CRISPR-Cas9によるゲノム編集の開発者の一人、さんが書いた本 「CRISPR(クリスパー) 究極の遺伝子編集技術の発見」(ジェニファー・ダウドナおよび サミュエル・スターンバーグ著)もおすすめです。ゲノム編集の開発だけでなく、その正しい応用を目指すスタンスが強調されているとてもわかりやすい本です。組織特異的にゲノム編集をするのはどうしたらよいのかなども紹介されていて、ゲノム編集について考えるための必読文献です。Doudnaさんの講演はいっぱいネットにありますがたとえば去年のこの動画などはいかがでしょうか。バクテリアの獲得免疫システムとして働いているCRISPRの概観と、ウイルスがanti CRISPRタンパク質を使ってそれから逃れるといった最新の話題もとりあげられています(2017年の講演)。英語字幕をYouTubeでオンにしたら聞き取りやすいと思います。

もっと新しい講演は以下のものです。

ことし6月のThe Croonian Medal Prize Lectureでの講演です。英国王立協会の由緒ある賞the Croonian Medal and Lecture 2018の受賞講演です。これもYouTubeで字幕オンでみるとよいでしょう。