深層学習によるタンパク質の立体構造予測プログラムの新顔登場

Alphafold2は有力なタンパク質の立体構造予測プログラムとしてデータベースもできています。世界チャンピオンを打ち破ったAIであるAlphaGOをつくりあげたグループが開発したAIでこちらに開発者のDemis Hassabisさんへのインタビューが翻訳掲載されています。日本語訳は無料では途中までしか読めませんが、日本語版のページ上部にリンクが張ってある本家のほうは、全文無料公開されていますので日本語の無料訳を読んで興味がわいたら英語版を読むとよいでしょう。
Demis Hassabis CEOの講演は以前も紹介したのですが以下でみられます。

Twitterをみていたら、Alphafoldにまさるとも劣らない新プログラム、その名もOmegafoldというのが開発されたようです。
https://twitter.com/peng_illinois
まだ論文発表はないそうですが、MSA (multiple sequence alignment)を用いずsingle sequenceの入力のみで、普通サイズのタンパク質なら数秒で立体構造予測できるそうです。また一段と生命科学が進歩しそうです。

Mathematicaのウエビナーがあるそうです 6/21/22と6/28/29

5月21日の記事でMathematicaの入門動画と機械学習の無料本を紹介しました。入門動画は3回目がアップロードされたようです。今回はListの扱い方です。
https://youtu.be/yxmJzooCpuM

Mathematicaに限らず、リストは行列や表形式のデータなどをプログラミング言語で扱う時に必須のアイテムです。リストをマスターすれば、プログラミングはずいぶん楽になりますし、Mathematicaのリストは扱いやすいのでこれさえマスターすれば、学習や研究に役立つ極めて強力なツールを手に入れることになります。是非リストをマスターしてください。
またMathematicaのウエビナーが開催されるそうですので、お知らせしておきます。簡単な登録で無料で参加できますので利用して学ぶとよいと思います。リンクと内容をあげておきます。
https://www.bigmarker.com/series/mathematica-2022-JP/series_details
6月21日(火)11:00–12:00

初めてMathematicaを使う方へ
Wolfram Cloudのアカウントの作成方法,クラウド上でもすぐに試せる面白い例題

6月22日(水)11:00–12:00
Mathematica 基礎編
数式・数値処理の基礎から,グラフ描画,簡単なアニメーション作成

6月28日(火)11:00–12:00
Mathematica 応用編
常・偏微分方程式の求解から,データ解析,簡単な機械学習

6月29日(水)11:00–12:00
Wolfram 言語による機械学習
すぐに実行可能な教師あり・なし機械学習,ニューラルネットワークのカスタマイズ,訓練法など

私の体験した不思議な話

不思議な話その2
今日は勉強の話はやめて不思議な話をすることにします。

5月6日の記事では、母から聞いた不思議な話について書きました。今日は私と奥さんの二人が体験した不思議な話です。
大阪四ツ橋にあった電気科学館の思い出です。1989年に閉館して今は大阪市立科学館に引き継がれているそうです。
https://www.sci-museum.jp/about/history/denki_kagakukan/
私がまだ幼稚園か小学校1,2年だった頃、母にせがんで大阪の電気科学館に連れて行ってもらいました。プラネタリウムを生まれて初めて見て大興奮。その後は階下の科学や電気関係の展示を見て回って、いろいろ遊んで楽しかったです。お土産を選ぶのもわくわくでした。天体望遠鏡に興味をもったのもこのころのことです。

私が大学生の時、デートでこの大阪の電気科学館に遊びにいきました。今の奥さんと二人でプラネタリウムを見た後、展示物をみて遊んでいたのですが、彼女が階の上のほうの踊り場を指さして、「あ!野村君がいるやん!」というのです。見上げてみると、当時にはふさわしくないレトロな和服の中年の女性につれられてレトロな洋服をきた小学校一年くらいの男の子が楽しそうに展示物の間を走り回っていました。昔、電気化学館に連れてきてもらったとき、母は着物で、私はちょうどその子と同じような服装でした。男の子はアルバムに残っている私の子供の時の写真にそっくりでした。その二人はすぐどこかに行ってしまいましたが、まるで過去の風景をまざまざとみているような気持に襲われたのを覚えています。一人ではなく二人で見たので、今でもあれはなんだったのかと二人で時々思い出します。当時私の母はすでに亡くなっていたので、奥さんは母に会ったことはないのですが、一目で私と私の母だと直観したそうです。大林宣彦監督の映画に「はるか、ノスタルジィ」という作品がありました。あんな映画や小説があるくらいですから、似たような経験をした人もいるのかもしれませんね。
今日のリンクはComputation Resources for Molecular Biology というJournal of Molecular Biologyという由緒ある雑誌の特集号です。Open accessの記事が多いので興味のある記事を読むとよいと思います。コンピュータでの実験結果のバイオインフォマティクス解析をやりたい人には大いに参考になる特集号だと思います。
https://www.sciencedirect.com/journal/journal-of-molecular-biology/vol/434/issue/11

ムービー・動画の形式変換、音声抽出、DVDからの動画・音声抽出などができるおすすめソフトを紹介します

今日は簡単な記事です。講演会のビデオファイルをiPadに移動してiPadで通勤途中によく観ていました。こういう場合は、ビデオのファイル形式を変更する必要がでてきますし、ビデオのサイズも減らすほうがいい場合も多いです。動画の型式変換をGoogleなどで検索すると、有料ソフトの紹介がトップにでてくることが多くて辟易します。次に紹介するフリーソフトは結構有名なソフトで、世界中で使われているようです。XmediaRecordという名前のWindowsで動くソフトです。mp4、wmv、mov、avi、vobなどなどを相互に変換できます。
https://www.xmedia-recode.de/en/index.php
のdownloadタブからダウンロードして使ってください。プロテクトのかかっていないDVDをmp4やmp3、vobやwavファイルにも変換できます。
実験で撮影したムービーの型式変更などにも必須のソフトです。メニューの日本語化もできます。オプションメニューの設定から言語を選んで、日本語を選ぶだけです。

twitterのどうしようもない仕様の回避法(5/30追記あり)

以前、iPhoneのブラウザをBraveにかえてtwitterをみると、とても快適だと言う記事を書きました。TwitterはJavaScriptを頻繁に変更して、twitterアプリを導入させようと変質狂的に改悪を続けているようにみうけられます。今まで快適にログインなしでみられていたブラウザが突然twitter社からのメッセージが必ずはさまれるようになってスムーズに見られなくなるという経験を何度もしています。今やiPhoneでの閲覧は快適とはいえず閲覧が不快になってきました。(私のiPhoneは古いiOSで、私のiPadとちがって最新のiOSではありません。最新版のiOS搭載のiPhoneで同じように不快かどうかは不明です)そこで対抗策を探したので報告します。

PC版のFirefoxやBrave、そして最新版のiPadでは、まだなんとかみられるようですのでまずその方法を報告します。これも現時点での対策なので、そのうちにだめになるかもしれません。古いiPhoneでの閲覧対策は最後にまとめておきます。

PCのFirefoxでのtwitterの見方を書きます。
アドレスを入力してtwitterを閲覧しはじめると以下の画面になります。例として九州大学の公式twitterアカウントをみてみましょう。

下の方へスクロールしていって、「おすすめトピック」をすぎると、
以下の画面がでてこれを消すことができません。
再読み込みをしてもまた同じことでどうしようもないのですが、実はこの画面の 「登録する」をクリックすると画面が替わって閉じるボタンxが左上に表示された画面になるので閉じれば、下の方を続いて閲覧できます。
PC版のBraveの場合は、おすすめトピックをすぎると下の画面になり、
閉じるボタンがはじめからあるので(iPad版Braveにはないので、Firefoxと同じ対処が必要。iPad版のSafariでは閉じるボタンがありました)この画面を閉じれば閲覧を継続できます。

さて問題の古いiPhoneですが、まず新しいuserをみようとすると、必ず毎回毎回、「Twitterアプリをおすすめします」というメッセージがでて、「今はしない」を押さなくてはならないように仕様が変更されてしまいました。そして「おすすめトピック」をすぎると、必ず「‥‥さんのツイートをさらに表示」というアプリの使用を促す画面がでて、閉じるとまたトップ画面にもどってしまいます。今度は「おすすめトピック」以降のツイートもみられますが‥‥。毎回二度手間が必要になったので閲覧がストレスフルになりました。その対策ですが‥‥。

(5/30追記:古いiPhoneのBraveブラウザで以前の記事のようにキャッシュその他を削除すると、最初の毎回毎回でていた表示はでなくなりました。Brave shieldsの全体のデフォルト設定の中で、閲覧履歴とキャッシュを消去するとうまくいくようです。「おすすめトピック」を過ぎるところのいやがらせはまだ続いているので、一度手間になりました。)

根本的な対策はtwitter.comではなくて、nitterを使うことです。
nitterはtwitterのフロントエンドで、JavaScriptを使わないので、twitterが収集している個人情報(IPアドレスとかブラウザのフィンガープリンティングとか)をtwitterに渡すことなく閲覧が可能です。詳しくはこちらをみてください。
https://gigazine.net/news/20200309-nitter/
https://github.com/zedeus/nitter
この後者のほうのサイトに掲載されているインスタンスを使えば、twitterを閲覧することができます。上のtwitterの煩わしい仕様はすべて消え去ります。nitterの公式サイト、nitter.netを使うのでよいと思います。つながりにくい時は、このサイトにあるinstancesのどれかを使ってみてください。https://github.com/zedeus/nitter/wiki/Instances#official

閲覧方法は以下のとおりです。
https://twitter.com/KyushuUniv_JPをnitterで見たいときは、twitter.comの部分を上のリストのインスタンスの一つに変えるだけでよいのです。たとえばnitter.netに変えるだけです。
https://nitter.net/KyushuUniv_JP
nitterはダークモードでサイトを表示するので背景が黒いのがいやなら、
https://nitter.net/KyushuUniv_JP?theme=Twitterのようにurlの後に?theme=Twitterを付ければOKです。ブックマークに?theme=Twitterを付けたものを登録しておけばもとのtwitterと同じようにあかるい背景で閲覧できます。(5/30追記:ブラウザでクッキーを受け入れる設定にしておけば、nitterの画面のトップのNが表示されている行の右端の歯車マークをクリックして設定画面をひらいて、DisplayのThemeをプルダウンからTwitterに変えて、一番下にあるSave Preferencesを押しておけば、れば以降はダークモードでなくなります。)

ゲノム解析のおすすめの入門書を紹介します。

先日 東京女子医科大学の三谷昌平先生の講演をオンデマンド配信で拝見しました。三谷先生の書かれた総説 (Comprehensive functional genomics using Caenorhabditis elegans as a model organism.  Proceedings of the Japan Academy. Series B, Physical and biological sciences  93 (8) :561-577 , 2017.10   DOI:10.2183/pjab.93.036) の流れに従ったお話で、大変勉強になりました。御講演の最初のほうで紹介されたゲノムについての、初心者にわかりやすい入門書というのは読んだことがなかったので、早速古書で入手しました。

オンリーワン・ゲノム―今こそ『遺伝と多様性』を知ろう 単行本(ソフトカバー) –
鎌谷 直之 (著), 早未 恵理 (イラスト)という本です。

大変わかりやすく書かれている本です。これくらいは今の時代、常識になっていないとパンデミックを煽るニセ情報の波にのみこまれかねません。ゲノムについて知りたい一般の方に特にお勧めできる本だと思います。この本をネットで検索しているときに次の本が出ているのを知りました。
ゼロから実践する 遺伝統計学セミナー?疾患とゲノムを結びつける 
岡田 随象 (著) 羊土社という本です。この本、Linuxを使うのにCygwinを使っていてちょっと古いのかなと思いましたが、著者が開催されていた、2021年の大阪大学での講習会資料を参考にすれば、最新の本によみがえります。著者の岡田先生は、東京大学大学院医学系研究科遺伝情報学教室に移行されたようですが、以下のサイトに大阪大学で開催された「遺伝統計学夏の学校@大阪大学」の講義資料があります。上の本もこの夏の学校から生まれた本だそうです。本を購入して読みながら、2021年の講義資料を勉強しましょう。それが一番だと思います。http://www.sg.med.osaka-u.ac.jp/school_2021.html
この本は、ゲノム解析に必要な事柄を、いうならば、「ゲノム解析ミニマム」のように網羅して展望しており、GWASとかも詳しく解説されているので初心者に一番のおすすめです。いろんな本をあちこち読んでみるより、これ一冊を基本として読んであとは自分で勉強していくとよいと思いました。

岡田先生の2021年の講習会のスライドでは、Linuxの入門には、今後はWindows10以降使えるようになったWSL2を利用する方向に移行すると書かれています。WSL2については以下のマイクロソフトのページをご覧ください。windows11ではコマンドラインから一発でwsl2とubuntuをインストールできるそうです。wsl –install

https://docs.microsoft.com/ja-jp/windows/wsl/install
https://docs.microsoft.com/ja-jp/windows/wsl/tutorials/gui-apps

いつも思うのですが、統計学を生命科学の実験に使うのであればRをRStudioで使い、EZRから統計解析をすればことたります。あとは実験計画法とかも学んでおけばよいと思います。Rはゲノム解析やバイオインフォマティクスに利用されるので次はそういうRの使い方を学んでいけばよいでしょう。忙しい生命科学研究者ですから、統計学を数学的基礎から学ぶのは時間の無駄です。必要なら専門の統計学の先生に質問しましょう。Pythonだって、機械学習だって、生命科学に使える部分をまず学んでいくのがお勧めです。というより、それ以上学ぶのは若い人にはかえって有害な学習だと思います。特に若い人には、時間が大切なので、そういうことは止めるようにと強調したいと思います。(生命科学以外の方は自分の興味のある分野に使える内容をまず学ぶというふうに読み替えてください。)

jpegファイルから不要な余白を連続して次々と切り取る方法を紹介します

2022/4/28の「日替わりリンクなど」で、紹介した画像閲覧・処理ソフトの追加記事です。私がブログに画像をアップロードする前に、画像のEXIF情報を消したり、ファイルサイズを小さくしたりするのするのに使っているソフトの紹介です。私はFastStone Image Viewerというソフト(ホームユーザーは無料使用可能なソフトウエアです)を使っています。こちらからダウンロード可能ですので使ってみてください。https://www.faststone.org/FSViewerDetail.htm
画像名を一括で変更したり、画像の型式を変換する(例えばtiffファイルをjpegファイルに変換するなど)などもできます。スキャナでスキャンした画像から、余分な周辺部分を切り抜くのも簡単です。日本語はサポートされていないので英語のままで使いましょう。日本語化パッチというのもあるみたいですが、どんな人が作っているのかよくわからないので、日本語化はおすすめしません。
このソフトでどうやってjpeg画像から不要な余白を切り取るかを紹介しておきます。

スキャンしたjpegファイル(他の画像形式でも出来ます)から余分な余白を切り取る方法。
一括でやる方法があるのかもしれませんが、今回は手動でやる方法を試してみたので報告します。自炊するためにスキャンした本のページの画像から、余白部分など不要な部分を連続で切り取るのがとても簡単にできますのでお試しください。

①FastStoneImage viewerで処理したい複数の画像ファイルのあるフォルダを開きます(フォルダを作って処理したいjpeg画像をまとめておくのが便利です)。

②画像viewerで画像を一つ開いて、画像上で右クリック。
EditのプルダウンメニューからCrop Boardを開きます。下の写真のようになります。
Crop Boardをクリックすると下の写真のような画面に替わります。
中央真下にある#マークをクリックすると、マウスでcropしたい範囲を選択できるようになります。マウスで余分な部分を切り取って残しておきたい範囲を選択します(上の写真のグリッド線)。この時、下にあるスライダでjpeg画質を設定できるので100%とかに設定しておきます。右下のCrop to Clipboardボタンの上にあるLossless Crop to Fileボタン(あるいはCrop to Fileボタンになっているかもしれません)でファイル名を指定して保存場所を指定した上でOKを押して保存します。下の写真のような画面で保存先、保存ファイル名、保存ファイル形式を選んで保存ボタンを押します。

保存が終わると、自動的に次の画像が表示されています。cropの範囲は前の時と同じなので、一連のスキャン画像で同じ範囲を切り取るのは簡単です。前と同様にLossless Crop to Fileボタン(またはCrop to Fileボタン)を押してOKを押すと、前に選択した範囲と同じ範囲で、クロップされた画像が保存されます。こうして保存すると次の画像に替わるのでどんどん同じ範囲をクロップしていくことができます。こうして余分な領域を除いた画像ファイル群が簡単に作れますので、お試しください。スキャンした画像から自炊pdfファイルを作ったりするのもwindowsの標準機能で簡単です。Crop Boardで次の画像を選ぶには、矢印キーを押しても可能です。

Mathematica入門動画と機械学習入門本を紹介します。

今日はこのブログでもたびたび触れているMathematicaについてです。私が九大に就職したころは生物数学演習の科目ではMathematicaが教えられていました。そのころから比べるとこの製品も格段の進歩をとげています。簡単な入門はYouTubeのWolfram Japanのチャンネル(再生リストはこちら。https://www.youtube.com/c/WolframJapan/playlists
にMathematica First Stepという日本語の動画がありますのでこれで入門するのがいいと思います。第一回目はこんな動画です。

https://youtu.be/R35pBPWenYU
また、
機械学習の入門本も無料公開されているので、英語ですが機械学習についてざっと理解するには、この本を学ぶのもよいかもしれません。ちょっとみただけですが、なかなかよさそうです。

https://www.wolfram.com/language/introduction-machine-learning/

プログラミング言語Juliaは科学技術計算に使い物にならない?

今日は忙しかったので簡単な記事で失礼します。Juliaというプログラム言語は今人気急上昇中のようです。このJuliaに否定的な意見がでているようです。https://yuri.is/not-julia/ 
Juliaのコアやパッケージがエラーだらけであるので使い物にならない。もうJuliaを使うのをやめたというような内容です。RとかPythonとかに較べると新しいプログラム言語ですので、これからの改善が望まれるわけですが、筆者によるとちゃんと改善する体制には今はなっていないとのことです。これから反論も出てくると思いますので注目したいと思います。
では世界中で十分使い込まれているpythonやRがいいのでは、ということになりますね。Pythonといえば、さっきYouTubeでJuliaに否定的な動画をみていたら右のほうにPython入門動画がでてきました。これは面白そうですので紹介しておきます。

こちらが再生リストです。https://www.youtube.com/c/kinocode/playlists
紀貫之の子孫という方の動画でどれもずいぶんわかりやすそうです。

VSCodeの入門書が期間限定無料公開中です。動画なども紹介します。

プログラムを書くときに利用するエディタとよばれるソフトウエアで最も人気のあるのはVS studio code (VSCode)というマイクロソフトの公開している無料のエディタです。atomとかviとかいろいろプログラム作成用のエディタがあるのですが、VSCodeは今やプログラマーの二人に一人が使っているエディタなのだそうです。機能を拡張できるプラグイン(拡張機能)もPython用、Julia用、Java script用、Wolfram言語用(Mathematicaの使っているプログラム言語です)などなど、ほとんどあらゆるプログラム言語に対応したものがあります。拡張機能を入れておくと、プログラムに誤りがあったとき教えてくれたり、書くときに自動補完機能が使えたりと、大変便利です。私もUdemyの無料講座でVSCodeを学びましたが、近ごろは小学生でも、このエディタでプログラムを書いている子が増えているそうです。プログラム教育が始まったおかげですね。
Udemyの無料講座は今はもうないのですが、私がみたUdemyの講座は今、1220円でセールをやっています。
無料の講座がいいという方は、同じ講師のYouTube動画があるのでご覧ください。

https://youtu.be/e3DmHK2PDGA

再生リストは以下の場所にあります。9本の動画があります。
https://www.youtube.com/playlist?list=PLh6V6_7fbbo8GHGIT2YUN56OcwEpz5I5n

本で勉強したい人には、ちょうど今、3日間限定で「Visual Studio Code完全入門」というインプレスから発行されている入門書が無料で公開されています。見るのに登録とかは不要で読めますので、是非ご覧ください。5月19日から5月21日土曜日の午後11時59分までの期間限定公開とのことです。
https://book.impress.co.jp/items/vs-code