国立国会図書館デジタルコレクションで読める本の紹介(第44回)

国立国会図書館デジタルコレクションで読める本の紹介(第44回)です。

505) ドリス・シャットシュナイダー 著 ほか『エッシャー・変容の芸術 : シンメトリーの発見』,日経サイエンス社,1991.10. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/13237863 (参照 2026-06-26)
エッシャーは科学が好きな人に人気ですね。この本は面白そうです。
506) ネビル・モット 著 ほか『科学に生きる : ネビル・モット自伝』,日経サイエンス社,1989.7. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/13153662 (参照 2026-06-26) 固体物理学の権威、モットの自伝。
507) 猪瀬博, 井上如 訳『ピアース自伝 : 情報・通信工学のパイオニア 技術者として生きた50年』,日経サイエンス社,1988.4. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/13249231 (参照 2026-06-26) こちらはピアースの自伝です。
508) スティーブン・ワインバーグ 著 ほか『電子と原子核の発見 : 20世紀物理学を築いた人々』,日経サイエンス社,1986.1. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/12593994 (参照 2026-06-26) ノーベル物理学賞を受賞したワインバーグによる本。読みごたえがあります。
509) ルイス・キャロル 著 ほか『不思議の国のアリス』,東京図書,1980.4. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/12584152 (参照 2026-06-26) ルイスキャロルのこの本はまだ読めますね。4・22事変を生き延びたようです。マーチン・ガードナーによる注釈つきで読みやすい本です。
510) デレック・ハドスン 著 ほか『ルイス・キャロルの生涯 : 不思議の国の数学者』,東京図書,1976. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/12582233 (参照 2026-06-26)
511) ルイス・キャロル 著 ほか『鏡の国のアリス : ルイス・キャロル人と作品』,八紘社印刷出版局,1982.11. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/12584275 (参照 2026-06-26)
512) フロイト 精神分析学入門 『世界の名著』60,中央公論社,1978.4. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/12406022 (参照 2026-06-26) フロイトの有名な本。世界の名著の刊行第一巻だったと思います。
513) 石川正雄 編『石川啄木日記』第1巻,藤森書店,1982.3.. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/12485945 (参照 2026-06-26) 石川啄木の日記。第三巻まであって全部デジタルコレクションで読めます。
514) 古沢岩美 絵『石川啄木ローマ字日記』,ノーベル書房,1982.2. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/12485944 (参照 2026-06-26) 啄木のローマ字日記。他人に読んでほしくない内容なのでローマ字で書いたといわれている日記です。
515) 『日本の詩歌』5 (石川啄木),中央公論社,1978.11. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/12466481 (参照 2026-06-26) 啄木の詩歌をよみやすくまとめてあります。
516) 『日本の詩歌』18 (宮沢賢治),中央公論社,1979.7. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/12466494 (参照 2026-06-26) 宮澤賢治の詩歌。これも読みやすい本です。
517) 小松雄一郎 訳『ベートーヴェン書簡集』,岩波書店,1957 5刷. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/2484780 (参照 2026-06-26) ベートーベンの書簡集したの音楽ノートと合わせて読むとよいでしょう。
518) ベートーヴェン 著 ほか『音楽ノート』,岩波書店,1957. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/2484781 (参照 2026-06-26)

 

Broad Instituteの動画”MPG Primer: Noncoding Variants in Genetic Diagnoses”の紹介

このBroad Institute のMPG Primerの動画は、遺伝子のコーディング領域でない部分の変異が病気にかかわるメカニズムをまとめた後、最先端の研究まで紹介している大変よい動画です。

Broad Institute: “MPG Primer: Noncoding Variants in Genetic Diagnoses”
https://youtu.be/hVTlhrQSXME

やや専門的ですが最初の部分は、ノンコーディング領域の果たす役割の優れた解説になっているので最初のほうだけでもご覧になることをおすすめします。私はLLMでこんなプロンプトで内容を教えてもらいました。

『次の動画の主要な内容を箇条書きにしてまとめてください。まとめの程度は大学博士課程学生以上向けでお願いします。https://youtu.be/hVTlhrQSXME 』
皆さんもお好きなLLMで童画の要約を試してみてください。いくつかを試して比較するのもよいと思います。私は返ってきた回答をもとにいろいろLLMに質問して大変勉強になりました。ハルシネーションはあると思いますが、一年前のLLMとはくらべものにならない優秀なAIになっているのを実感しました。簡単なsimulatorまで即興でLLMがこしらえて解説してくれたりするのにはびっくりしました。
一例として、Gemini 3.1 proの回答の最初の部分をペーストしておきます。今回は博士課程以上の人むけに要約してもらいましたが、学部生向けとか大学一年生向けなどとプロンプトを変えてみるとまた違った要約が返ってきます。試してみてください。


『ご指定の動画(Broad Institute: “MPG Primer: Noncoding Variants in Genetic Diagnoses”)の主要な内容を、博士課程学生以上の学術的背景を持つ方向けに要約します。

動画の主要な要約

【背景・臨床的課題】

  • 非コード領域は全ゲノムの大部分を占め、5′ UTR(プロモーター、エンハンサー)、イントロン、3′ UTR、および多様な非コードRNA(miRNA, lncRNA, circRNA, piRNA)を含むが、臨床データベース(ClinVar等)の登録はコーディング領域や必須スプライス部位に著しく偏重している。

  • 非コード領域のバリアントはVUS(Variant of Uncertain Significance:意義不明のバリアント)と分類される割合が非常に高い。しかし、eCLIPデータ等から同定されるRNA結合タンパク質モチーフ内に位置するバリアントは、病原性を示すオッズ比が有意に高いことが示されている。

【非コードバリアントの機能的評価手法とその限界】

  • MPRA (Massively Parallel Reporter Assay) / MAVEs:

    • ハイスループットな転写活性やアレル不均衡の評価に有効。しかし、エピソーム状態でのレポーター解析となるため、TAD(Topologically Associating Domains)や遠位エンハンサー等の内在性クロマチンコンテキストが反映されない。また、プラスミドの過剰発現によるトランス因子のストイキオメトリーの破綻がアーティファクトを生む懸念がある。

  • Saturation Prime Editing:

    • Cas9ニッカーゼを応用した二本鎖切断を伴わないゲノム編集。内在性のゲノムコンテキストにおいて単一塩基置換を網羅的に導入・評価可能であり(例:NPC1遺伝子のハプロイド細胞モデルによる機能スクリーニング)、より生理的条件に近い機能評価を実現する。

【Multiomicsアプローチによる病原性同定】

  • Long-read RNA-seq、プロテオミクス、およびエピゲノミクス(ATAC-seq, ChIP-seq, Hi-CによるTAD境界同定など)の統合アプローチの重要性。

  • 特にLong-read RNA-seqは、ハプロタイプのフェージングやアイソフォームの全容把握において強力であり、ショートリードでは検出困難な構造多型や複雑な転写産物異常を解像度高く同定可能にする。

【計算論的(in silico)予測モデリングの現状】

  • 非コード領域の制約(Constraint)指標: 従来のpLIスコア等に加え、非コード領域へ拡張された制約スコア(動画内では「noki score」として言及)が開発されている。ハプロ不全遺伝子のエンハンサー領域等で高いスコアを示す傾向が確認されている。

  • 機械学習モデルの課題: AlphaGenome等の深層学習モデルは、エピジェネティックマークやクロマチン立体構造等のデータ統合により、バリアントの多層的な「機能的影響」の予測には優れている。

  • しかし、バリアントの「機能的影響」と「疾患特異的病原性」は必ずしも同義ではない。病原性予測に特化したモデル(FINSURFなど)は良性バリアントの排除には優れるものの、希少疾患の真の原因バリアントを特定するための精度(Precision-Recall AUC)は依然として低く(0.12程度)、偽陽性の多さが最大のハードルとなっている。・・・・(以下略)』

LLM時代の各科学雑誌のAIポリシーがわかる動画を見ましょう!

TogoTVの最新動画です。LLMの助けを借りながら論文を書く際の注意点を知りたいと思う人むけのタイムリーな講演です。
AI査読というのは前に書いたようにめちゃめちゃな査読結果を返してくることがあります。その規制は当然として、論文作成についての過度な規制には反対です。英文校閲会社や翻訳サービスも生き残りをかけているでしょうね。また英語圏の人の論文発表に関する絶対的優位がくずれてきているので、それに対する反動もあると思います。自動車ができたときに馬しか使ってはいけない馬で移動しろとかいわれて、馬鹿正直にきいていると本当に馬鹿になります。ローカルLLMもあるわけで、こうしたポリシーもみなおされるか、ポリシーが異なる論文発表手段が出現するのではないでしょうか。歴史的には商業出版の衰退のはじまりかもしれません。

https://youtu.be/MbHK_LTiUJk

昨日書いたメール情報の流出の件。なんとログインIDとパスワードもセットで流出していたそうです。まだ対処していない方はすぐにパスワードを変更しましょう。今日はamazonの詐欺メールは来ていませんでした。しかし大手のメールサービスでこんなことがあるとは!

メールの情報漏洩があったようで対処しました!

ここ数日、私が使っている電子メールのプロバイダの、知らないアカウント名をfromにして、知らないメールアカウント宛てのメールがとどくようになりました。amazonのアカウントが一時停止しているとか、amazonの注文品の配送が滞っているとかいう内容です。あきらかな詐欺メールなのですが、どうやら私のメールアドレスがもれて、BCCに入れられて、ありもしないアカウント宛てのありもしないアカウントからのメールとして配信されているようです。ネットで調べてみると原因がわかりました。次のツイートをご覧ください。なおツイート内の記事へのアクセスはBraveブラウザの利用をおすすめします。Braveを使わないと、広告がいっぱいでて広告にうもれて記事を探すのが大変です。


メールのプロバイダのサイトにアクセスすると、メールのパスワードを変更するようにとでていて、さきほど変更しましたがメールアドレスとパスワード漏洩というのは初めての経験でした。パスワード変更用のサイトにはつながりにくかったのですが、ブラウザの再読み込みを何度かするとつながって無事変更終了しました。(再読み込みしないと、「アクセス集中でつながりにくい‥‥」といった画面をブラウザがおぼえているのでいつまでたってもつながりません)

大手のKDDIのメールサービスでの情報漏洩というのはびっくりですね。

いろんなファイルをAIに与える際に最適なMarkdown形式に変換するMicrosotのオープンソースソフトMarkItDownが便利そうです。

LLMにファイルをアップロードして入力するとき、ワードやパワポ、pdfなどをそのままアップロードできる場合もありますがうまくいかないこともよくあると思います。Markdown形式のファイル(.mdファイル)ならLLMが処理しやすく、トークンの消費量が減らせるので、LLMにはMarkdown形式のファイルで入力するのがおすすめのようです。Microsoftが公開しているMarkItDownというPythonのライブラリ(とCLIツール)なら多種多様なファイルをLLMが理解しやすいMarkdown形式のファイルに変換してくれます。

Office製品(Word, Excel, PowerPoint)はもちろん、PDF、HTML、CSV、JSON、XML、さらにはZIPファイル(展開して中のファイルを再帰的に処理)まで幅広く対応しています。音声ファイルや画像ファイルからの情報抽出(OCRによる文字起こしやExifメタデータの抽出など)にも対応しているそうです。 LLMはプレーンテキストよりも、見出しや表(テーブル)の構造が維持されたMarkdown形式のほうが内容を正確に把握しやすいという特性があります。MarkItDownは、文書のレイアウトや構造をできるだけ保ったままMarkdown化するため、自分のもっているデータをAIに読み込ませる(RAG構築など)際の前処理ツールとして非常に重宝されています。もちろん、どんな元ファイルでも完全に情報抽出できるわけではないので、 「検索インデックス作成やAIへのインプット用にテキストデータを取り出す」という用途を念頭に利用するとよいと思います。

いろんなところに解説がありますが、たとえばこちらなどはわかりやすかったです。

MarkItDown
NRIのOpenStandiaが提供するMarkItDown詳細情報
https://openstandia.jp/oss_info/markitdown/

NIHが地方の科学研究力を底上げするために提供している研究費IDeAで支援された、生物統計学夏の学校の講義が全部公開されています。

YouTubeのおすすめに生物統計学夏の学校2026の動画がでてきました。

2026年 SC INBRE 生物統計学サマーコース の全動画が公開されています。(SC INBREという略語については末尾に解説していますので参照してください。)
コースの講義の再生リストはこちらです。
2026 SC INBRE Biostatistics Summer Courses
https://youtube.com/playlist?list=PLXfqQzw0_6ejzRCFP1WZnfAMrUu2C-UKS
コースのホームページはこちらです。
https://www.scinbre.org/learning/bids-tutorials-and-workshops/2026-summer-workshop
Githubはこちらで、教材もそろっています。
https://github.com/alexmclain/INBRE-Bios-Summer-26

Week 1, Week 2, Week 3からなる講義シリーズで好きな週だけ学んでもよし、全部を学んでもよいという講義です。
Week 1とWeek 3の最初の回を埋め込んでおきます。

Week1はプログラミング言語Rについての知識が全くない生命科学者向けのRのチュートリアルです。
WEEK 1 (June 1-5): Foundations of Data Science in R Target: Assumes no prior R experience. All participants working with biological data.

Monday, June 1, Day 1 MORNING Course Overview & Orientation to Data Science Why data science in biology? Course logistics, expectations, reproducibility principles. AFTERNOON Getting Started with R and RStudio Why data science in biology? Course logistics, expectations, reproducibility principles
https://youtu.be/Gab9vTWU704

Week 3は
WEEK 3 (June 15-19): Bioinformatics & High-Dimensional Data Target: Genomics workflows, dimensionality reduction, penalized regression, and reproducible reporting.ということで、ゲノム解析と高次元データの扱い、再現性のある研究成果の報告についての講義です。

Monday, June 15, Day 11 MORNING – Genomics Data: Structure, Formats, and Public Databases FASTQ, BAM, VCF, count matrix formats; overview of NCBI/GEO/dbGaP; accessing public datasets; data provenance and metadata. AFTERNOON – Accessing Public Genomics Data Using GEOquery and Biobase to retrieve expression datasets; exploring metadata; quality assessment with basic EDA.
https://youtu.be/v7sTKbPGWOo

最後に見慣れない略語についての解説を書いておきます。
SC INBRE (South Carolina IDeA Networks of Biomedical Research Excellence) というのは、NIHが地域間の研究格差を是正するために提供している大規模な助成プログラム IDeA (Institutional Development Award)を使ってSC(サウスカロライナ州)が実施している生命科学の底上げプログラムです。 有名大学や研究機関が集中している場所との格差を是正し、医学生物学研究の基礎体力(インフラ、人材、研究環境)を底上げするために作られたのがIDeAプログラムです。 コアになるSCの研究機関と周辺の大学・研究機関のネットワークに対する助成プログラムなので、ネットワークという言葉が入っています。

今回の講義シリーズは、生物統計学の研究能力を底上げするためのものなので、日本の学生、研究者にも大いに参考になるのではないでしょうか。

ツイートのブログへの埋め込み法と、量子生物学についてのツイート、量子療法?についての記事の紹介です。

昨日、xのツイートが埋め込めなくなっていると書きました。ときどきxの仕様がかわるのでこういうことがあるらしいです。

そんなときは、ツイートのurlをこちらのサイトX Publish https://publish.x.com/
に入れると、埋め込みコードを生成してくれるのでそれをコピーして、ブログにペーストするだけでOKです。

ということで、量子生物学についての最新の動画と、雑誌New Scientistの記事の紹介が載っているツイートをペーストしておきます。

New Scientistの記事は昨日は全文読めたのですが今日は読めないようで、ご所属の機関の図書館など経由でご覧になるとストレスが無いと思います。動画は埋め込んでおきます。

YouTubeでquantum biologyというキーワードで動画を検索すると、怪しげな量子治療の動画がいっぱい出てきます。量子生物学で新しい治療法が開発できるでしょうか?New Scientistの記事がおすすめです。

著名人の人生回顧談を集めたYouTubeのサイト、Web of Storiesが面白いと思います。

数学者のStrogatzさんのツイートで、著名人の回顧談Life Storiesの動画を集めているサイトがあるのを知りました。Web of Storiesというサイトです。再生リストはこちらです。
https://www.youtube.com/@webofstories/playlists
生物学者でいえば、Watson, Jacob, Wolpert, Klug、Edelmanなど有名人の回顧談の動画をみることができます。化学者ではEigen、物理学者では、Wheeler,Dyson、Gell Mann, BetheなどのLife Storiesを見ることができます。
https://youtu.be/pToteaNcIdk

https://youtu.be/K4ev1F1zbNU

Strogatzさんのツイートを埋め込もうとしたのですが、x.comでツイートの埋め込み用リンクが表示されなくなりました。かわりに、nitter.netのリンクを挙げておきます。
https://nitter.net/stevenstrogatz/status/2067704392845857241#m

H.G. Wellsが脚本を書いた映画『Things to Come』(来るべき世界)(1936年制作)をYouTubeで観ることができます。

YouTubeのおすすめに 懐かしい映画がでてきました。

未来への希望 (1936) H.G. ウェルズの戦争映画 | 時代を 100 年先取りした作品。
Things to Come (1936年制作)という映画のカラー化されたものです。
https://youtu.be/iwTDqHrJ4vc

90年前に公開された映画で、私は子供のときにテレビで放送されているのをみました。テレビが一般に普及し始めたころ、東京タワーから放送が始まって間もないころは、午後は同じ映画を毎日放送していました。それで一週間毎日、この映画をやっていたのです。そんな子供時代にみて強烈な印象をもった映画です。戦争と細菌戦で疲弊した世界を技術者たちがたちあがって再建するという映画だったと思います。
こちらのWikipediaの項目によると、https://en.wikipedia.org/wiki/The_Shape_of_Things_to_Come
映画の脚本はH.G. Wellsが書いているそうです。彼のThe Shape of Things to Comeという1933年の作品(日本語訳『地球国家2106年』 H.G.ウェルズ 著 ほか『地球国家2106年』,読売新聞社,1973. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/12143736 (参照 2026-06-18))にもとづいているが、いろいろ変更点がある映画だそうです。

日本語字幕入りのバージョンがありました。
来るべき世界 Things to Come
https://youtu.be/BJaVDbAFaLQ

こちらのリンクからも同じ映画をみることができます。
1936: Things to Come
https://youtu.be/AjBB1hJpNfk

字幕なしのものなら、InternetArchiveでダウンロードできます。
Wikipediaに載っているのと同じあらすじが書いてある、こちらのページからのダウンロードがおすすめです
https://archive.org/details/things-to-come-1936_202506
画質が良いものも公開されています。
THINGS TO COME video quality upgrade
https://archive.org/details/THINGSTOCOMEVideoQualityUpgrade

二階堂先生のバイオインフォマティクスの教科書の最新版を作る方法

二階堂先生の教科書『AIエージェントを使いこなす はじめてのバイオインフォマティクス開発作法』のepub版を二階堂先生のgithubをgit cloneして作成する方法を以前の記事で紹介しました。

二階堂先生のオンライン教科書の例題用データのありか、EPUB化、Kindleへの配信法そしてファイルの指定法などをまとめました。

二階堂先生はこまめに教科書のアップデートをされているので、epub版も適宜、アップデートする方が良いと思います。今回は、そのやり方を書いておきます。
二階堂先生のgithubはこちらです。
https://github.com/dritoshi/ai-biocode-kata

すでに自分のPC にgit cloneしたディレクトリがあるはずなので、そのディレクトリに移動してターミナルから以下のコマンドをうちます。
git pull

このコマンドは、二階堂先生のgithubをgit cloneしたディレクトリの内容と、オンラインにある最新の二階堂先生のgithubの内容を比較して、変更点(差分)があれば自分のディレクトリの内容を上書きするコマンドです。git pullで二階堂先生の最新のgithubの内容に更新するというわけです。これで自分のディレクトリに最新の二階堂先生のgithubの内容が反映されたので、あとは前と同じコマンドを打てばおしまいです。
bash build/build_epub.sh

是非最新版に更新して勉強してみてください。