MPG Primerの最新動画でGWAS入門に最適な動画があります!

今日はChatGPT 5.4にPythonプログラムを作ってもらって試していました。これこれこんな動作をするプログラムをつくってくださいというプロンプトを入れるだけで、自分では絶対できないレベルの高度なプログラムができあがるのは感動的でした。ということでちょっと時間がないので、今回はGeminiに、さっきYouTubeのおすすめにでてきたMPG Primerの最新動画を解説してもらった結果を貼り付けることにします。このBroad Instituteの「MPG Primer」シリーズの講義動画(講師:Elyse Robinson博士)は、「ゲノムワイド関連解析(GWAS)の基礎から最新の課題まで」を、非常に明快かつ批判的な視点で解説した素晴らしい教材です。
https://youtu.be/c0knl0fX0DA?

(ここからがGeminiの出力です)
医学・生命科学を学ぶ学部4年生の皆さんに向け、この動画のエッセンスと、視聴することで得られる学びについて解説します。

動画の主な内容:GWASは単なる「統計」から「生物学の探索」へ

この講義は、GWASの歴史的な成功から始まり、現在直面している疫学的な落とし穴までを網羅しています。

  1. GWASの歴史と「パワー」の重要性
    • 2006年にはほぼゼロだった「ヒット(有意な遺伝子座)」が、今や100万件を超えています。
    • 統合失調症を例に、なぜ初期のGWASは失敗し、その後劇的に成功したのかを解説。個々の共通変異の影響(オッズ比)は非常に小さいため、数万人規模のサンプルサイズがいかに決定的であるか(「Power Smile」という概念)を学べます。 [05:18]
  2. 遺伝率(Heritability)の再定義
    • 双生児研究から推定される遺伝率と、SNPから計算される遺伝率の乖離(欠けた遺伝率)について、著者は「現在の生物学的発見においては、その差はそれほど重要ではない」と断言します。それよりも、共通変異が生物学的なプロセスの解明にいかに役立つかという実利的な視点が示されます。 [11:04]
  3. ポリジェニック・リスク・スコア(PRS)の真実
    • PRSの計算は単純なアルゴリズムですが、その予測精度は「手法」よりも「GWASのサンプルサイズ」に依存することを強調しています。 [23:10]
  4. 【最重要】疫学的な「落とし穴」と参加バイアス
    • GWASで得られた結果が、純粋に「疾患の生物学」を反映しているとは限りません。例えば、うつ病のGWASには、社会経済的状況(SES)に関連する要因も混入しています。
    • 「性別のGWAS」という興味深い例が登場します。常染色体には男女差がないはずなのに、UKバイオバンクのような「自発的な参加者」に依存する研究では、参加しやすさに関わる遺伝子が「性別に関連する遺伝子」として検出されてしまうバイアス(参加バイアス)の危険性を指摘しています。 [41:22]

この動画を視聴することで、GWAS初心者の学生でもわかるようになること

  • 「なぜGWASには巨大な人数が必要なのか」の論理的根拠:統計的な有意差だけでなく、負の選択(自然淘汰)との関係から、リスク変異のオッズ比が低く抑えられている理由が理解できます。
  • PRS(ポリジェニック・リスク・スコア)の「限界」と「強み」:臨床応用が期待されるPRSですが、何がその精度を決めているのか、なぜ解釈に注意が必要なのかが明確になります。
  • 「データがすべてではない」という批判的思考:最新のビッグデータ解析であっても、サンプルの集め方(疫学的背景)一つで、結果に「嘘」が混じることを具体例で学べます。これは将来、論文を読む際や研究計画を立てる際に不可欠な視点です。

学生の皆さんへ:なぜこの動画を見るべきか?

「GWASなんて、統計が得意な人がやるものでしょう?」と思っているなら、その考えは明日から変わります。この講義は、「統計の裏にある人間社会の複雑さ」を遺伝学がいかに捉え、あるいは騙されるかを教えてくれるエキサイティングな物語です。

4年生の皆さんがこれから卒論や大学院で向き合う「データ」には、必ずバイアスが潜んでいます。この動画で紹介される「性別のGWASでヒットが出てしまう理由」を知るだけでも、あなたのデータ解析に対するリテラシーは格段に向上するはずです。

最先端のBroad Instituteで行われている「本物の議論」に触れ、ゲノム医学の未来を肌で感じてみてください。

IBMの量子コンピュータ科学者がすすめる量子コンピュータと量子力学の必読書5冊。なんとガモフとセーガンの本も入っています!

IBMの現役の量子コンピュータ研究者であるOlivia Lanesさんの動画は何回か紹介しました。
今夜は彼女の最新の動画が出ていたので紹介します。
量子コンピュータや量子力学についての誇大宣伝満載の動画をみるのをやめて次の本を読むことをおすすめする、という動画です。
以前彼女が量子力学の入門書を紹介していました ( リンクはこちらの記事参照)が、
こちらは最新のおすすめ本になっています。
Stop Watching Quantum Hype, Read These Instead
https://youtu.be/inEP-FagPjM?

5冊の本はこちらです:
・Quantum Information Science, Mario Motta & Riccardo Manenti
・Quantum Mechanics: The Theoretical Minimum, Leonard Susskind & Art Friedman
・Thirty Years that Shook Physics: The story of Quantum Theory, George Gamow
(この本は翻訳が無料で読めます。ジョージ・ガモフ 著 ほか『現代の物理学 : 量子論物語』,河出書房新社,1980.4. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/12592653 (参照 2026-03-05))英語版は、Internet Archiveでダウンロード可能です。https://archive.org/details/ThirtyYearsThatShookPhysics-TheBirthOfQuantamTheory
・Building Quantum Computers. A Practical Introduction, Shayan Majidy, Christopher Wilson & Raymond Laflamme
・The Demon-Haunted World: Science as a Candle in the Dark, Carl Sagan
(この本が一番のおすすめの本で、似非科学やガセ情報にまどわされないための予防注射として有効な本です。カール・セーガンの亡くなる直前に出た本で彼の遺言書のような本とも言われます。翻訳は中古本の文庫本で読めます。いろんな題で出版されていますが、私の持っているのは、「人はなぜエセ科学に騙されるのか」というタイトルの文庫本(上下二冊)です。今は中古本でしか入手できないみたいですが、格安で購入できるようです。)今 気付いたのですが、英語版はInternet Archiveでダウンロード可能です。https://archive.org/details/B-001-001-709

最後にこれは私の推薦書です。ガモフといえばこの本をすすめます。無料で翻訳が読めます。
ジョージ・ガモフ 著 ほか『重力の話 : この古くて新しい謎』,河出書房新社,1977.5. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/9583303 (参照 2026-03-05)

AIを使ってYouTubeの科学動画(英語版など)を効率的に視聴しましょう!第3回 動画から字幕を作る方法

今日は科学系のYouTube動画のAIをアシスタントとして使う視聴法の第3回で、動画から字幕をWhisperで作る方法をまとめてみます。
第2回で書いたようにChatGPTはYouTube動画から字幕を取り出すことができない(Geminiはできる)ので動画のスクリプトをWhisperというソフトで取り出してそれをLLMに入れて使うというのが定番のようです。手軽な方法としてはChromeの機能拡張で字幕を取得してそれを使ってもよいわけです。ただ取得されるYouTubeの自動生成字幕はまちがっていることも多い(固有名詞の間違い、専門用語の間違いなど)ので、ChatGPTのおすすめはWhisperで字幕を作ることだそうです。NIH videocastでも字幕がダウンロードできますが、これも結構間違いがはいっています。ということで、Whisperの使い方をしらべてみました。
Ubuntuでの利用を前提にまとめてみます。

動画ファイルから音声のみを取り出してwavファイルをつくっておいて、それを利用します。動画からwavファイルをとりだすには、yt-dlpなどのツールを使ってください。
次のコマンドでURLとかいてあるところに動画のurlを書き込んで使います。
yt-dlp -x –audio-format wav URL

1)Whisperには二種類あります。OpenAI Whisperが公式版ですが、Pythonで動きGPU対応ですが少し重いという欠点があります。今はfaster-whisperが主流になっているそうです。研究用にはこちらがおすすめで、高速、CPUのみでも実用的、GPUにも対応、メモリー効率がよいなどよいことずくめのようです。

2)Whisperは基本的にオフラインで動作します。AIですので、最初の一回だけは字幕生成のためのモデルをダウンロードするために、ネットにつなぐ必要があります。Ubuntuでのfaster-whisperのインストールは次のコマンドで行います。
pip install faster-whisper

3)Pythonで動くので、インストールがちゃんとできたかをコマンドラインで確認します。Bashで
python
とうってpythonを起動しておいて、コマンドラインでつぎのコマンドを入れます。
from faster_whisper import WhisperModel

4)初回のみモデルがダウンロードされます。モデルは以下のようなものがあります。

モデル 精度 速度
tiny
base
small 普通
medium
large 最高

研究用には、small, mediumがよいそうです。ダウンロードしたモデルは、~/.cacheに保存されます。これ以降は完全オフラインで動きます。

4)実行例です。Pythonで動くのでpythonコードを例として挙げておきます。

from faster_whisper import WhisperModel

model = WhisperModel(“small”)

segments, info = model.transcribe(“lecture.wav”)

for segment in segments:
print(segment.text)
このコードでは、lecture.wavという音声ファイルをsmallモデルでテキスト化しています。

(私のコンピュータだと、1時間の動画を字幕にするのに、20-40分かかります。もっと高速化する方法については次回にまとめます。)

これでsegment.textに字幕が生成されました。ひとまずこのあたりまで試してみてください。(第4回につづきます)

Oxford Mathematicsの数学史の動画がわかりやすく面白いので紹介します!

YouTubeのおすすめにOxford Mathematicsの動画が出てきたので紹介します。
Oxford Mathematicsのプレ―リストはこちらです。
https://www.youtube.com/@OxfordMathematics/playlists
今日紹介するのは数学史の楽しい動画です。
Robin WilsonのSum Stories: Equations and their Originsという動画シリーズで、
https://youtube.com/playlist?list=PL4d5ZtfQonW0yqeFK__FirrjjmcQFpyye&si=WRxfzmW6YJJ4Q4–
方程式や数式の生まれた背景や歴史を解説してくれている一般向けの動画です。Wilson教授はOpen Universityの名誉教授でOxford大学のフェローの数学者です。四色問題やグラフ理論の研究者としても有名な方だそうです。
多くの専門書の他に、ルイスキャロルについての本とか、四色問題の啓蒙書など数学史に関係する本も書いているそうです。今回の動画は、彼の去年出版した本、Sum Storiesに基づいています。Oxford大学出版会から出た本でリンクはこちらです。

https://global.oup.com/academic/product/sum-stories-9780199607907?cc=jp&lang=en&#
本の目次をペーストしておきます。この中から選んで動画をつくっているようです。
『Preface
1:1 + 1 = 2
2:α + β + γ = 180°
3:a² + b² = c²
4:C = 2πr and A = πr²
5:ax² + bx + c = 0
6:φ² = φ + 1
7: = x
8:Mₙ = 2 − 1 and Fₙ = 2²ˆ + 1
9:C(n, r) = C(n − 1, r) + C(n − 1, r − 1)
10:VE + F = 2
11:y = mx + c
12:∫ f′(x) dx = f (x)
13:log (a × b) = log a + log b
14:i² = −1
15:eⁱˣ = cos x + i sin x
16:1 + 1/4 + 1/9 + 1/16 + 1/25 + . . . = π²/6
17:zₙ₊₁ = zₙ² + c
18:₀ + ₀ = ₀』

第一回の動画を埋め込んでおきます。本の第一章の動画です。なんと1+1=2という数式についての数学史です。
https://youtu.be/3lTPSjaANrs?

国立国会図書館デジタルコレクションで読める本の紹介(第42回)水平思考、数学、科学方法論など

今日はOpen AIのChatGPTplusの更新日が近づいたので、データエクスポートをして解約し、日本円決済3000円に切り替えようとしました。
サブスクリプションの解約ボタンをおすと、なんと無料で一か月つかってみませんかという表示がでたので、解約をやめてそちらに切り替えました。ドル建てで去年一年は消費税まで払わされていたので、これで少しは取り戻せたことになります。今、Gemini 3 proとChatGPTplusを使っていますが、同じプロンプトで試すと、私の用途にはChatGPTのほうがより深い回答がもどってきます。Geminiの使い方に慣れていないせいもあるのかもとも思いますが。

さて今日は久しぶりに個人送信資料で読めるもののリストです。国立国会図書館の個人送信資料は、今まで読めていたものが読めなくなることも多いので注意が必要ですね。あとで読もうと思ってアクセスすると消えていたりします。(たとえば、小平邦彦先生の著書などは全部読めなくなってしまいました!)

470) エドワード・デボノ 著 ほか『水平思考の世界 : 電算機時代のための創造的思考法』,講談社,1971. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/12655531 (参照 2026-03-02) 水平思考は昔大流行した本です。デジタルコレクションで検索するともっと翻訳本が読めることがわかります。
471) エドワード・デボノ 著 ほか『水平思考の学習 : 創造性のためのテキスト・ブック』,講談社,1971. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/12703075 (参照 2026-03-02)
472) E.デボノ 著 ほか『デボノ博士の「6色ハット」発想法』,ダイヤモンド社,1986.11. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/12655884 (参照 2026-03-02)
473) S.ラング 著 ほか『さあ数学しよう! : ハイスクールでの対話』,岩波書店,1987.3. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/12608808 (参照 2026-03-02) 高校生向けの本。ラングは解析入門という教科書でおなじみかもしれません。高校の数学の先生が進めてくださった解析入門はよい本でした。
474) H.フランダース 著 ほか『微分形式の理論 : およびその物理学への応用』,岩波書店,1967. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/1381918 (参照 2026-03-02) 先日紹介した微分形式についての有名な教科書。
475) イムレ・ラカトシュ 著 ほか『方法の擁護 : 科学的研究プログラムの方法論』,新曜社,1986.6. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/12590177 (参照 2026-03-02)
476) I.ラカトシュ 著 ほか『数学的発見の論理 : 証明と論駁』,共立出版,1980.4. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/12608176 (参照 2026-03-02)
477) P.K.ファイヤアーベント 著 ほか『方法への挑戦 : 科学的創造と知のアナーキズム』,新曜社,1981.3. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/12285431 (参照 2026-03-02) ファイヤアーベント の本はよく書店で見かけました。読んだことはありません‥。
478) パウル・ファイヤアーベント [著] ほか『理性よ、さらば』,法政大学出版局,1992.9. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/13249688 (参照 2026-03-02)
479) P.K.ファイヤアーベント 著 ほか『自由人のための知 : 科学論の解体へ』,新曜社,1982.6. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/12590164 (参照 2026-03-02)
480) 室井尚, 吉岡洋 著『情報と生命 : 脳・コンピュータ・宇宙』,新曜社,1993.12. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/13249341 (参照 2026-03-02)
481) C.G.ユング [著] ほか『パラケルスス論』,みすず書房,1992.3. 国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/13277307 (参照 2026-03-02) ユングの錬金術関係の本。ちょっと前にAmazonのKindleで文庫版を安売りしていました。

『もう一歩先へ進みたい人の 化学でつかえる線形代数』という本はよさそうです。

『もう一歩先へ進みたい人の 化学でつかえる線形代数』
北條 博彦 東大教授 博士(工学) 著 コロナ社:化学分野の諸問題に潜む線形代数の要素を,化学専攻の目線から解体・解説する。

この本はよさそうです。コロナ社のサイトで立ち読みをしてみましたが初めの部分は大変わかりやすく書けていました。
https://www.coronasha.co.jp/np/isbn/9784339061338/
線型代数が化学でどのように活躍しているかがよく理解できて、群とか量子化学も学べるお得な本のようです。目次をみると、分子構造と並進・回転運動、結晶格子、計量テンソル、対称性と群、テンソル、量子化学、そしてなんと多変量解析まで扱われています。コロナ社のサイトには、初版の正誤表、本の目次、書評などがまとまっているので是非一度みてください。

Kindle版  ¥3629,  紙の本  ¥3740 (税込)です。

フィールズ賞受賞者Terence Tao教授の動画やサイトを紹介します。

国際数学オリンピックで最年少で金メダルを獲得し、2006年に数学のノーベル賞といわれるフィールズ賞Fields Medal を受賞したTerence Taoカリフォルニア大学教授の最新の動画です。彼は、中高生から一般人、専門家まで幅広い人が数学を理解できるようにわかりやすいブログや記事、動画、本などで発信しているのでも有名です。このブログでも何度もとりあげていますので、検索窓にTaoといれて記事を検索してみてください。過去記事からわかるように、Tao先生は、AI(人工知能)を数学の研究にどう活用するかという分野にも積極的に取り組んでいて、LLM(大規模言語モデル)や証明アシスタントツール(LEANなど)の可能性をいち早く発信しています。

Terence Tao – Mathematics in the Age of AI
https://youtu.be/mS9Lr43cIB4?

ブログはこちらです。
https://terrytao.wordpress.com/

Terence Taoさんの大学(UCLA)のサイトは、上のブログへのリンクや様々な有用記事がのっていますので、こちらも一度のぞいてみるとよいでしょう。
https://www.math.ucla.edu/~tao/

たとえば数学の論文の書き方についてのページもあります。
https://terrytao.wordpress.com/advice-on-writing-papers/

SNSではmathstodonやblueskyのアカウントもあります。
https://mathstodon.xyz/@tao
https://bsky.app/profile/teorth.bsky.social

Gemini Thinkingで論文の紹介文をつくってみました。

役立ちそうな良い論文があったので、Gemini thinkingで論文の紹介文を作ってみました。プロンプトは以下のようなものを使いました。『』内がプロンプトです。
『Natureに掲載された次の論文https://www.nature.com/articles/s41586-026-10141-2はIDRs(天然変性領域 intrinsically disordered  region (IDR))の立体構造についての新しい解析手段の開発を報告しているようです。この論文を読むことを大学院生に勧めようと思います。この論文の新規性、大まかな構成、そしてこの論文の著者のGithubにあるツールを利用して何が新しくできるようになったのかを学生向けにまとめてください。学生はAlphaFoldを使ってIDRを含むタンパク質の表示できる程度の初心者を想定してください。オープンアクセスの論文のpdfをアップロードします。またGitHubのurlはこちらです。https://github.com/idptools/starling/
Responseをそのまま貼り付けておきますのでこのオープンアクセスの論文を読むときの参考にしてみてください。相分離生物学で大きな役割を果たしているIDR(天然変性領域 intrinsically disordered  region (IDR))を持つタンパク質の研究には画期的なツールだと思われます。


アップロードされた論文「Accurate predictions of disordered protein ensembles with STARLING」に基づき、大学院生向けの要約資料を作成しました。AlphaFoldなどの構造予測ツールに触れたことのある学生が、その一歩先にある「不規則な領域(IDR)」の物理的実態を理解するのに最適な内容となっています。なお固有不規則タンパク質(IDR)とかの訳は直訳過ぎて通常使われている天然変性領域IDRを持つタンパク質intrinsically disordered proteins ( 天然変性タンパク質:IDP)とすべきですが、LLMのアウトプットの例としてそのままにしてあります。また集団とあるのは、ensembleをLLMがこのように訳していることに留意してください。Geminiによるとこの論文でつかわれているensembleは統計力学でいうensembleのことで、初心者向けに集団と訳しているとのことです。


論文紹介:STARLINGによる固有不規則タンパク質(IDR)の集団予測

1. この論文の新規性:なぜ今「STARLING」なのか?

AlphaFoldの登場でタンパク質の立体構造予測は劇的に進化しましたが、IDR(固有不規則領域)については、依然として「オレンジ色のスパゲッティ」のような、特定の構造を持たない領域として表示されるに留まっています。

  • 「単一構造」から「集団(アンサンブル)」へ: IDRは特定の3D構造を持たず、膨大な数の異なる形(コンフォメーション)の間を行き来しています。STARLINGは、この「構造の集団」を直接予測できる点が画期的です。
  • 生成AI(拡散モデル)の応用: 画像生成AI(MidjourneyやDALL-Eなど)がテキストから画像を生成するように、STARLINGはアミノ酸配列という「プロンプト」から、その配列が取り得る無数の構造を高速に生成します。
  • 圧倒的な計算速度: 従来の物理シミュレーション(分子動力学法など)では数週間から数ヶ月かかっていた計算を、一般的なノートPCやデスクトップPCで「数秒から数分」で完了させることができます。
  • 環境応答の予測: 塩濃度(イオン強度)の変化によってIDRの広がり方がどう変わるか、といった溶液環境に応じた挙動も予測可能です。

2. 論文の大まかな構成

この論文は、ツールの開発から厳密な検証、そして実際の生物学的課題への応用までを網羅しています。

  • モデルの構築(Fig. 1): 変分自己符号化器(VAE)によるデータの圧縮と、潜在拡散モデル(Latent Diffusion Model)を組み合わせたアーキテクチャの解説。
  • 精度の検証(Fig. 2 & 3): 数万件のシミュレーションデータや、実験データ(SAXS:小角X線散乱、smFRET:単一分子蛍光共鳴エネルギー移動)との比較。既存の手法よりも高速かつ高精度であることを証明しています。
  • 生物学的応用例(Fig. 4): * がんに関連する Myc タンパク質の構造バイアスの特定。
  • RNAポリメラーゼIIのCTD領域における高分子物理学的性質の解明。
  • 異なるIDR同士が結合して複合体を形成する様子(相分離に関連する相互作用など)の予測。
  • 高度な利用法(Fig. 5): IDRの性質に基づいたデータベース検索や、特定の物性を持つ配列を設計する「デザイン」への応用。

3. GitHubツールを使って「新しくできるようになったこと」

この論文の著者らが公開している STARLING (GitHub) を利用することで、大学院生が自身の研究で以下のような解析を簡単に行えるようになります。

  1. 「動くIDR」の可視化:
    自身の研究対象のタンパク質に含まれるIDRのコンフォメーション集団を数秒で生成し、その広がり(回転半径 $R_g$)や形を定量化できます。
  2. 物理的性質が似た「そっくりさん」の検索:
    配列の類似性(BLASTなど)では見つからない、物理的な挙動(コンパクトさや電荷の並びなど)が似ている別のIDRを、3,500万件以上のデータベースから一瞬で検索できます。
  3. 実験データの解釈と統合:
    自身のSAXSデータなどがある場合、予測された構造集団を実験データに合わせて補正(Reweighting)し、より正確なモデルを作成するツールが内蔵されています。
  4. 新しいIDR配列のデザイン:
    「特定のコンパクトさを持つが、配列自体は全く新しいもの」といった、実験で検証するためのカスタム配列を数分で設計できます。

学生へのアドバイス:
「この論文は、『構造が定まらない=機能がない』という古い常識を覆し、IDRがその柔軟性や集団としての物性を通じてどのように生命現象を制御しているかを考えるための強力な武器になります。まずは、自分の興味あるタンパク質をGoogle Colab版のSTARLINGに入れて、数秒で構造集団が出てくる体験をしてみてください。」


Geminiは、さらにGoogle Colab版のSTARLINGの使い方ガイドとか、Ubuntuでの実行ガイドとかも作ってくれました。皆さんもお手もとのLLMでためしてみてはいかがでしょうか。

遺伝子では病気の原因の3割ほどしか説明できない!残りの7割は一体なんなのか?という動画が公開中です!

今日は、MITとハーバード大学が提供している連続講義シリーズMedical and Population Genetics Primer(MPG Primer)の最新の動画を紹介します。
MPG Primer: Why Genomics Needs Exposomics to Solve the Puzzle (2026)
https://youtu.be/waH9TBO_2kY?

Medical and Population Genetics Primer
January 22, 2026
Broad Institute of MIT and Harvard

演者はProf. Peng Gaoです。
Assistant Professor, Harvard T.H. Chan School of Public Health
Affiliate Faculty, Broad Institute

ChatGPTとGemini thinkingに動画のスクリプトをアップロードして内容を要約してもらいました。以下にそれらをもとに、私がまとめたメモをペーストしておきます。遺伝子はヒトの病気の原因の30%程度しか説明できないというこの動画はとても面白いと思います。是非、視聴してみてください。


この講義では、よく知られているゲノムgenomeと、聞きなれない言葉であるexposomeの関係、相互作用の重要性について学べます。-omeというのはomeの前についているもの全部の集合(数学的な意味の集合です)という意味です。gene全部の集合がgenome、タンパク質全部の集合がproteome、脂質全部の集合がlipidomeなどと使われます。ではconnectomeってなんだと思いますか?これは神経などでどの細胞と、どの細胞がつながっているconnectとしているかという情報の全部という意味です。今回の動画にでてくるexposomeというのは、生物が外界からさらされる影響の全部のという意味になります。つまり、エクスポソームは遺伝的要因以外のすべての外部因子の総称で動画によると次の4種類に分類されます。
1.化学的因子: 有機・無機汚染物質(農薬、重金属など) 。
2.生物学的因子: 微生物、ウイルス暴露など
3.物理的因子: 温度、湿度、放射線など
4.心理社会的因子: ストレス、感情、人間関係など(これまで見落とされがちだった重要な要素)

ヒトの表現型は非常に複雑で、ゲノム(遺伝子の全体)だけで全てを説明することはできないことがわかっています。560のヒトの表現型と遺伝子の関係を解析した大規模コホートの研究データ(2019年の論文)によれば、 ゲノム要因が表現型(疾患など)に寄与する割合は平均して約30%に過ぎない(“ChatGPTに探してもらった次の論文を多分念頭に置いていると思われますRepurposing large health insurance claims data to estimate genetic and environmental contributions in 560 phenotypes.”
Nature Genetics 2019;51(2):327–334.
DOI: 10.1038/s41588-018-0313-7. PMID: 30643253. 。
残りの約70%は、環境要因(エクスポソーム)または遺伝と環境の相互作用(GxE)によるものであると考えられるそうです。

この外部因子からの影響ですが、調べてみると同じ都市や近隣に住んでいても、個人の暴露プロファイル(Exposome cloud)は劇的に異なることがわかってきたそうです。また移動(旅行など)によって、化学的・生物学的暴露はダイナミックに変化することもわかったそうです。さらに個々の化学物質は基準値以下でも、それらが混合することで毒性が増強される相乗効果(シナジー効果)も確認されています。演者らは、プロテオミクス解析から、エクスポソーム物質の多くが免疫システムに関連する経路やタンパク質と相関していることをあきらかにしています。またメタボロミクス解析してみると、腎機能・肝機能・酸化ストレスに関連する経路とエクスポソームとの強い相関が示されたのだそうです。
エクスポソームを明らかにする作業はまだ始まったばかりです。高分解能で質量を精密に計測できる高分解能質量分析計(HRMS)を用い、どんなエクスポソーム因子が存在しているかを網羅的に解析する研究がはじまっているそうです。エクスポソーム因子のサンプリングには、シリコン製リストバンドを用いた受動的サンプラー(安価で大規模調査向き) やポンプを備えた能動的サンプラー(高価だが、化学物質と微生物の両方を精密に捕集可能)を使うとのこと。今後は、組織内での有害物質の分布を可視化するイメージング質量分析や、単一細胞レベルでの暴露解析(Single-cell exposomics)への展開を計画しているとのことでした。エクスポソーム研究は化学、生物学、環境科学、データ科学が融合した超学際的な分野であり、これらの統合が不可欠です。ただ個人の継続的なモニタリングによる被曝プロフィルの解明には非常に時間とコストがかかり、その上統計的な信頼性を確保するためのサンプルサイズの拡大のためのコストも将来的な課題として挙げられているそうです。

無料で軽量、そのうえWindows, Mac, Linux版もあるNDLOCR-LiteというOCRソフトが公開されました!

国立国会図書館(NDL)が、無料で使える和英両方対応で軽量なOCRソフトウエアを公開してくださいました。公開されたソフトウエアは、すでに公開されている国立国会図書館のGPUを使う本格的OCRソフトNDLOCRの軽量版です。昔NDLOCRを紹介した記事を末尾に埋め込んでおきます。今回のOCRソフトはGPUを使わず軽量でノートパソコンでも使えるほか、縦書きや手書きの日本語文書にも対応しているそうです。その上 Linux, Mac, Windows版も用意されているというすばらしいものです。

国立国会図書館(NDL)、OCRソフトウェア「NDLOCR-Lite」を公開
https://current.ndl.go.jp/car/274176

Gigazineには早速詳細な使い方が掲載されています。すごいスピードで良質の記事が載るのには感銘をうけます。
https://gigazine.net/news/20260225-ndlocr-lite/
これを読んで私も使ってみたいと思います。電子書籍のOCRにも活用できそうです。

昔の記事です。

専門家向けの感じの日本語OCR処理ソフトウエアが公開されています