統計解析の流れ(データ収集から論文投稿まで)を具体的に学べるよい日本語のサイトがあります。

統計についてのサイト紹介です。京都大学医学部の統計解析の専門家で特定教授のた田中司朗先生のサイトです。
https://gestimation.github.io/coffee-and-research/jp/
Coffee and Researchという名前のサイトです。統計家の父と、臨床医師の娘の臨床研究についての対話編です。統計解析、因果推論、論文執筆から投稿までのエッセンスが学べるようです。私は全然読んでいませんが面白そうです。英語版もあり、使っているR言語のコードも公開されています。田中先生はRのパッケージも作成・管理されており、Rの専門家でもあるようです。

はじめての方へというサイトの読み方案内の部分を引用しておきます。

この物語は、研究仮説→統計→因果→言語という順で、ある臨床研究を描いています。迷った方へのおすすめエピソードはこちら。

会話のはじまりと研究仮説(Study Design I)
95%の誤解を一刀両断(Effects and Time I)
交絡・因果推論の入り口(Adjusting for Bias I)
よりよい論文を書くための3箇条(Publish a Paper II)

どのエピソードも独立しているので、興味の向くレイヤーを選んでも構いません。

このサイトを紹介してくれていたこちら
わたヤク@AI臨床研究 (@ai_biostat)のツイートも役立ちそうです。
https://nitter.net/ai_biostat

日本発の統計解析ソフトEZRの無料入門書が公開されています。

酒井雄志さんのツイートはいつも参考になる情報が多いのでたびたび見させてもらっています。
https://nitter.net/830RDEkpvteEODM
酒井さんがretweetされていた以下のポストには、Rをグラフィカルインターフェイスで簡単に使えるソフトEZR(easy Rとよみます)の無料入門書が紹介されていたのでメモしておきます。ダウンロードして読んでみるとよいでしょう。

EZRは統計解析ソフトの世界標準であるR(無料で使えます)をマウス操作でグラフィカルユーザーインターフェイスで使える日本発のすばらしいプラグインです。RStudioからも使えます。RStudioからの使い方やEZRの使い方についてはこのブログでも以前解説していますので検索窓にEZRといれて検索してみてください。EZRがあれば統計解析は初心者でも簡単に行えます。標準的な解析でよい場合には、専門家に相談する必要もなく簡単に解析できるので、まだ使っていない人は是非使ってみてください。様々な統計解析手法が日本語で利用できます。


このツイートが載っているアカウント 医療統計start-upサロンは他にもいろんな情報が記載されていて面白そうです。https://nitter.poast.org/tokei389950

ハルシネーションなしでPubMed検索するためのMCPサーバーのいろいろ。

ここしばらく、昭和医科大学横浜市北部病院 准教授の三澤 将史 先生の動画で知った、AIを使ってハルシネーションなしに文献検索する方法を試していました。MCPサーバーをたてて検索は必ずMCPサーバー経由で行うように設定しAIに勝手な推論や妄想をさせないようにすることが大事で、その一方、検索式の作成(キーワードの選定、検索のヒット数が少ない時に、検索キーワードを変更してトライアル・アンド・エラーをするなど)は自動で動くAIにまかせます。これは架空の文献をでっちあげないので画期的な方法です。今日は、ChatGPTに三澤先生のMCPサーバーと同様な検索ができるものが他に公開されていないかを調べてもらいました。いくつかあるのですが、PubMed検索に特化して設計された三澤先生のものが世界中で一番使いやすく信頼性がおけるようでした。ChatGPTがみつけてきた類似サイトを以下に列挙しておきますので参考にしてください。

  1. andybrandt/mcp-simple-pubmed(最小・分かりやすい)GitHub

  2. Augmented-Nature/PubMed-MCP-Server(機能多めで拡張の参考に)GitHub

  3. codingaslu/PubMed-MCP-Server(BioPythonベースの素直な実装)GitHub+1

  4. cyanheads/pubmed-mcp-server(npm配布ありで運用系の参考に)GitHub+1

4つとも、ChatGPTとかGeminiとかに相談しながらやれば初心者でも簡単に設定して試せると思います。Entrez経由の検索のものもありますね。

MCPサーバーを使ったPubMedの文献検索を実際に試してみました!すごいの一言です。

12月30日の記事に書いた以下の動画に従って、MCPサーバー経由での文献検索を試してみました。目をみはる詳細な文献検索ができますね。これを使わない手はないと思いました。
第16回 岡山MUSCATフォーラム特別講演
『医療における生成AIの活用法― 臨床から研究までの実践ガイ ド ―』
昭和医科大学横浜市北部病院 准教授
三澤 将史 先生 MISAWA Masashi MD, Phd
https://youtu.be/9RhCUDjIJa0?
埋め込み再生禁止になっている動画なので、上のリンクからYouTubeでご覧ください。

年末から今日までかかって、この動画にしたがってChatGPTからPubMed のID付きで文献検索の結果を返してくるMCP サーバー経由のPubMed検索の機能をためしてみました。三澤先生の動画にあるQRコードで開く講演資料をひらいて、先生のGitHubにいくとMCPサーバー用のPython scriptが置いてあるのでそれを使うことになります。設定方法は資料のとおりにやってみてください。MCPサーバーは無料モードで利用できるKoyebというというプラットフォームにおくことになります。詳細な使い方も動画にあるQRコードからみることができるのでそちらに従えばよいでしょう。結構簡単に設定できて使えるようになります。動画にあるように、簡単な日本語の指示で詳細な検索と検索結果のまとめをしてくれるので、感動しました。よい時代になりました!

私はChatGPTのバイブコーディングでローカルPCにPubMed用のサーバーを立ち上げて検索するようにしました。この際、ChatGPTはlocal hostのurlにはアクセスできないのでngrokというサービスを利用してChatGPTがアクセスできる外部公開用urlを使うようにしました。ChatGPT 5.2 thinkingモデルでうごかしてみると、すごいですね。簡単な日本語プロンプトで詳細な文献調査ができて架空の文献をでっちあげるタイプのハルシネーションもないので快適です。thinkingモデルはものすごく詳細に文献検索しますね。私が手作業で集めていた文献以外に、見落としていた文献が結構みつかりました。文献検索にこのツールをつかわない手はないと感じました。ハルシネーションがないというのは、実在の文献のみを見つけるという意味で、見つかった文献の要約ではハルシネーションは起こりえます。たとえば人間と同じように内容を誤読したり、相関関係を因果関係と誤解したりなどいろいろなタイプのハルシネーションがあり得るので、研究やレポート作成に使うときにはPMIDで原論文をみて確認しなくてはいけません。


以下にChatGPTが書いてくれたMCPサーバーを使う検索についての説明をペーストしておきますので参考にどうぞ。

MCPサーバーを使ったハルシネーションを抑えた PubMed 検索のしくみと使い方

1. なぜ普通のAI検索は危険なのか

ChatGPTのような生成AIはとても賢く、
・文章を要約する
・関連分野を整理する

といった作業は得意です。一方で、存在しない論文をそれらしく作ってしまうことがあります。
これを ハルシネーション と呼びます。

例:
実在しない論文タイトル
存在しない著者名
PubMedに載っていないPMID
研究やレポートでは、これは致命的です。

2. 解決策:AIに「検索」をさせない

重要な考え方はこれです:
・AIに論文を探させない
・AIには「PubMedの検索結果を読むだけ」にさせる
そのために使うのが MCPサーバー です。

3. MCPサーバーとは何か(役割分担)
MCP(Model Context Protocol)の考え方
MCPサーバーは、ChatGPTと外部データベースを安全につなぐ「通訳」です。
今回の構成では、役割が明確に分かれています。

役割      担当
論文検索   PubMed
検索の実行   MCPサーバー
要約・説明   ChatGPT

今回の仕組みではChatGPTは 自分で論文を探しに行けません。
MCPサーバー経由で PubMedが返した結果しか見られない 仕組みです。

4. なぜハルシネーションが抑えられるのか
決定的なポイント:PMID
PubMedの論文には PMID(論文ID)が必ずあります。
MCPサーバーを使うと:
PubMed → 実在するPMIDだけを返す
ChatGPT → そのPMIDをもとに要約する

という流れになります。

👉 存在しない論文は、物理的に出せません

これが最大の理由です。

5. 全体の流れ(図をイメージ)
あなた(質問)

ChatGPT(考える・要約する)

MCPサーバー(検索を代行)

PubMed(実データ)

PMID付き結果

ChatGPTが説明

ChatGPTは PubMedを直接検索しているわけではない ことが重要です。

 

6. なぜ「thinking mode」を使うのか

ChatGPT 5.2 thinking mode は、
・検索結果を比較する
・複数論文の共通点・相違点を整理する
といった 論文読解向けの推論 が得意です。

重要なのは:
・thinking mode = 正しい情報を作るのではない
thinking mode + MCP =正しい情報を、深く考えて説明する

という組み合わせです。

7. 正しい使い方(必ず守ること)
PMIDが出ていない説明は信用しない
気になる論文は PubMedのページを必ず開いて確認
最終レポートでは 原文を自分で読む

OKな使い方

論文全体の流れをつかむ
レビュー論文の要点整理
複数論文の比較

NGな使い方
ChatGPTから出てきた説明をそのまま引用
PMIDを確認せずに結論を書く

8. まとめ

このMCPサーバー経由の文献検索の方法は「AIを信用する」のではなく
「AIがウソをつけない構造を作る」やり方です。

研究でAIを使うときに一番大切なのは、
仕組みを理解した上で使うことです。

 

あけましておめでとうございます。皆様にとって本年が素晴らしい年となりますように。MPG Primerの臨床ゲノム関係の動画を紹介します。

あけましておめでとうございます。皆様にとって本年が素晴らしい年となりますように。本年もどうぞよろしくお願いいたします。
今日の元旦は初日の出の時刻には晴れていて初日が拝めました。しかし午前中から曇りになって一日中、曇って寒い一日でした。近所の宇美八幡宮
https://www.umi-hachimangu.or.jp/へ参拝にいきましたが、ものすごい人出でした。

神社の入り口から本殿まで人の列がつながっている、と思ったのですが なんと入り口の大鳥居のあたりが列の末尾ではなく、なんと神社の外側を半周する列になっていました。寒い中、本当にたくさんの方が並んで参拝しておられました。

さて今日は、いつも紹介しているMITの集団遺伝学の医学への応用についての講義シリーズMPG Primerの最新の動画2本を紹介します。
MPG Primer (Medical and Population Genetics Primer)については、末尾の過去記事リンクを参考にしてください。

MPG Primer: ClinGen, ClinVar and other Clinical Genomic Resources (2025)
https://youtu.be/hqefb2FI-EE?

遺伝子配列の変異を臨床での症状につなげるためのデータベースClinGen, ClinVar(二つは共同して開発されているデータベースです)についていろんな病気を例にしながら解説している入門動画です。

MPG Primer: Iqbal Lab | The Genomics 2 Proteins Portal (2025)
https://youtu.be/K_uFIJocNAM?

タイトルに含まれている2はtoの意味です。ゲノム解析の結果からタンパク質情報(アミノ酸配列や立体構造)へのリンクを発見するためのポータルサイトについての講演です。
https://g2p.broadinstitute.org/ がサイトで、論文はこちら。
Genomics 2 Proteins portal: a resource and discovery tool for linking genetic screening outputs to protein sequences and structures
Nature mehtodsのオープンアクセスの論文です。論文も動画と合わせてご覧になるとよいでしょう。
https://www.nature.com/articles/s41592-024-02409-0

関連する過去記事の一例です。

MPG Primer講義シリーズの最新動画二本を紹介します!

本年もこのブログを読んでいただきましてありがとうございました。

本年もこのブログを読んでいただきましてありがとうございました。来年もどうぞよろしくお願いいたします。また、皆様にとって来年が素晴らしい一年となりますようにお祈り申し上げます。

今日はオープンアクセス本をいくつか紹介します。
1) 生命科学のための微分積分学―線形代数学をいたるところで利用して解説してあるので、線形代数も学べる初学者向けの教科書
https://open.library.ubc.ca/soa/cIRcle/collections/facultyresearchandpublications/52383/items/1.0450085

2) Scientific Computing for Chemists with Python
https://open.umn.edu/opentextbooks/textbooks/scientific-computing-for-chemists-with-python
Publisher: Charles J. Weiss3) Introduction to Technical Writing: A Rhetorical Approach
https://open.umn.edu/opentextbooks/textbooks/introduction-to-technical-writing-a-rhetorical-approach
Publisher: The Pennsylvania Alliance for Design of Open Textbooks (PA-ADOPT)
テクニカルライティングというタイトルですが、これは如何に技術的な注意や情報を一般に伝えるかについて書かれた本です。たとえば飛行機に乗るときに流される安全のための注意がどのように改良されていったか、コロナで人と人との間隔をあけるようにという注意をどんな看板とかでおこなったのか、どんなのが効果があったのかなど、実用的なマニュアル作成の極意を探る教科書になっています。例えばこんな面白い動画へのリンクも載っている本です。
The Most Epic Safety Video Ever Made #AirNZSafetyVideo
https://youtu.be/qOw44VFNk8Y?

4) A Contemporary Approach to Research and Statistics in Psychology
https://open.umn.edu/opentextbooks/textbooks/a-contemporary-approach-to-research-and-statistics-in-psychology
Publisher: Council of Australian University Librarians
これは無料の統計解析ソフト jamovi (a free and open-source statistical software】を使った統計解析の初心者向け教科書です。

5) Statistics with JASP: First Steps for Psychology Students
https://open.umn.edu/opentextbooks/textbooks/statistics-with-jasp-first-steps-for-psychology-students
Publisher: University of Sheffield
こちらは、同じく無料の統計解析ソフトJASP(RをGUIで使えるようにしたもの)を使った統計解析の教科書です。JASPは統計解析ソフトの王者Rを利用しているので、Rを手っ取り早く使いたい人には向いています。もっともEZRなどがあるのでそちらを使っている人が多いかと思いますが‥‥。

6) Introduction to Computer Programming with Python
https://open.umn.edu/opentextbooks/textbooks/introduction-to-computer-programming-with-python
Publisher: Athabasca University
先日紹介した山本先生のPython入門と合わせて読むとよさそうな本です。

7)Engineering Thermodynamics
https://open.umn.edu/opentextbooks/textbooks/engineering-thermodynamics
熱機関や冷蔵庫の原理などの基礎になっている熱力学の教科書。詳細な計算例と解答付の練習問題がついている教科書だそうです。

8) Learning Digital Photography
https://open.umn.edu/opentextbooks/textbooks/learning-digital-photography
Publisher: North Idaho College
これはデジカメで写真撮影するための入門教科書です。お正月休みにどうぞ。

では皆さん、よいお正月をお迎えください。

生命科学研究者のための生成AI活用法の動画―これは今年一番の動画ではないでしょうか!必見です。

第16回 岡山MUSCATフォーラム特別講演
『医療における生成AIの活用法― 臨床から研究までの実践ガイ ド ―』
昭和医科大学横浜市北部病院 准教授
三澤 将史 先生 MISAWA Masashi MD, Phd
https://youtu.be/9RhCUDjIJa0?
埋め込み再生禁止になっている動画なので、上のリンクからYouTubeでご覧ください。

私が見た中では、今年一番の生成AI活用法の動画です。医療における活用法となっていますが、内容は生命科学系のすべての研究者、そして一般論についてはすべての人に役立つ内容となっています。ChatGPTの科学向けの設定やプロンプトってなんなのかというレベルの初心者向けの解説からはじまります。しかし最後は自分でMCPサーバーをたちあげてPubMed検索することでハルシネーションを防ぐ方法まで解説してくれています。動画の中にあるQRコードからアクセスできる資料には動画で説明されていたすべてのプロンプト、MCPサーバーの設定法など、自分で生成AIを使って研究する練習に必要なすべてのデータがそろっています。

ChatGPT, Gemini, Claudeを例にとりながら例えば以下のような内容を学ぶことが出来ます。
・生成AIで論文を要約したり図解したりする方法
・論文から一気にスライドを作る方法
・実験手法などのマニュアルを動画から作る方法
・医療従事者専用のAIの紹介とAIの使い方の注意点
・プロンプトエンジニアリングのコツ
・論文セミナー準備bに役立つプロンプト
・文献検索のやり方
・類似論文や正反対の結論を出している論文の探し方
・ディスカッションの書き方
・生成AIで論文作成や査読を行おうとする際の注意点
・csvファイルからグラフを作らせる方法
・NoteBookLMの使い方
・生成AIを使って論文を書く方法のいろいろ
・論文のアブストラクトの作り方
・英文校閲用のプロンプト
・リジェクトされた論文の再投稿用に論文のフォーマットを変更する方法
・論文本文中の略語リストをもれなく作る方法 等々

動画を見た後、ChatGPTにPubMedのMCPサーバーを経由する検索法についていろいろ聞いてみました。
ChatGPTはこの手法で必ずPubMed IDのある文献のみが取得できるので、この手法が生成AIがでっちあげる文献をゼロにするのに有効な方法だとこの講義を絶賛していました。
そこで私は、ChatGPTも5.2になって、MCPサーバーを使わなくてもハルシネーションは減ったのではないですかと尋ねてみました。
するとモデルが改良されたのでより巧妙にウソの文献情報をでっちあげる危険性があるので注意してほしいと答えてきました。
講義や論文投稿用の文献調査とかにはMCPサーバーを介した調査が安全なのだそうです。ただし、こうして実在の文献を取得したとしても、その要約などの過程でハルシネーションが起こって、うその要約を行う可能性もあるのでそこは注意すべきだとのことでした。

山本 典史先生の大変役立つ第一原理計算の講義資料が公開されています。

山本先生の講義資料が公開されています。量子化学の第一原理計算の実習付き入門講義ですが、下のほうにまとまっているGoogle Colabの解説、化学者のためのPython入門、GPAWとASEの基本的な使い方の資料は役立つと思います。まずこれらの資料を勉強してから基礎講習の資料を学ぶとよいでしょう。

データ駆動型材料科学・基礎講習:第一原理計算でデータをつくる
https://yamnor.me/ddms/

資料①|Google Colab とは?
資料②|化学者のための Python 入門
資料③|GPAW の基本的な使い方
資料④|ASE の基本的な使い方


化学者のためのPythonの使い方の本としては、英語の本ですがオープンアクセスのこの本などもよさそうです。
https://open.umn.edu/opentextbooks/textbooks/scientific-computing-for-chemists-with-python
Scientific Computing for Chemists with Python
Charles J. Weiss, Augustana University
Copyright Year: 2025
Publisher: Charles J. Weiss

スピントロニクスの時代です。スピンについて理解しましょう!

物理の今年のアドベントカレンダーに面白い記事がいっぱいありました。
https://adventar.org/calendars/11490

その中に、スピンとはなにかが、すっきりわかりやすく理解できる解説記事があって、これはわかりやすいと感動したので紹介します。著者の方のツイートはこちらです。


これはとてもわかりやすいスピンの説明の他、スピンの発見史、スピンがなぜ生まれるかの説明もあって素晴らしい記事です。
これを読んでから、朝永振一郎の「スピンはめぐる」などを読むと理解が格段に深まるのではないでしょうか。

他にも、相転移Pさんの物理のための関数解析入門:中高数学からデルタ関数・発散の困難まで
https://phasetr.com/archive/fc/phys/introduction-to-functional-analysislinear-for-physics-students/
も読んでみたくなる記事でした。上のリンクをクリックすると読めますが、pdfがブラウザ内のフレームに埋め込まれて表示されて読みにくいです。pdf表示のフレーム右上にあるポップアップボタンのアイコンをクリックして下さい。新しいタブにpdfが表示されるので、右上のプリンタアイコンの右にある、Open Originalというボタンを押します。するとpdfが普通のpdfの表示モードで読めるようになります。画面にあるダウンロードボタンでダウンロードすることもできます。

その他の記事には、一般相対性理論で水星の近日点移動を厳密に計算するという記事や、LLM(ChatGPTやGemini)を使いながら作られた記事などいろいろあって、LLMの使い方の勉強にもなります。量子力学100年史の記事も面白そうでした。」

理化学研究所による日本語による量子力学の入門講演動画が必見です。量子生物学の入門動画もありますよ!

これは物理ファンには必見の動画です。理化学研究所主催の量子科学誕生100年記念シンポジュウムの全部の講演を視聴することができます。私は理研の岡田先生の量子生物学の入門紹介動画を特におすすめします。他にも量子についての入門解説、量子コンピュータ、トンネル効果などもりだくさんで、どの講演も面白いので是非全体を視聴しましょう!
シンポジュウムの内容をYouTubeから転載して末尾に載せておきます。

量子科学誕生100年記念シンポジウム 「量子ってなに!?」〜私たちの生活に欠かせない量子の基礎から最前線までまるごと早分かり!!
https://youtu.be/-P39aaRMhcA?

◼️チャプター◼️
0:00 オープニング
1:07 「ご挨拶」 五神 真
7:46 「ご挨拶」 小林 誠
13:56 「量子って何?」 野村 泰紀
1:07:15 「日本における量子力学の事始め」 伊藤 憲二
1:25:30 「分子のふるまいを決める“見えないルール”―それが量子科学です!―」 畑中 美穂
1:46:25 「固体中での量子現象:電子がたくさん集まると何がおこる?」 川上 則雄
2:05:00 「神様はサイコロで生き物を作った!?」 岡田 康志
この量子生物学についての講演は以下の埋め込み動画を再生するとすぐにみることができます。
https://youtu.be/-P39aaRMhcA?&t=7500

2:27:30 「通れないはずの壁を原子核が通りぬける:星が輝くわけと量子力学のふしぎ」 萩野 浩一
2:49:24 「光子のふしぎな性質と、光量子センシング」 竹内 繁樹
3:10:25 「量子コンピュータを作ろう!」 中村 泰信