今日はタンパク質のpdbファイル(タンパク質の立体構造―原子の座標などを記述してあるファイルで、タンパク質のデータベースのPDBファイルのリンクからダウンロードできる)を用いて、類似の立体構造を持っているタンパク質を探すプログラム Daliの使い方を簡単に紹介します。
まず調べたいタンパク質の立体構造を記述してあるファイルPDBファイルをAlphaFoldのサーバーなどからダウンロードします。
https://www.alphafold.ebi.ac.uk/
今日は線虫C. elegansのN型糖鎖合成経路の遺伝子の一つ algn-13の立体構造を使ってみることにします。AlphaFoldのサーバーで「algn-13 C. elegans」のキーワードで検索して(Uniprotでも可能です)algn-13の項目を表示してPDBファイルをダウンロードします。
https://www.alphafold.ebi.ac.uk/entry/P92012
AF-P92012-F1-model_v3.pdbというファイルがダウンロードできたと思います。
そのファイルを保存した上で、Daliサーバーにアクセスします。
http://ekhidna2.biocenter.helsinki.fi/dali/
Daliサーバーのトップページには様々な便利なプログラムがおいてあります。今回はプログラムの中からAF-DB comparisonを使ってみましょう。これはAlphaFoldが予測したタンパク質の立体構造のPDBファイルを入力して、類似の立体構造を持っているタンパク質を(一つの種)から探しだすプログラムです。サーバーの負荷の観点から、検索は一つの種内でだけ実行できます。以下のリンクをクリックして表示されるページのSTEP 1からSTEP 4で検索が始まります。
http://ekhidna2.biocenter.helsinki.fi/dali/index.html#AFDB
STEP 1でパソコンに保存してあるpdbファイルの場所を入力します。
STEP 2で検索する種を一つ選びます。今回はHumanにしてあります。
STEP 3はオプショナルで、入力しなくてもいいですが、emailアドレスを登録しておくとメールで完了通知がとどきます。上のjob titleは今回の検索ジョッブのタイトルを適当につけます。
STEP 4でsubmitします。
画面が替わって、実行順番待ちの画面にかわります。Status: Queuedと表示されています。
画面がRunningになったら検索中です。
終わるとこんな画面になります。結果は一週間保存されるそうです。
Interactiveを押します。画面が替わって結果が一覧できます。
今回は試しに一番上のヒットであるNo.1を選択して、3D表示してみましょう。Expand gapsの隣にある3D superposition (PV) ボタンを押します。
結果が表示されます。
緑が線虫のタンパク質(Queryにチェックが入っています)、茶色がヒトのタンパク質(e7raA)です。薄く表示されているのはヒトのタンパク質のほうの全体です。線虫とヒトの二つのタンパク質の立体構造が見事に一致しているのがわかると思います。右の図はマウスで拡大縮小、回転など自由に動かして眺めることができます。Tutorialをみながらいろいろ試してみてください。これはBLASTとちがって直接、類似の立体構造をさがしてくれるのでとても有用です。私達がpsi-blastにもとづいて立体構造の類似を議論したがあったのですが、Daliでやってみると確かに類似の立体構造が確認できました。別のプログラムであるFoldseek
https://search.foldseek.com/searchもDaliとはまた違った結果がみられるのでこちらも結構役立ちそうです。