自分が研究しているタンパク質の立体構造をAlphaFoldで推定します。推定結果がでたら次にやってみたいことは、その立体構造と似たタンパク質がないか調べることではないでしょうか。PSI-BLASTなどの相同性検索でアミノ酸配列レベルではあまり似ていないのに立体構造が似ているタンパク質を探すのが今まで行われていた一つの方法です。今回、なんとAlphaFold DataBase (AFDB: AlphaFold Protein Structure Database https://alphafold.ebi.ac.uk/ )に、
推定された立体構造をもとに類似の立体構造を探索する有名なプログラムFoldseekが組み込まれたと発表されました。これはすごいことで、今私の興味があるタンパク質でやってみたところ、衝撃的な類似がみつかりました。
Foldseekは開発者のサーバーにいってpdbファイルをアップロードして使うか、
https://search.foldseek.com/search
Uniprotから使うなどの方法で利用できたのですが、
https://qiita.com/Ag_smith/items/63799b3beaa07c3990fe
AFDBに一本化されたのは画期的です。AFDBでタンパク質を表示させると似た構造の一覧が自動で下の方に列挙されると思います。列挙されなければ類似構造を探すボタンがあるのでそれを押してみてください。
皆さんも一度使ってみてください。思わぬ類似がみつかるといいですね!
It’s exciting to see Foldseek search integrated into the AlphaFold database. Now, you can explore similar structures in PDB and AFDB50 directly on each AFDB page, along with the Foldseek clusters! It is really great for the community to have independent servers as choice. https://t.co/oalJTNCPkP pic.twitter.com/Ik8yZLu9OC
— Martin Steinegger 🇺🇦 (@thesteinegger) September 12, 2024
試してみるタンパク質が思いつかないという方は、例えば昔このブログで紹介した、雪の結晶の種になるタンパク質inaZを試してみてはどうでしょう?
こちらのリンクに AFDBのIce nucleation protein inaZのページがあります。
https://alphafold.ebi.ac.uk/entry/P06620
このページの下の方にFoldseekの結果へのリンクがあるはずですのでご覧ください。なければボタンを押したらFoldseekが動いて数分後には結果が表示されます。
AlphaFoldで予測したタンパク質の中にはFoldseekでヒットする、他の細菌のice nucleation proteinがいっぱいあります。
しかしあとの方を見ていくと、思いがけない分子、たとえばStress protein DDR48 などというタンパク質が驚くほど似た立体構造(部分的に似ている)をもっているのがわかってFoldseekのすごさを実感できます。詳しいやりかたは明日、スクショを含めた記事を書きますのでそちらをご覧ください。