素晴らしいツールを紹介します。こちらのYouTube動画をご覧ください。
『AlphaFold Protein Structure Database Clustersを使ってタンパク質構造が類似するクラスターを検索する』
https://youtu.be/XYI3QRoSisM
この動画は、AlphaFold Protein Structure Database(AFDB)を基盤とした構造ベースのクラスタリングツール「AFDB Clusters」の基本的な使い方と実践的な検索手法を、非専門家にも分かりやすく解説したチュートリアルです。
タンパク質の三次元構造を一次元の3Diアルファベット(アミノ酸の種類と同じ20種類です)に置き換えるという画期的アイデアを利用して、立体構造の比較をものすごく高速で実行することができるようになりました。また3Diアルファベットはアミノ酸の種類と同じ20種類なので今まで利用されてきた配列比較アルゴリズムがそっくりそのまま利用できるようになっているのがブレイクスルーです。こうして超高速で立体構造比較が可能になり、それを実装したのがAlphaFold Protein Structure Database Clustersです。
https://cluster.foldseek.com/
上の動画は、このサイトの利用法を紹介している日本語チュートリアルです。
オープンアクセスで誰でもダウンロードしてよめる原論文はこちらです。
Barrio-Hernandez, I., Yeo, J., Jänes, J. et al. Clustering predicted structures at the scale of the known protein universe. Nature 622, 637–645 (2023). https://doi.org/10.1038/s41586-023-06510-w
まず上のチュートリアルを試してみて、そのあとで論文を読むとよくわかると思います。これは画期的なツールです!