糖鎖生物学に革命がもたらされるかもしれない内容のプレプリントがでました。タンパク質に付加されている糖鎖配列を機械学習を用いてアミノ酸配列から予測できる時代への第一歩です!

タンパク質に付加されている糖鎖は、生命の第三の鎖とよばれて、その配列はなんらかの未知のコードで一定に決められている(つまりタンパク質に付加されている糖鎖配列は一定で環境などによってランダムにきまるものではない)という論文は今までにも出ていました。本当に一定なのか、もし一定としたらどのように決まっているのかを解明しようと試みた2報のプレプリントが公開されています。最初の論文がこちら。タイトルからわかるように、糖鎖付加は蛋白質の構造で遺伝的に決まっているという仮説を検討した論文です。
Protein structure, a genetic encoding for glycosylation
https://www.biorxiv.org/content/10.1101/2024.05.15.594261v1
そして同じグループからの2報目の論文がこちら。様々なヒトの糖タンパク質(抗体とか新型コロナウイルスのSタンパク質など)についてマルチビューリカレントニューラルネットワークの手法で配列と構造を予測する試みについての論文です。
Decoding glycosylation potential from protein structure across human glycoproteins with a multi-view recurrent neural network
https://www.biorxiv.org/content/10.1101/2024.05.15.594334v1
今夜、糖鎖生物関係のXのツイートをみていて見つけました。査読は受けていないプレプリントですが新しい時代の到来を予感させる論文です。


AlphaFold3では長い糖鎖構造の予測はできませんが、プレプリントの著者らの方法では予測ができるようになってきているのがわかります。
機械学習を利用してAlphaFold3と組み合わせて糖タンパク質の立体構造を予測するというアイデアはみな持っていたと思いますが、その第一歩が踏み出されたというプレプリントとツイートです。論文を明日読んでみようと思います。