2025年4月22日,Nature在线发表了美国哈佛医学院和麻省总医院研究团队就“通过可扩展工程和机器学习定制CRISPR—Cas9 PAM变体”的研究文章。
为实现Cas9酶的可扩展重编程,研究团队将高通量蛋白质工程与机器学习(ML)相结合,以设计更适配特定靶点的定制化编辑器。通过基于结构/功能的饱和诱变和细菌筛选,研究者获得了近1000种工程化SpCas9酶,并表征了其原间隔序列邻近基序(PAM)要求,从而训练出可将氨基酸序列与PAM特异性相关联的神经网络。
通过PAM机器学习算法(PAMmla)预测6400万种SpCas9酶的PAM特性,研究团队鉴定出在人体细胞中作为核酸酶和碱基编辑器时,其效能和特异性均超越进化来源及工程化SpCas9酶的高性能特异性酶,同时降低脱靶效应。
综上,PAMmla通过整合机器学习与蛋白质工程技术,构建了具有独特PAM需求的SpCas9酶库,并提倡在各类应用中采用高效安全的定制化Cas9酶替代通用型酶。