2026年7月,AI在蛋白质设计领域的进展正在以一种前所未有的速度兑现为商业价值。如果说AlphaFold解决了"预测蛋白质结构"的问题——即给定一个氨基酸序列,预测它会折叠成什么样子——那么蛋白质设计解决的问题则更为根本:"我们需要一个能够实现特定功能的蛋白质,请帮我们设计出它的氨基酸序列。"从治疗疾病的抗体药物到降解塑料的工业酶,从新型疫苗的蛋白组分到食品工业的替代蛋白——AI驱动的蛋白质设计正在从实验室技术演变为能够创造千亿级市场价值的"生物制造新引擎"。
2026年5月,罗氏制药与AI生物技术公司Absci联合宣布了一项令整个制药界瞩目的成果——双方合作开发的AI抗体设计平台成功设计并验证了一种全新机制的抗肿瘤抗体。该项目的起点是一个明确的临床需求:针对一个此前被认为是"不可成药"的肿瘤靶点,需要设计一种全新的抗体结构来结合该靶点并激活免疫反应。传统的抗体发现流程——免疫动物、筛选杂交瘤、人源化改造——对这个"不可成药"靶点完全没有效果。Absci的AI平台"ZeroShot"则从一个完全不同的路径切入。
ZeroShot平台的核心是一个基于深度学习的"抗体-抗原结合预测器"。与传统方法需要大量的实验数据来训练模型不同,ZeroShot采用了"零样本学习"策略——它学习了数亿个已知蛋白质结构的物理化学特征,能够从一个完全陌生的靶点蛋白序列出发,直接预测出最有可能与该靶点高效结合的抗体候选序列。AI平台在短短数周内生成了超过1亿个虚拟抗体候选序列,并通过计算筛选将候选范围压缩到了约500个。罗氏的湿实验室团队对其中排名前50的候选抗体进行了实验验证,结果令人震惊——超过70%的候选抗体在体外实验中表现出了预期的靶点结合活性,其中2个候选抗体的结合亲和力达到了纳摩尔级水平,已经具备了候选药物开发的价值。整个从靶点输入到候选抗体验证的周期不到6个月,而传统方法需要2到3年。Absci的CEO在发布成果时表示:"我们正在从'用实验筛选碰运气'进入'用AI设计确定性'的时代。"
在工业生物技术领域,AI驱动酶改造的进展同样令人瞩目。2026年4月,全球化工巨头巴斯夫宣布与AI酶设计公司Profluent达成合作,利用AI技术对一种重要的工业用酶——PET水解酶(一种能够降解聚酯塑料的酶)——进行了全新的设计和改造。传统的酶改造方法——定向进化——通过随机突变和筛选来优化酶的性能,每次改造周期通常需要数月时间。而Profluent的AI酶设计平台则采用了"蛋白质语言模型"的方法——类似于GPT模型学习人类语言那样,AI学习了数百万种已知酶的序列和功能数据,从而学会了"酶功能的语法规则"。
在具体的项目中,AI平台在分析PET水解酶的天然结构后,预测出了几个关键氨基酸位点的突变组合,能够将酶的催化效率提升100倍以上。巴斯夫的实验验证团队按照AI的预测方案对酶进行了人工改造,结果AI预测的催化效率提升幅度与实际实验值之间的误差不到15%——在蛋白质工程领域,这是一个令人难以置信的预测精度。经过AI改造的超高效PET水解酶,在实验室条件下能够在24小时内将PET塑料降解90%以上,且降解产物可用于重新合成新的PET材料——这为实现真正的"塑料化学回收"循环提供了关键的技术基础。巴斯夫已宣布将在2026年底前建设基于该酶的中试生产线,目标是在三年内实现年处理10万吨PET废塑料的能力。
AI蛋白质设计的底层技术——蛋白质语言模型——在2026年上半年也取得了重大进展。Meta(原Facebook)旗下AI研究团队在2025年底开源了ESM系列的最新版本ESMFold 3.0,其参数量达到150亿,是目前规模最大的开源蛋白质语言模型。ESMFold 3.0不仅能够预测蛋白质结构,更重要的是能够"生成"具有特定功能特征的新型蛋白质序列。与ChatGPT生成文字的方式类似,ESMFold 3.0可以"续写"蛋白质序列——给定一个蛋白质的N端序列和功能描述,模型能够自主生成完整的C端序列,使得生成的蛋白质在模拟折叠中表现出预期的结构和功能特征。
Salesforce研究院开发的ProGen系列也在2026年6月发布了ProGen 2.5,在"可控蛋白质生成"方面取得了关键技术突破。ProGen 2.5引入了"条件控制机制"——用户不仅可以使用自然语言描述需要生成的蛋白质功能(如"生成一个在60°C下稳定的脂肪酶"),还可以指定目标蛋白质的二级结构比例、表面电荷分布甚至溶剂可及性等精细特征。这种"多条件控制生成"能力使得蛋白质设计的精细度达到了前所未有的水平——科学家不再需要在"性能"和"稳定性"之间做艰难的折中,AI可以在设计阶段就同时优化这两个维度。Salesforce联合华盛顿大学在bioRxiv上发表的预印本论文显示,ProGen 2.5设计的100个新型酶序列中,有68个在湿实验验证中表现出了预期的催化活性——对于"从零开始设计的蛋白"来说,这是一个非常令人惊讶的"命中率"。
中国在AI蛋白质设计领域的追赶速度同样不容忽视。百济神州在2026年3月成立的AI药物研发中心,将AI蛋白质设计作为核心方向之一。该中心推出的"百济·蛋白质智造"平台,基于国产大模型GLM进行微调,专注于抗体药物的可变区设计和优化。据百济神州公布的数据,该平台在抗CD47抗体的人源化改造项目中,将传统需要6到12个月的抗体人源化周期压缩到了不到3周,且改造后的抗体在保持抗原结合亲和度的同时,免疫原性风险评分降低了约40%。
华大基因则在AI蛋白质设计的下游——蛋白质合成与表达——环节取得了重要突破。华大与中科院上海生命科学研究院合作开发的"AI辅助蛋白质表达优化系统",通过预测蛋白质在不同表达系统中的可溶性、正确折叠率和表达量,帮助研究人员跳过了大量的试错性表达实验。在实际项目中,使用该系统的蛋白质表达成功率从传统的不足30%提升到了78%,平均每个蛋白质从基因合成到获得可溶性蛋白的时间从3个月缩短到了3周。AI蛋白质设计的完整链条——设计→预测→表达→验证——正在被逐步打通,一个由AI驱动的"蛋白质制造工业"正在从梦想变成现实。可以预见,在未来3到5年内,AI将在很大程度上替代传统的"试错式"蛋白质工程方法,成为生物制造和新药研发领域的标配基础设施。