AI如同自然界生物的“演化”一样持续迭代,人类科研工作进入全新范式
- boke
- 2025-05-30
- 6:03 下午
2024年诺贝尔物理学奖颁发给了神经网络和机器学习,随后当年的诺贝尔化学奖授予了为蛋白质结构预测做出贡献的两个团队:一个是谷歌旗下的DeepMind,他们开发了AlphaFold算法;另一个是与DeepMind激烈竞争的华盛顿大学团队开发出的RoSeTTAFold算法。而这两种算法都是利用深度神经网络和机器学习做出来的。
2025年5月14日,Google DeepMind发布了一个名为AlphaEvolve的智能体,专门用于科学研究工作。从现有已公开的文章与科研实践案例中,AlphaEvolve已经能独立进行科学研究,甚至是人类科学家难以完成的科研项目。AlphaEvolve结合了Gemini AI模型编码能力,具备新算法有效性的测试,同时能实现新算法的持续演化;这样的演化算法如同自然界的生物演化,一代代的筛选改进,最终“演化”出优秀的解。

AI将带来科学工作范式的转变,将从人类主导训练专用AI模型逐渐发展到AI智能体,现在只是时间的问题。AI智能体作为科研合作者,参与人类科研协同优化假说,能够自主定义和执行任务,但假说主要基于现有知识的线性延伸;通过持续迭代演化,AI智能体能够产生从现有知识间接外推的创新性、从全新(de novo)假说,并独立设计实验进行验证,逐步优于人类科学家的水平。
生物学界科研范式最大的转变就是二十世纪50年代DNA双螺旋结构的发现。此后,一切重大发现都和遗传信息分不开。同样,生物学结合遗传信息使范式发生转变,分子生物学,分子遗传学、基因组医学、以及人类学等的科研与应用转化已发生了翻天覆地的变化。从临床医学里病因的检测到靶向药物与生物治疗的研发与转化,从农业与畜牧业中的分子育种到环境科学中对生态系统健康度的评估,以及法医学证据的确定,各种应用技术正在发挥至关重要的作用。
在生物学领域,AI从蛋白质结构预测大语言模型发展到多模态生成式语言模型,能推理出蛋白质的序列、结构和功能信息, 并可以根据复杂的提示生成全新的、具有特定功能的蛋白质。更为强大的是,该模型通过设定一系列条件规则后,多模态生成式语言模型(图1)可完成一个演化的模拟过程,生成在自然进化中可能需要数亿年才能出现的、具有特定功能的全新蛋白质。

图1 Simulating 500 million years of evolution with a language model
AI智能体为生物医学研究带来了变革性的潜力,能够加速科学发现,深化对复杂生物系统的理解,并促进生命科学的新型研究与技术转化。AI智能体能够提供结构化记忆以实现持续学习,并使用机器学习工具来整合人类创造与积累的科学知识、生物学原理和理论;能够进行反思学习和推理的可转换系统;可以协调大型语言模型(LLM),机器学习(ML)工具、各组学的实验平台,也能将其组合使用(图2)。

图2 Empowering biomedical discovery with AI agents
AI可以从海量的实验数据中摸索规律,以前这个工作是科学家做的。当AI改变了科研工作范式后,从前需要人思索、寻找规律和特征的工作,现在可以交给AI智能体去处理。而且其处理的速度至少是人类科学家的几万倍。复杂事物中最隐秘的规律会以从前几万倍的效率被AI探索出来。AI的迭代发展,将为人类基础学科的科研探索带来深刻的变化。现在我们需要积极的构建负责任的人类-人工智能合作关系的管理框架与体系,特别是人工智能在生物医学研究中的变革潜力,我们期待突破性的进步,最终是改善人类的健康和福祉。
参考文献
1.https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/
2.罗辑思维
3. Empowering biomedical discovery with AI agents,Cell 187, October 31, 2024
4. Simulating 500 million years of evolution with a language model. Science. 2025 Jan 16:eads0018.