2022年11月30日,美国人工智能实验室OpenAI发布ChatGPT。ChatGPT问世即一举成名,引起全球热议。微软公司表示将把ChatGPT整合到搜索引擎Bing和网络浏览器中,并向ChatGPT的创建者Open AI投资100亿美元;此外ChatGPT成功面试谷歌编程;小说、剧作、漫画ChatGPT也信手拈来。短短两个多月,ChatGPT让人惊叹的表现不胜枚举,人工智能新时代的序幕由此拉开。那么,ChatGPT到底是什么?ChatGPT:Chat Generative Pre-training Transformer,即预训练生成模型,它是能够创建真实对话的深度学习语言模型。它以对话的方式进行交互,能够回答连续性问题、承认错误并进行纠正、质疑不正确的假设,甚至拒绝不适当的请求,是一款具备“学习”、“理解”和“思辨”能力的聊天机器人。(图片来源:https://learnchatgpt.com)ChatGPT的出现引发的这场AI风暴,令我们不得不感慨人工智能发展之迅速。在生物领域,人工智能近年来也取得了瞩目的成就。前几年AlphaFold2的横空出世,使蛋白质结构预测有了质的飞跃,而今,ProGen的亮相又一次颠覆了蛋白质设计的传统认知。ProGen是由Salesforce Research、Tierra Biosciences 和加州大学的研究团队共同开发的一种新型人工智能系统,能从头开始生成人工酶。研究团队合成了ProGen预测生成的人工酶,并发现其具备天然酶的活性,首次打破了AI预测和实验之间的壁垒,相关论文在《Nature Biotechnology》上发表。ProGen采用了基于标签的深度学习语言模型,用来自超过19000个家族的2.8亿种不同蛋白质的天然氨基酸序列进行训练,这些训练数据包含物种信息、蛋白质家族、催化功能等属性标签,使模型能将蛋白质功能和序列信息进行映射,从而可生成具备预测功能的蛋白质序列。ProGen使从头设计蛋白质就像遣词造句一样简单,给定功能标签和属性等关键词,即可大批量生成蛋白质序列。