4月17日,OpenAI发布了GPT-Rosalind。
名字来头不小——Rosalind Franklin,那个在DNA双螺旋结构发现史上贡献关键X射线晶体图像、却长期被忽视的英国女科学家。OpenAI给新模型起这个名字,态度很明确:进制药圈了。
这不是又一个通用AI的新版本,而是OpenAI第一个专门为生命科学研究打造的领域模型。
不只是模型本身,而是整个工作流
GPT-Rosalind最大的变化不是参数升级,而是它接上了整个科研工具链。
随模型一起上线的是Life Sciences插件,直连超过50个科学工具和数据库,覆盖范围包括:
- 人类遗传学数据库
- 功能基因组学仓库
- 蛋白质结构工具(包括AlphaFold)
- 多组学数据库
- 临床证据目录
这解决了什么问题?OpenAI的说法很直白:科学进步受限的不只是科学本身的难度,还有研究工作流程的复杂度。
以前一个研究员做一次分析,可能要手动访问五个不同的数据库,分别导出数据,然后自己综合整理。GPT-Rosalind可以在同一个对话里把这个流程全跑了——找文献、拉数据、分析序列、提假设、规划实验步骤——输出在一个地方。
它针对性做了特别训练的任务类型:文献综述、序列到功能的解析、实验设计规划、数据分析。基本覆盖了早期研发最消耗时间的几个环节。
跑分够看,实测更硬
先看标准benchmark。
BixBench(生物信息学测试)通过率0.751。LABBench2上,GPT-Rosalind和GPT-5.4对比,11个任务里赢了6个,最强的科目是分子克隆方案设计(CloningQA)。
但更有说服力的是真实场景测试。Dyno Therapeutics(一家专注RNA疗法的生物科技公司)用了未公开的内部数据做了实测:
GPT-Rosalind提交的最优结果,在RNA序列预测任务上超过了95%的人类专家;序列生成任务达到了84百分位
95百分位这个数字不是benchmark,是和真实研究人员的真实结果在比。
当然,这只是Dyno这一个场景的数据,而且OpenAI选的合作伙伴肯定都是表现好的案例。但方向至少是对的。
合作名单说明了什么
目前宣布的合作伙伴:
| 机构 | 类型 |
|---|---|
| Amgen | 大型制药 |
| Moderna | 大型制药 |
| Novo Nordisk | 大型制药(4月14日刚宣布) |
| Allen Institute | 非营利生物医学研究 |
| Thermo Fisher Scientific | 科研仪器和试剂 |
| Los Alamos National Laboratory | 国家实验室(蛋白质和催化剂设计) |
Novo Nordisk在这个名单里挺有意思——OpenAI在4月14日刚宣布双方合作,覆盖R&D、生产和商业运营,两天后GPT-Rosalind就发布了。节奏很快,说明这些合作不是发布会上临时拉的门面,而是早就在跑了。
现在的访问模式是研究预览阶段,仅对美国境内有资质的企业客户开放,走严格的受信访问审核,优先给专注于改善人类健康成果的机构。简单说:大机构优先,个人或普通企业先等着。
OpenAI的真实意图
制药AI赛道并不空旷。Google的AlphaFold系列专攻蛋白质结构预测,已经拿了诺贝尔化学奖背书;Anthropic最近收了一家8个月大的药物发现AI团队;Recursion、Insilico Medicine这些专注AI制药的初创也各有地盘。
GPT-Rosalind的切入角度和AlphaFold不一样。AlphaFold解的是蛋白质长什么形状这一个具体问题,GPT-Rosalind瞄准的是整个研究工作流——从查文献、分析数据到设计实验,全程陪跑。
从商业角度看也好理解。制药公司研发预算动辄几十上百亿美元,一个能在早期研发阶段把效率提升一截的工具,比续订一堆SaaS软件贵十倍也有人付。OpenAI现在最缺的是企业级的高价值使用场景,药厂是个不坏的口子。
OpenAI自己说这个模型绝对不是为了取代科学家,而是帮他们跑过那些最费时间、分析强度最高的阶段更快。这句话说得很稳——毕竟有诺贝尔奖之后AlphaFold的例子在前,AI代替科学家的说法已经是敏感话题了。
模型目前还是研究预览,实际效果还需要更多真实项目的验证。合作伙伴愿不愿意把内部私有数据真正接进去,才是决定这条路走多深的核心变量。
参考来源:Introducing GPT-Rosalind for life sciences research(OpenAI);OpenAI launches GPT-Rosalind AI model for drug discovery(Axios);What to know about OpenAI's new model for life sciences research GPT-Rosalind(Euronews);OpenAI Launches GPT-Rosalind: Its First Life Sciences AI Model Built to Accelerate Drug Discovery and Genomics Research(MarkTechPost)