从初始靶点发现到获得美国监管批准,新药研发平均耗时10至15年。其中大部分时间并非用于突破性发现,而是消耗在文献解析、数据库查询和模糊结果判读上。本周四,OpenAI推出首款专为攻克这一难题而设计的领域专用模型。
GPT-Rosalind代表了OpenAI首次构建面向生物学、药物发现和转化医学的领域专用推理模型。这是OpenAI"生命科学模型"产品线的首款发布,也是该公司首次以历史人物命名AI模型。
该模型名称致敬英国化学家罗莎琳德·富兰克林。她在1950年代通过X射线晶体学技术为DNA双螺旋结构的发现作出关键贡献,但生前未获应有认可。这一命名决策彰显OpenAI对新涉足领域的严肃科研态度。
在专门评估模型执行现实生物信息学任务能力的基准测试中,GPT-Rosalind取得0.751的优异成绩,超越迄今在BixBench发布的所有模型。在LABBench2的11项任务中,该模型有6项表现优于前代GPT-5.4。
与基因治疗公司Dyno Therapeutics合作开展的序列预测实验中,使用未公开RNA序列(排除记忆效应干扰)的测试显示:GPT-Rosalind的最佳十次提交结果排名超过95%的人类专家水平,在序列生成任务中达到约84%的专家水平。
OpenAI生命科学研究负责人Joy Jiao在新闻发布会上谨慎强调这些数据的实际意义。她表示该模型并非用于自主开发新疗法,核心目标是提升效率而非替代人类。"我们认为AI能切实帮助研究人员加速突破科学流程中最复杂耗时的环节",Jiao向记者解释道。
GPT-Rosalind目前未向公众开放,仅限通过资质审核与安全评估的美国企业客户使用。此举是对100多位科学家联名公开信的回应——该信呼吁加强对训练AI所用生物数据的管控,以防范病原体设计滥用风险。
首发合作方包括安进公司、莫德纳公司和赛默飞世尔科技。OpenAI同时与洛斯阿拉莫斯国家实验室开展独立研究合作,聚焦AI引导的蛋白质与催化剂设计。
随模型同步推出的还有Codex平台免费生命科学研究插件,可连接覆盖蛋白质结构、基因组分析流程、序列搜索及文献综述的50多个科学数据库。企业版GPT-Rosalind用户享有完整推理层权限,其他用户仅能使用标准模型的插件功能。
目前尚无AI发现的药物通过III期临床试验(这一数字仍为零)。但若GPT-Rosalind能同时压缩全球数千实验室的早期研究周期,其产生的累积效应对药物发现进程的影响,或将远超任何单一基准测试分数的意义。
【全文结束】

