OpenAI与长寿生物科技公司Retro Biosciences合作开发的GPT-4b微模型取得重大突破,成功将干细胞重编程标记物的表达水平提升至野生型对照的50倍以上。这项研究成果已在多供体、多细胞类型和多种递送方式中验证,并确认获得完全多能性和基因组稳定性。
用于蛋白质工程的实验性GPT模型
我们基于GPT-4o开发了定制化微型模型GPT-4b micro,通过整合蛋白质序列、生物文本和3D结构数据(多数蛋白质语言模型通常省略此类数据),训练出具有强大生物知识基础的模型。特别针对山中因子这类依赖与多种结合伴侣形成瞬态相互作用而非稳定结构的蛋白质,该模型能处理固有无序区域与有序区域的蛋白质序列。
AI辅助改良山中因子提升重编程效率
山中因子(OCT4、SOX2、KLF4、MYC)是再生生物学的核心蛋白,但其传统重组效率低于0.1%。通过GPT-4b micro生成的"RetroSOX"和"RetroKLF"变体,实验显示:
- 30%以上RetroSOX建议变体在表达多能性标志物方面优于野生型SOX2
- 50%的RetroKLF变体展现出显著提升的重编程效果
- 组合最优变体后,早晚期标志物(SSEA4、TRA-1-60、NANOG)表达显著增强
- 碱性磷酸酶染色证实多能性诱导成功
DNA损伤修复增强验证
在阿霉素应激测试中,Retro变体处理的细胞γ-H2AX信号强度显著降低(p<0.05),表明其修复双链断裂的能力优于传统OSKM方案。这标志着细胞衰老核心标志物得到有效改善。
临床潜力验证
采用mRNA递送的间充质基质细胞实验显示:
- 7天后30%细胞表达关键多能性标记
- 12天获得典型iPSC形态克隆
- 85%细胞激活内源性干细胞标记
- 三胚层分化能力验证
- 多代培养确认核型稳定性
该研究展示了AI引导蛋白质设计如何加速干细胞重编程进展,为未来细胞治疗提供了高效且基因组稳定的解决方案。
【全文结束】

