去年 1 月,德国生物科技公司 BioNTech 以超过 5.5 亿美元收购了非洲人工智能初创公司 InstaDeep,该交易于同年 7 月完成。作为目前从非洲退出的规模最大的公司,InstaDeep 在德国制药巨头的旗下运营了一年多。现在是审视其自收购以来表现的好时机。
InstaDeep 运用先进的机器学习技术将人工智能引入企业应用。其产品涵盖了 GPU 加速的洞察到自学习决策系统。在去年的收购之前,这家诞生于突尼斯、总部位于巴黎和伦敦的企业人工智能初创公司从包括谷歌、德国铁路和 BioNTech 在内的几个全球投资者那里筹集了超过 1.08 亿美元。这三家公司也是这家初创公司最大的合作伙伴和客户。
值得注意的是,这家成立十年的初创公司在疫情期间与 BioNTech 合作开发了一个早期预警系统,可以提前数月检测出高风险的 COVID-19 变体。InstaDeep 还与谷歌 DeepMind 合作创建了一个针对非洲沙漠蝗虫爆发的早期检测系统。它还与欧洲最大的铁路运营商德国铁路合作开展了一个旨在实现铁路调度自动化的雄心勃勃的项目。
虽然这些合作展示了 InstaDeep 解决方案的各种应用,但它的收购方有一个明确的用例:利用人工智能开发治疗各种癌症和传染病的疗法和疫苗——这是它在新东家旗下正在加倍努力的方向。
自 BioNTech 收购完成 15 个月以来,联合创始人兼首席执行官卡里姆·贝吉尔(Karim Beguir)在接受采访时告诉 TechCrunch,InstaDeep 在这方面取得了重大进展,即使这家人工智能公司——继续独立运营——仍为生物科技领域之外的客户提供解决方案。
“我们在生物和生物人工智能能力方面追求的目标与 BioNTech 战略一致,”InstaDeep 负责人表示。“但我们也有回旋的余地,并继续成为非洲乃至全球人工智能领域的一股力量,同时继续开发推动其他垂直领域创新前沿的技术,如工业优化。”
增强生物科技领域的能力
贝吉尔指出,InstaDeep 自收购以来的过去一年的目标是在 BioNTech 的每一个流程步骤中部署人工智能,以改进现有流程。
他分享了一个组织学方面的例子,其中涉及组织分析和标记不同组织(如识别肿瘤细胞或健康细胞)的视觉任务。据他介绍,BioNTech 的专家传统上手动完成这项工作。然而,InstaDeep 的技术通过部署视觉人工智能和分割系统帮助加速了这一过程,将这种标记组织的工作流程加快了 5 倍。
故事继续
另一个例子是其 RiboMab 项目的完成,该项目涉及 mRNA 编码抗体,现已成为 BioNTech 作为免疫治疗公司抗击癌症和其他疾病的工具包的一部分。InstaDeep 在 2020 年的首次合作中,在其 DeepChain 平台上推出了这个项目,该平台设计蛋白质并分析生物数据。
生物科技涉及大量敏感的医疗保健数据。收集和分析它们是一回事。保障其安全是另一回事。问问 23andMe 就知道了,它曾经被誉为生物科技领域的颠覆者,但后来成为大规模数据泄露的受害者,近 700 万人的数据(其客户基础的一半)被暴露。
有趣的是,BioNTech 对这类事件并不陌生。2020 年,黑客通过攻击欧洲药品管理局(EMA),非法获取了与辉瑞合作开发的其 COVID-19 疫苗相关的文件。虽然辉瑞和 BioNTech 证实他们的系统和试验数据仍然安全,但这一事件凸显了即使是监管机构这样的组织在网络攻击面前也可能是脆弱的。
正如任何首席执行官都会说的那样,贝吉尔告诉我,InstaDeep 和 BioNTech 对医疗保健数据非常谨慎,特别是因为目前的合作正在利用人工智能增加数据资产,使他们能够识别精确的蛋白质序列,并可能为癌症和其他免疫治疗用例解锁新的目标。
但两家公司使用的数据是有区分的。BioNTech 处理个人的、真实的患者数据,而 InstaDeep 通常在公开可用的数据上开发模型并对其进行训练。例如,正是通过这种方式,它训练了其核苷酸转换器,这是一系列人工智能基因组学模型,如今是世界上下载量最大、最受欢迎的人工智能基因组学模型。
“InstaDeep 在公共数据上开发和训练了核苷酸模型,”贝吉尔指出。“然而,当我们想将该模型应用于特定用例和真实患者数据时,我们在 BioNTech 层面进行,同时遵循其作为生物制药领域领先企业之一的严格规定和严格质量协议,提供所有的隐私保障。”
在 BioNTech 内部和生物科技之外开发新技术
当被问及 InstaDeep 在 BioNTech 内部的下一个里程碑是什么时,贝吉尔提到了这家初创公司的“最新突破”:贝叶斯流网络(BFN),据该公司称,这是一种新的蛋白质生成人工智能模型,其性能显著优于自回归和扩散模型。BioNTech 首席执行官乌古尔·萨欣(Ugur Sahin)在一份声明中称其为“最先进的技术”。
据贝吉尔介绍,该模型通过允许系统在抗体的重链上搜索特定属性,包括化学特性、疏水性或序列长度,从而在市场上产生最自然、表现最佳的蛋白质。这样的模型对于理解复杂的蛋白质功能和设计新型治疗性蛋白质至关重要。
“我们对像我们这样的人工智能创新的潜力感到兴奋,以确定实际用例,与 BioNTech 密切合作,并构建将在实验室和诊所进行测试的产品,最终拯救患者的生命,”贝吉尔说。“如果你考虑我们今天在生物学和人工智能方面的处境,它类似于 2020 年我们在自然语言处理方面与 GPT-3 的处境。系统开始工作,其能力令人印象深刻,但仍有改进的空间。”
InstaDeep 上周推出了新的人工智能模型,同时还推出了一台新的近亿亿次超级计算机,据这两家公司称,这使得该合作在全球计算和基础设施排名中进入前 100 名,在 H100 GPU 集群排名中进入前 20 名。
这两项进展都突出了 InstaDeep 在 BioNTech 旗下在多个生命科学用例中部署人工智能的情况。另一方面,它独立处理其其他业务线,其中包括用于工业优化的人工智能和深度强化学习。
一个例子是其为德国铁路(Deutsche Bahn)进行的为期五年的正在进行的铁路规划和调度自动化项目,德国铁路是其长期合作伙伴之一,也是欧洲最大的铁路运营商。同样,这家总部位于突尼斯和伦敦的人工智能公司也加强了开发其他工业优化用例的努力,例如与德国法兰克福机场(Fraport)合作,利用人工智能优化复杂的机场运营。
“总的来说,我们也看到了人工智能代理的潜力非常引人注目的未来。我们认为工业优化和基于代理的系统,与人类同事携手合作,将彻底改变工业效率。所以这也是我们多年来一直在的另一个领域,也是我们继续投资的领域,”贝吉尔指出。
与此同时,InstaDeep 本月早些时候在旧金山推出了其 DeepPCB(深度印刷电路板)产品的专业版,这是一种完全由强化学习驱动的自主人工智能辅助的硬件或印刷电路板设计。贝吉尔说,该公司的竞争对手是其所在特定领域的较小的人工智能初创公司,如总部位于利雅得的 Intelmatix。
InstaDeep 负责人为其公司在解决更复杂的人工智能用例方面的工作感到自豪——例如 DNA 或蛋白质组学的 GenAI 或组合优化的代理工作流程——并避开了自然语言处理等简单的 GenAI。他声称,除了 BioNTech 的收购外,这种独创性在吸引美国客户(该人工智能公司现在在美国有两个办事处)和欧洲(特别是柏林、巴黎和英国)客户的兴趣方面发挥了重要作用。
尽管 BioNTech 花费 5 亿美元收购 InstaDeep 以增强其生物技术能力,但出于这样的原因,它保持了这家人工智能公司的运营独立性,同时为其为生物科技行业以外的客户服务的活动提供资金。
“因为我们通过成为人工智能领域的领导者来贡献价值,并且人工智能技能可以在多个领域得到改进,”当被问及为什么 BioNTech 仍然允许这家人工智能公司从事非生物科技项目时,贝吉尔回答道。“这是相同的技术栈,所以在生物科技之外从事人工智能工作的时间一点也没有浪费。BioNTech 还将 InstaDeep 部署在生物科技研发之外的任务上,例如运营优化。”
贝吉尔解释说,虽然 InstaDeep 并非被迫出售,但自 2019 年以来与 BioNTech 的共同愿景和成功项目,早在收购之前,就说服了这家人工智能公司推进这笔交易。他相信多年合作建立的信任是 InstaDeep 在 BioNTech 旗下保持独立的原因。InstaDeep 现在的关键是保持势头,保持高质量的结果,并尽可能长时间地继续创新。
自收购以来,InstaDeep 在全球已发展到 400 多名员工。这包括其在非洲的团队,该团队在基加利的新办公室领导公司的地理空间情报工作。
InstaDeep 最初与谷歌合作在实地努力检测非洲的蝗虫繁殖地,现在它使用过去的标签数据和卫星图像,以 80-85%的准确率推断出未来 30 天内蝗虫繁殖地的位置。贝吉尔说,InstaGeo,该公司使用来自美国宇航局或欧洲航天局(ESA)的多光谱卫星图像的框架,是开源的,可供其他公司在整个非洲大陆开发可扩展的解决方案。
“这是人工智能技术和能力产生影响的一个真实例子。我们无需在实地收集样本或依赖地面基础设施,而是可以通过卫星大规模提供这些洞察,并通知多个政府和参与者来应对对粮食安全日益增长的挑战,特别是考虑到非洲大陆的气候问题。”

