经过几周关于SB 1047(一项有争议的AI安全法案)命运的讨论,该法案要求开发强大AI模型和提供计算资源的实体实施适当的保障措施和政策,以防止重大危害。加州州长加文·纽森宣布,他否决了这项“善意”的法案,因为它未必是“保护公众免受技术带来的真实威胁的最佳方法”。
然而,在围绕SB 1047的喧嚣中,州长在过去一个月内签署了17项涉及生成式AI(GenAI)的法案,包括关于深度伪造、AI水印、儿童安全、表演者AI权利和选举虚假信息的法案,其中一些我们在之前的帖子中讨论过。
最引人注目的是,州长在周末签署了AB 2013,该法案要求,从2026年1月1日起,自2022年1月1日或之后发布的GenAI系统或服务的开发者发布一份“高层次摘要”,公开提供给加州居民使用(以及在对GenAI系统或服务进行“重大修改”后发布的培训数据摘要)。法律规定,高层次摘要应包括以下内容:
- 数据集的来源或所有者
- 数据集中包含的数据点的一般数量及其类型描述
- 数据集是否包含受知识产权保护的数据
- 数据集是否由开发者购买或许可
- 数据集是否包含个人身份信息或根据CCPA定义的汇总消费者信息
- 开发者是否对数据集进行了清理、处理或其他修改
- 数据集中的数据是在何时收集或首次用于GenAI开发过程
- GenAI系统或服务在其开发过程中是否使用合成数据生成
除了要求覆盖的GenAI系统“向加州居民公开可用”之外,该法律还豁免了某些企业模型,这些模型通常不向公众开放。此外,该法律还豁免了唯一目的是数据安全和完整性的GenAI系统,或由联邦实体用于国家安全目的的系统。
AB 2013处于州级AI法规中有关GenAI训练数据来源的前沿。通常情况下,GenAI开发者出于多种商业或竞争原因不会披露用于训练现有或前沿模型的数据来源。此外,针对主要GenAI开发者正在进行的版权和隐私相关诉讼中,指控这些开发者未经授权使用版权材料或消费者的个人信息进行训练,数据来源已成为这些诉讼的核心问题,但尚未在公共场合详细讨论。
其他最近签署的AI相关法案包括:
- AB 1008:该法律澄清,根据CCPA,“个人身份信息”可以存在于各种格式中,包括但不限于物理格式、数字格式和抽象数字格式,这还包括“能够输出个人身份信息的人工智能系统”。(有关AB 1008法律的众议院地板分析可以在此处找到)
- SB 1120:该法律要求,使用AI、算法或其他软件工具进行保险覆盖决定和功能的医疗保健服务计划或残疾保险公司(或通过第三方供应商签订此类服务合同)确保AI工具基于特定信息,并公平公正地应用。
- AB 3030:该法律要求,使用GenAI生成涉及患者临床信息的书面或口头通信的医疗机构、诊所、医生办公室或团体实践必须在通信中包含免责声明,告知患者通信是由GenAI生成的,并提供患者如何联系人类医疗保健提供者或实践员工的说明。
根据AB 2013,“训练生成式人工智能系统或服务”包括开发者对人工智能系统或服务的测试、验证或微调。
(全文结束)

