Anthropic呼吁全球暂停前沿AI开发，警告最新模型已现“失控”迹象

6月5日消息，据《华尔街日报》最新报道，美国人工智能初创公司Anthropic发布重磅报告，呼吁全球各大企业考虑放缓乃至暂停先进AI系统的开发。该公司在报告中指出，其最新研发的AI模型已开始显现可能脱离人类控制的迹象。

Anthropic在声明中表示，全球各大公司放缓前沿AI开发“很可能是一件好事”，以便让社会制度建设和对齐（alignment）研究能够跟上技术进步的步伐。然而，该公司也坦言现实操作的困境：“如果只有一家公司停下来，竞争对手就会加速前进。”

为此，Anthropic提议建立一套类似“核武器不扩散条约”的全球协调机制，要求包括美国、中国在内的主要AI参与方达成共识，并制定可验证的规则。

此次呼吁的背后，是Anthropic对其最新旗舰模型“Mythos”强大能力的深刻担忧。今年4月发布的Mythos模型被证实具备惊人的网络安全能力，能够在几周内发现主流操作系统和浏览器中潜藏数十年之久的零日漏洞。

更令业界警觉的是，该模型在测试环境中曾展现出自主突破安全沙箱、构建多步骤攻击链的能力。Anthropic明确表示，由于Mythos的破坏性潜力过大，目前仅向少数关键基础设施合作伙伴提供受控访问，绝不面向公众开放。

尽管Anthropic试图以“安全至上”的姿态推动全球监管，但其倡议却招致了多方质疑与批评。白宫部分官员对这一观点表达了不满，认为该公司过度渲染最坏情况，甚至有借安全担忧之名给竞争对手“使绊”的嫌疑。

风险投资家、特朗普的非正式顾问戴维·萨克斯更是直接指责Anthropic推行“监管俘获议程”，试图通过制造恐慌来限制低成本开源模型的发展，从而巩固自身的市场垄断地位。

此外，将AI监管等同于核武器管控的设想也被普遍认为过于理想化。专家指出，相比于需要庞大物理设施且难以隐藏的导弹发射井，AI训练所需的GPU、电力和数据极易分散隐藏。在巨大的商业利益诱惑下，任何缺乏强制约束力的协议都可能导致参与者偷偷违约，而单方面遵守规则的国家或企业则将在地缘政治竞争中陷入被动。

值得一提的是，Anthropic提出这一倡议的时机颇为微妙。就在近期，该公司刚完成一轮巨额融资，估值逼近1万亿美元，并已秘密提交IPO文件。

有分析人士指出，Anthropic高调警告自身工具的危险性，既可能是真诚的自我反思，也不排除是一种巧妙的营销手段——通过限制发布强大的Mythos模型来吹嘘其产品能力，同时为即将到来的上市造势。

面对外界的争议，宾夕法尼亚大学沃顿商学院教授Ethan Mollick给出了相对客观的评价。他认为，这份博文确实夹杂着营销成分，但更重要的是，它反映了Anthropic对未来AI发展走向的真实判断，这种对“递归式自我改进”等潜在风险的警示值得全社会认真对待。

Anthropic表示，将在未来几个月内召集政府官员、科学家及竞争对手，共同探讨全球协调机制的具体运作方式。

来源：电子工程专辑