自家AI太强 人类会危险:美国AI巨头宣布无限期封印Mythos大模型

Anthropic无限期封印其最强模型Mythos Preview,官方称因模型过于强大、存在安全风险。合作计划中已发现上万高危漏洞,但也引发AI安全激烈争论。

估值已经超越OpenAI的美国AI巨头Anthropic,不久前发布了号称有史以来最强的大模型Mythos Preview。然而近日公司却宣布,将无限期封印这一模型,禁止向公众和商业市场开放。Anthropic表示,尽管内部测试证明新一代安全基座模型Claude Mythos Preview在漏洞挖掘与网络攻防方面极为强大,但在更强效的安全对齐机制出现之前,公司不会冒然开放。

Anthropic Mythos大模型
Mythos是Anthropic推出的最新旗舰大模型

Mythos模型的实力与安全合作计划

Mythos Preview发布时号称有史以来最强的大模型,但其具体参数始终未对外公布。据业界猜测,该模型的参数量可能达到10万亿级别,训练成本极高,部署难度也非常大。这些因素使得Mythos从一开始就面临着商业化落地的巨大不确定性。

在发布Mythos后不久,Anthropic联合美国多家科技巨头及机构推出了网络安全合作计划Glasswing,向合作伙伴开放Mythos用于漏洞发掘。近日Anthropic公布了该计划的阶段性进展:在过去一个多月中,Mythos已在多个行业领域扫描出至少10000个高危或严重级别漏洞,漏洞挖掘效率是以往方法的10倍以上。这一成果充分展示了Mythos在安全领域的非凡能力,但也给业界带来了巨大压力。

事实上,漏洞发现的规模远超预期,而业界修补漏洞的速度难以同步跟进。一些企业和组织甚至要求Anthropic减缓Mythos披露漏洞的节奏。正是基于这种现实,Anthropic决定在开发出更强效的安全对齐机制前,无限期禁止向公众和商业市场开放Mythos级模型。

AI安全风险争论与封印的深层因素

实际上,Anthropic此前已多次暗示Mythos因过于强大而不敢开放给公众使用,甚至不惜多次渲染AI可能毁灭人类。在伦敦举行的一次会议上,Anthropic联合创始人Jack Clark发出严重警告:AI有非零概率导致人类灭绝。他推测,到2028年AI就能实现自我进化,即不再需要人类参与就能自行训练和提升,这将带来不可预测的变故。

AI灭绝人类这样的说法在美国AI圈并不新鲜。包括OpenAI、Anthropic以及马斯克在内的领先公司和个人都热衷传播此类观点:他们一方面恐吓公众AI可能毁灭人类,另一方面又宣称自家AI的强大与对安全的重视。这种传播模式已经成为一种常见的公关策略。

这种宣传手法也招致了激烈的批评。NVIDIA CEO黄仁勋最近指出,部分CEO在AI热潮中产生了“上帝情结”,认为自己无所不能、无所不知。这一评价被认为精准地指向了某些公司高层的心理,获得了业界广泛认同。

回到Mythos模型本身,其在网络安全漏洞搜寻方面的表现确实突出,但实际可用性存在疑问。有网友反映,该模型响应速度过慢,不适合日常交互,也不适合用于编写代码。再加上其参数量庞大、训练成本极高、部署难度大等因素,Mythos的商业化前景并不乐观。

有业界分析认为,Anthropic高调宣布因安全风险而无限期封印Mythos,可能更多是一种商业营销手段。如果Mythos真正具备可观的商业价值且安全可控,公司理应寻求商业化变现。然而现实是,Mythos的封印与其商业化难度相互呼应。业界推测,这可能是Anthropic在AI安全议题上的一次精心策划,意在塑造负责任的企业形象,同时规避短期内商业化的复杂挑战。

本文参考来源:驱动之家新闻_最新新闻

发表回复