Anthropic发布Mythos系列双旗舰模型

描述

近日,Anthropic同时抛出两颗核弹级模型—— Claude Fable 5 (公开版)和 Claude Mythos 5 (受限版),定位均为Mythos级,即Anthropic有史以来最强层级,但采用了差异化的开放策略。

两款模型的底层完全一致,区别仅在于安全防护层。

Claude Fable 5面向公众,付费用户即日起即可使用。它内置独立安全分类器,一旦检测到漏洞利用、攻击性网络任务、高危生化研究等请求,会自动降级至Claude Opus 4.8响应。官方数据显示,整体误报率不足5%,超过95%的用户会话直接由Fable 5原生处理,经1000多小时红队演练未出现通用越狱漏洞。定价为10美元/百万输入token、50美元/百万输出token,6月22日前订阅用户可免费体验。

Claude Mythos 5则取消了部分安全限制,释放全部能力,仅面向少数网络安全机构、关键基础设施运营商和科研组织定向开放,定价与Fable 5相同,仅为此前Mythos Preview的一半。

代码方面 ,Stripe早期测试显示,Fable 5将数月工程量压缩至数天。在一个5000万行Ruby代码库迁移任务中,仅用1天完成,手动团队需要两个多月。在Cognition FrontierCode评估中,中等工作量下得分领跑所有前沿模型。Anthropic还披露,目前其合并到生产系统的代码中,超过80%由自家Claude AI编写,而2025年初这一比例仅为个位数——AI写代码训练自身的递归循环已经启动。

科研方面 ,蛋白质设计专家借助Mythos 5将药物设计流程部分环节效率提高约十倍,仅一周多时间即可几乎完全自主开展基因组学研究。分子生物学假设盲测中,科研人员认可度达80%,已筛选出9个高潜力药物靶点,覆盖免疫检查点、神经退行性疾病和肌肉疾病等方向。

视觉方面 ,Fable 5被定位为当前最强视觉任务模型。它仅凭游戏截图、无地图无导航辅助,完整通关了《宝可梦火红》——早期Claude机器人需要复杂辅助设备才能完成同一任务。它还能精准提取复杂科学图表数据、仅凭截图还原Web前端源代码,在《杀戮尖塔》测试中搭载持久化文件级内存后性能较Opus 4.8提升三倍,甚至能从物理学第一原理自主推演行星轨道、模拟日食。

Mythos 5是Anthropic网络安全能力最强的模型,已部署于部分关键基础设施中。核心评测数据非常惊人:SWE-bench Verified得分93.9%(Opus 4.6为80.8%,提升13.1个百分点),SWE-bench Pro得分77.8%(Opus 4.6为53.4%,提升46个百分点),SWE-bench Multimodal得分59.0%(Opus 4.6为27.1%,提升118个百分点)。传闻在特定优化任务中可实现52倍训练代码加速,而熟练人类约为4倍。

此外,Mythos 5在SVG生成方面表现惊艳,能直接生成结构极其精细、包含3D深度光照与向量数学的复杂图形,被认为可能重构"设计稿到前端代码"的工作流。

安全层面,Mythos级别模型的全量流量数据留存30天,仅用于安全研判,不参与训练。

Mythos的脉络可以追溯到2026年4月7日,Anthropic当时已发布Claude Mythos Preview,定位为Claude体系第四层级(高于Opus),因RSP 3.0评估认为风险大于收益而未向公众开放,转由Project Glasswing向选定机构提供。4月11日美国副总统万斯召集包括Anthropic在内的多家AI公司CEO讨论Mythos安全问题,6月1日欧盟确认与Anthropic达成共识将向欧盟开放Mythos访问权限。

此次Fable 5的发布,本质是Anthropic在IPO推进期向市场证明:自己拥有超越OpenAI的技术上限与安全责任感。前OpenAI成员Andrej Karpathy评价称:"这是一次配得上大版本号升级的能力跃迁。"

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分