AI逼近自我进化，最高市值AI公司警告全球暂缓研究

Simon观察 2026-06-09 4745

描述

电子发烧友网报道（文/黄山明）这次AI泡沫可能真的要破了，但不是技术与商业存在巨大落差导致的破裂，而是AI可能表现得太好了。

近期，Anthropic公开发布了一篇名为《When AI Builds Itself》（当AI自我构建时）的文章。文章警告AI正在逼近RSI（Recursive Self-Improvement，递归自我改进）的临界点，并正式呼吁全球前沿AI实验室联合起来，考虑暂时或放缓前沿AI的研发。

Anthropic的警告

许多人或许不曾听闻Anthropic这家公司，但有可能听过甚至用过他们的产品，那就是大语言模型Claude。其特点是拥有高达20万Token的超长上下文窗口，能一口气理解几百页的复杂合同或上万行代码，甚至在2026年已经包揽了Anthropic内部80%以上的代码编写。

2026年4月，Claude独立提交了800多个修复补丁，直接将某类API的错误率降低了1000倍。工程师不再是写代码的人，而变成了审查代码的人。2026年第二季度，工程师平均每人每天合并的代码量，大约是2024年的8倍。

多数内部员工认为，2025年底Claude编写的代码质量仍逊于人类工程师，但到了今天，两者已经基本持平。Anthropic预测，不出一年，Claude写的代码质量就会全面超过人类。

Anthropic创始团队本是OpenAI的核心高管，也是GPT系列模型的早期开发者。但在 OpenAI越来越倾向于商业化和追求“全能”之时，他们出于对AI失控的深切恐惧，带领一批顶尖科学家出走，创立了Anthropic。因此，Anthropic的核心命题只有一个，如何控制比人类更聪明的AI。

为此，他们发明了宪法AI（Constitutional AI）技术，从一开始便为AI植入一套明确的道德准则和行为底线。这使得Claude在编程、长文本处理、金融和法律服务等对准确性和安全性要求极高的企业级场景中表现尤为出色。也因此获得了亚马逊、谷歌、微软等科技巨头的重金支持。截至2026年，其估值已飙升至万亿美元级别，年化收入也达到了数百亿美元。

根据Anthropic的报告，目前AI独立完成任务的能力每4个月就翻一倍，而此前是每7个月翻倍。如果按这个趋势，今年内AI就能独立完成人类需要几天才能搞定的复杂科研任务；到2027年，它能独立完成人类需要几周才能搞定的任务。

值得注意的是，Anthropic警告目前AI正在逼近RSI临界点。所谓RSI，是指当前的AI模型具备了足够的编程、逻辑和科研能力，能够完全自主地设计、编写和训练出比自己更强大的下一代AI。而下一代AI变强后，又会以更快的速度开发出下下一代，循环往复。

当前Anthropic发现了Claude已经具备了极强的科研和工程自主性，能够接管原本依赖人类科学家的部分工作。例如曾让Claude代理自主解决一个AI安全领域的开放问题。Claude Agent用800小时、约1.8万美元算力恢复了97%的性能缺口，而两名人类研究员一周只恢复23%。

需要注意的是，Anthropic在文章中强调，AI还未走到RSI那一步，并表示递归自我改进并非必然发生，不过其可能比大多数机构准备好的时间更早到来。

所以严格来说，目前Claude写代码、做实验、做优化，但大方向、研究品味、目标设定仍主要由人类掌控，还没形成AI自己决定自己下一代架构的闭环。

因此Anthropic也不是要求立刻停止所有AI研究，而是希望全球建立一个机制，在必要时可以放缓或暂时暂停前沿AI开发，让社会制度和对齐研究跟上技术。并且Anthropic明确表示，如果只有一家公司停，对手会趁机超车，所以必须多国多实验室一起参与。

AI的RSI时刻

Anthropic所担心的也并不是AI有没有意识，而是三类技术问题。一个是对齐漂移，随着AI每一轮自我改进，模型的目标和行为可能发生微小偏移；多次迭代后，系统可能变得“更聪明但更不对齐”。学术界已经在专门研究RSI中的对齐漂移问题，并提出SAHOO等框架来监控漂移指数等。

同时，伴随着AI能够自动生成代码、跑实验、写论文时，人类审查和理解的速度会成为系统瓶颈。Anthropic自己也承认，代码量爆炸后，人类只能抽样审查，更多依赖自动化测试与对齐监控。

这样一来，一旦AI在提出研究想法、设计架构、优化训练流程上超过人类，人类就很难再参与其中，因为跟不上系统的演化速度。这意味着人类只能做个签字的人，因为已经看不懂AI在写什么了。

如果发生上面的情况，就证明AI正式进入到了RSI时刻。从硬件的角度来看，影响也将是深远的。以AI设计芯片为例，目前只是人类工程师在EDA软件中让AI跑个局部优化，并且人类设计芯片习惯于模块化，也就是CPU归CPU，缓存归缓存，有清晰的物理界限。

但随着未来AI真的进入到RSI时刻，在设计下一代AI芯片时，可能会完全抛弃人类的逻辑，设计出一种高密度、网状交织、极其反直觉的异构晶圆。这种芯片对于人类来说根本无法画出电路图，但它的能量效率和数据传输比会逼近物理极限。

并且当 AI 自我改进将算法效率提升几个数量级后，计算核心（ALU）将不再是瓶颈，真正的瓶颈在于数据传输的延迟和带宽。

这就意味着未来数据中心内部，传统的铜线和电子信号将无法承载自迭代大模型所需的庞大数据吞吐。芯片与芯片、机柜与机柜之间，将全面改用光子传输。

为了彻底干掉芯片封装带来的信号延迟，未来会更多地采用像Cerebras那样的整块晶圆级芯片，或者通过极致的3D堆叠，将内存在垂直空间上直接贴在计算核心上方，让数据传输距离缩短到微米级。

并且进入到AI的RSI时刻后，对于端侧硬件将是巨变。如果AI 自我改进能将模型的体积压缩 100 倍，同时保持甚至超越现在的能力，那么未来的手机、汽车、甚至是智能家居里的微型芯片，都将拥有独立长链推理的能力。

意味着未来的硬件趋势不再是单纯指望中心化的超级计算机，而是千亿个分布在民间的边缘端侧设备。它们在空闲时，会通过低延迟网络自我编织成一个去中心化的算力网，在本地进行自主的逻辑演进和协同工作。

写在最后

Anthropic这篇文章的发布，是第一次有一家顶尖的AI公司公开承认，AI已经开始深度参与到自身的开发过程中，并且这个速度还在持续加速。

但就在今年5月28日，Anthropic宣布完成H轮650亿美元融资，投后估值达9650亿美元，一举超越OpenAI 8520亿美元的估值，成为全球估值最高的AI创企。此时发布这种言论，不仅有吹捧自家Claude的嫌疑，并且有利于锁死当前的竞争格局，保护Anthropic现有的B2B市场份额，限制后面那些正在疯狂追赶的开源模型或中小型对手。

还有批评者指出，Anthropic在今年2月份才刚刚修改了安全承诺，表示如果竞争对手追得太紧，他们将不再保留可能具有危险性的AI能力。在激烈的商业竞争中，单凭呼吁是根本不可能让大家停下来的。

打开APP阅读更多精彩内容