OpenAI：DeepSeek与Kimi揭秘o1，长思维链提升模型表现

科技绿洲 2025-02-18 727

描述

　　近日，据月之暗面报道，OpenAI发布了一项令人瞩目的研究报告。报告指出，DeepSeek和Kimi两个研究团队通过独立研究，成功利用思维链学习方法，在数学解题与编程挑战中显著提升了模型的综合表现。

　　Kimi团队的研究员Flood Sung在社交媒体上发文，分享了团队的研究心得。他提到，长思维链的有效性在团队内部已经得到了验证。在实际训练过程中，研究人员发现模型的表现会随着训练的深入而不断提升，并且token数也在不断增加。这一发现证明了在强化训练过程中，模型具备自我涌现的能力，能够不断挖掘和发挥自身的潜力。

　　值得一提的是，就在1月20日，DeepSeek和Kimi两个团队在同一天发布了各自的推理模型R1和k1.5。这一巧合不仅展示了两个团队在研究领域的默契，也进一步凸显了思维链学习方法在提升模型性能方面的巨大潜力。

　　OpenAI的这一研究报告，不仅揭示了DeepSeek和Kimi两个团队在思维链学习方法上的突破，也为人工智能领域的研究提供了新的思路和启示。

打开APP阅读更多精彩内容