近日,据月之暗面报道,OpenAI发布了一项令人瞩目的研究报告。报告指出,DeepSeek和Kimi两个研究团队通过独立研究,成功利用思维链学习方法,在数学解题与编程挑战中显著提升了模型的综合表现。
Kimi团队的研究员Flood Sung在社交媒体上发文,分享了团队的研究心得。他提到,长思维链的有效性在团队内部已经得到了验证。在实际训练过程中,研究人员发现模型的表现会随着训练的深入而不断提升,并且token数也在不断增加。这一发现证明了在强化训练过程中,模型具备自我涌现的能力,能够不断挖掘和发挥自身的潜力。
值得一提的是,就在1月20日,DeepSeek和Kimi两个团队在同一天发布了各自的推理模型R1和k1.5。这一巧合不仅展示了两个团队在研究领域的默契,也进一步凸显了思维链学习方法在提升模型性能方面的巨大潜力。
OpenAI的这一研究报告,不仅揭示了DeepSeek和Kimi两个团队在思维链学习方法上的突破,也为人工智能领域的研究提供了新的思路和启示。
全部0条评论
快来发表一下你的评论吧 !