上新:小米首个推理大模型开源 马斯克:下周推出Grok 3.5

描述

似乎国内外AI竞争日趋白热化,就在阿里巴巴发布Qwen3(通义千问3)之后,引发业界广泛关注;很多大厂在跟进,大模型不断上新:

阿里巴巴开源新一代通义千问模型Qwen3

4月29日凌晨4点,阿里巴巴开源新一代通义千问模型Qwen3。据悉,Qwen3模型参数量仅为DeepSeek - R1的1/3,能够大幅降低成本,而且性能全面超越R1、OpenAI - o1等全球顶尖模型,登顶全球最强开源模型。而且Qwen3还是国内首个“混合推理模型”。

小米首个推理大模型开源

在4月30日,“小米大模型”公众号发布消息称,小米开源首个推理大模型「XiaomiMiMo」,大模型MiMo号称以7B参数在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)测评中超越OpenAI o1-mini和阿里Qwen-32B-Preview。体现出MiMo-7B在数学和代码领域展现出的强化学习潜力领先于业界其他模型。

据悉,大模型MiMo是来自成立不久的“小米大模型 Core 团队”。

马斯克:下周推出Grok 3.5

马斯克在社交平台上表示,下周Grok 3.5早期测试版将向SuperGrok订阅者发布。

蚂蚁数科正式对外发布智能体开发平台Agentar

4月29日,在数字中国建设峰会期间,蚂蚁数科正式对外发布了智能体开发平台Agentar,主要面向为金融机构提供智能体开发工具。

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分