5月29日,阶跃星辰正式发布并开源Step 3.7 Flash。凭借壁仞科技自研的全栈多智能体编排平台SUPACODE与BIRENSUPA的协同优势,壁砺 166M在Step 3.7 Flash模型发布后,基于vLLM推理框架快速完成Day0适配,实现高效稳定运行,为广大开发者及用户提供开箱即用、快速部署方案以及Step 3.7 Flash的“首发体验”。

Step 3.7 Flash基于壁砺 166M完成多模态推理任务
面向生产级Agent的Step 3.7 Flash
根据官方介绍,Step 3.7 Flash为阶跃星辰面向Agent生产化阶段推出的新一代Flash模型,它不是单纯追求“更快”或“更便宜”的轻量模型,而是围绕Agent、Coding、Search与多模态工作流进行系统优化,在速度、成本、可靠执行和复杂任务完成能力之间力求取得更优平衡。
Step 3.7 Flash采用稀疏MoE架构,总参数196B+1.8B(ViT)、激活参数仅11B,特别适合高频、多轮的Agent应用场景,能显著提升任务完成效率。值得关注的是,模型针对生产级Agent场景需求优化了关键能力:原生多模态理解与执行、联网与视觉搜索增强、高可靠工具调用与编排及Agent生态兼容优化。
自研智能体驱动模型极速适配
壁砺 166M得以快速实现Step 3.7 Flash模型适配与调优,受益于壁仞科技自研全栈多智能体编排平台SUPACODE。在SUPACODE平台旗下AIModelMaster能力支撑下,壁仞科技团队得以在短时间内高效完成模型功能适配与精度对齐工作,相较于传统人工适配效率提升4~5倍;并依托vLLM推理框架,充分释放壁砺 166M的算力与访存优势,自主设计算子融合、算子等效替换、计算图重构等多维优化策略,在精度无损前提下实现ViT模型推理性能显著提升,为Transformer类视觉模型在自研硬件上的高效部署提供了可复用的优化范式。
本次模型高效适配,还充分印证了壁仞科技自研BIRENSUPA软件栈的成熟度。BIRENSUPA软件栈深度兼容PyTorch、vLLM、SGLang、Diffusers等主流AI框架,支持500+AI模型开箱即用;基于壁仞科技软硬协同优势,壁砺166系列可显著降低开发者的模型部署与应用门槛,加速大模型规模化落地。
推进“国芯、国模、国用”协同创新
壁仞科技持续扩容“Day0 适配”阵营,领跑国产GPU生态建设。截至目前,壁仞科技已成功支持阶跃星辰Step系列、Deepseek V系列、阿里巴巴千问Qwen系列、MiniMax M2系列、智谱GLM系列、月之暗面Kimi系列、腾讯混元系列等20余款领先大模型的“Day0”级适配,涵盖语言、多模态、AIGC全品类。本次也是继完成阶跃星辰Step 3.5 Flash模型Day0适配后,壁仞科技再次高效实现Step 3.7 Flash模型的同日适配。
壁仞科技为阶跃星辰战略合作伙伴,与上海仪电智算服务携手共同推进“国芯、国模、国用”三位一体、协同创新的产业应用与生态合作。Day0适配是实现“芯片研发-大模型创新-算力服务”协同发展的重要基础。展望未来,壁仞科技将加强与国产大模型企业的合作,以全栈技术能力加速国产大模型普惠进程,成为打造智能经济新形态的关键引擎。
全部0条评论
快来发表一下你的评论吧 !