商汤科技发布日新5.0大模型,对标GPT-4 Turbo,预计2024年落地端侧

描述

  4月24日,商汤科技股市大幅上涨,最高涨幅逾30%,同时,公司宣布暂停交易以待进一步信息披露。

  当日午间,商汤科技股价维持在每股0.80港元,涨幅高达31.15%,总市值达到268亿港元。全天交易总额达12.61亿港元,换手率为6.43%,市场交投活跃。

  据了解,4月23日,商汤科技在上海举行了技术交流日活动,公布了“云、端、边”全栈大模型产品矩阵,并对“日日新SenseNova 5.0”大模型进行了全面升级。

  在此基础上,商汤科技推出了包括日日新。商量大模型5.0(SenseChat)、日日新。商量多模态大模型(SenseVision)、日日新。商量拟人大模型(SenseChat-Character)在内的七款模型。

  商汤科技董事长兼首席执行官徐立表示,日日新5.0的更新重点在于强化知识、数学、推理及代码能力,以期与GPT-4 Turbo相媲美。

  他强调,商汤将遵循尺度定律,持续探索大模型能力的KRE三层架构,不断突破大模型能力边界,预计“2024年将迎来端侧大模型的爆发之年”。

  徐立指出,2023年,商汤生成式AI业务实现了同比200%的高速增长,占总收入比例超过35%。生成式AI不仅是商汤技术领域的重要创新,更已成为其核心业务。他表示,生成式AI业务的快速发展源于各行业对大模型训练和推理的广泛需求,这标志着中国硬科技投资新周期的到来。商汤正通过深度融合生成式AI能力,拓展新客户群体,提高生产效率。

  国投证券研究报告指出,商汤推出的日日新大模型5.0版本采用混合专家架构,推理时上下文窗口可达200K左右,在数学、推理及代码能力方面均能与GPT-4 Turbo相抗衡。此外,公司还发布了面向终端设备的“商汤端侧大模型”以及面向金融、代码、医疗、政务等多个领域的边缘产品“商汤企业级大模型一体机”,从而实现了大模型在“云端边”全栈布局的全面覆盖。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分