三代科学家共话大模型未来,商汤与上海AI实验室等重磅发布“书生通用大模型体系”

描述

4位图灵奖得主,1位诺奖得主,80余位国内外院士出席,1400余位重量级嘉宾齐聚……第六届世界人工智能大会(WAIC 2023)点“燃”魔都。  商汤科技  7月6日上午,大会开幕式上,商汤科技董事长兼CEO徐立博士受邀出席并主持“创想共论·智变可能”圆桌对话,图灵奖得主、上海期智研究院院长姚期智院士清华大学交叉信息学院助理教授袁洋清华大学交叉信息研究院助理教授、Moonshot AI创始人杨植麟南洋理工大学计算机科学与工程学院助理教授、DragGAN第一作者潘新钢,就人工智能的发展与突破,展开精彩对话,探讨了包括“大模型核心理论研究突破、多模态对大模型的优化、算法安全及算法的发展路线选择”等诸多前沿话题,引发广泛思考。    

同时,商汤位于上海世博展览馆H2-A101的超酷AI展区也迎来火爆参观客流,大量“AI好者”惊呼amazing!下面请看一段现场报道:

 

 与上海AI实验室等发布“书生通用大模型体系”

 

 WAIC 2023大会首日,在开幕式和科学前沿全体会议上,商汤科技与上海人工智能实验室联合香港中文大学、复旦大学、上海交通大学及清华大学发布全新升级的“书生通用大模型体系”,包括:“书生·多模态”“书生·浦语”“书生·天际”三大基础模型,以及首个面向大模型研发与应用的全链条开源体系。

 

 商汤科技  其中,“书生·多模态”大模型无缝整合了语言、图像、视频等多种模态,包含200亿参数,使用80亿多模态样本训练。

 

 “书生·多模态”首次实现通过自然语言定义视觉任务,实现开放世界理解,支持多模态生成和跨模态交互,并支持350万语义标签的识别和理解,覆盖开放世界常见的类别和概念。目前,书生体系在80多种多模态和视觉评测任务中性能领先。  商汤科技“书生”根据张大千《湖山清夏图》创作的七言绝句

 

 升级后的 “书生·浦语”是国内首个正式发布的支持8K语境长度的千亿参数级语言大模型,在包含1.8万亿token的高质量语料上训练而成。

 

 相比6月首次亮相,书生·浦语在一个月内已完成一次全面升级,包括:具备了理解长输入、展开复杂推理,以及进行长时间多轮对话的能力;支持20多种语言,还可通过表格和图表等方式汇总和呈现复杂信息;数理逻辑能力明显进步,大幅提高了数值计算、函数运算、方程求解等数理能力;可以更可靠地遵循人类指令,安全性得到明显改善。 

 

 商汤科技多维度能力全面提升,在42个主流评测集上性能明显提升,在其中35个评测集上性能超越了ChatGPT

 

 在全面升级同时,书生·浦语还正式开源一个70亿参数的轻量级版本InternLM-7B。InternLM-7B在包含40个评测集的全维度评测中性能表现卓越、均衡,全面领先现有开源模型。特别在两个被广泛采用的基准MMLU和CEval上分别取得50.8 和52.8高分,刷新了7B量级模型世界纪录。

 

 此外,书生·浦语还开源了贯穿数据、预训练、微调、部署和评测五大环节的全链条工具体系。(https://github.com/InternLM)

 

 “书生·天际”全球首个城市级NeRF实景三维大模型,具备千亿参数,在全球首次实现对100平方公里范围进行城市实景建模,分辨率精度可达4K,并支持对全范围的高精度实时渲染以及城市级编辑、风格化转换等功能。

 

 “书生通用大模型体系”凭借更全面的通用化能力,覆盖模态和任务更广,将为科研创新提供更好支持,更快加速产业应用的智能化进程。

 

 深度参与大会,让AI发展引领未来

 

 商汤科技连续第六年深度参与WAIC。

 

 在上海世博展览馆和徐汇滨江分会场,商汤科技基于先进的视觉、语言、决策等大模型能力,为WAIC大会专门打造数字人AI新闻官,以逼真自然的表情、动作,并结合丰富的语料素材库和大语言模型泛化能力,为参会嘉宾提供引导服务和会议介绍。

 

     商汤还受邀出席“算网一体 融创未来”行业论坛,参与了中国电信大模型生态合作联盟启动仪式。同时,商汤科技副总裁林洁敏发表演讲,生动形象地回顾了人工智能发展史和最新应用,展现了人工智能绚丽多彩的创造力和想象力。

 

 AI创新带来无限想象,商汤科技将持续快速推进新技术研发和落地应用。

 

 7月7日上午,商汤科技还将举办“大爱无疆·日日新”人工智能论坛,重磅揭晓“商汤日日新SenseNova” 大模型体系的全新版本,并展示多领域AI大模型诸多行业落地应用。

 

 欢迎广大朋友们共同见证科技精彩

 

点击下方预约直播,商汤与您不见不散

 

 

商汤科技

  相关阅读,戳这里 

 

《商汤@2023世界人工智能大会「三大看点」》

《商汤与上海AI实验室等发布“书生·浦语”大模型》

《多模态多任务通用大模型“书生2.5”发布》

 

商汤科技


原文标题:三代科学家共话大模型未来,商汤与上海AI实验室等重磅发布“书生通用大模型体系”

文章出处:【微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。


打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分