人工智能这一概念,早在1956年达特茅斯会议上便已首次提出。经历60余年,从感知智能走向认知智能,人工智能迅猛发展,赋能千行百业。 11月18日, 2022科大讯飞全球1024开发者节盛大开幕,引领人工智能生态向新而行。大会现场,科大讯飞消费者事业群总裁于继栋发表《人机协同 数字新生》主题演讲,分享讯飞开发者生态进展,展望人机协同新未来。
科大讯飞消费者事业群总裁 于继栋
韧性增长 讯飞生态蓬勃发展
面对纷繁复杂的全球经济环境,各行各业充斥着不确定性,如何应对这一变局,寻求下一步发展的动力来源? 人工智能产业的蓬勃生命力、讯飞开放平台的稳健增长,让我们看见人工智能的巨大潜能,相信中国科技广阔的未来。 自2017年以来,讯飞开放平台开发者数与AI服务年度调用总量,呈现持续稳步上升趋势。2022年,开发者数达到370万,AI服务在线调用年增长率达到36%。
快速增长的背后,是AI已经高度融入人们的日常生活和工作,于继栋在现场分享到。 在社交场景,近一年输入法语音调用量同比增长45%,已超过平台AI调用增速。其中,Z世代群体对语音输入更为偏爱,女性使用语音的比例是男性的1.4倍。语音输入已成为日常交流中人机交互的重要方式。
在家庭场景,电视助手语音调用量过去3年间,增长了515%。在用户分析中看到,全年龄段用户都已形成语音交互的习惯,其中低于14岁的少年儿童群体和高于60岁的中老年群体比成年用户更偏爱语音交互。
在出行场景,车载语音调用量获得到了翻番的增长。在过去一年全国出口的200万辆汽车中,预制讯飞多语种语音交互系统的车辆已超71%。合作车企在科大讯飞的助力下,已将13个语种推广到全球20个国家。
在学习场景,过去一年教育相关的AI调用呈现出902%的增长。在双减政策的推动下,AI帮助学生减负。讯飞及生态伙伴推出学习机、翻译笔、口算宝、早教机等一系列智能硬件有效陪伴了少年儿童的学习成长。
在办公场景,AI办公硬件服务调用持续快速增长。以办公本、会议耳机、翻译机为代表的办公硬件,为用户省时增效。在录音笔的应用中,平均每天为每个用户节省1.32小时。AI在办公领域的广泛应用,已为工作效率的提升发挥巨大作用。
在阅读场景,一些大型新闻类、阅读类APP的应用,让语音合成服务的调用量有了明显增长。在AI的加持下,用声音陪伴的阅读体验,正在改变用户的阅读习惯,提升阅读粘性。
众多AI服务调用量的增长,让我们看到AI应用的价值在不断深入。基于此,讯飞将更多的AI能力开放给开发者,让AI持续传递。
全新讯飞开放平台
全方面赋能人机协同场景
随着社交、家庭、出行、学习、办公、阅读等越来越多AI场景的广泛应用,人工智能在人机交互阶段已经走进千行百业,并持续发光发热。当下,人工智能与生活结合更好的时代就是人机协同的时代。 如何进入人机协同时代?于继栋分享了对物理世界、数字世界、元宇宙三大场景人机协同应用的思考。在物理世界,实体机器人可以拓展人的能力边界;在数字世界,数字工作助手,将助力工作提效;在元宇宙,虚拟人成为人的交互载体。
实体机器人从室内到户外,帮助人们从事工业焊接、果实采摘、高空作业等高精度、高强度、高风险的工作。虚拟数字人打破实体的限制,在媒体、金融、办公等领域广泛应用,打造数字生产力。 为满足人机交互的时代需求,讯飞开放平台进行了全新升级。在感知智能、认知智能、运动智能强大的技术底座之上,围绕能力云、交互云、模型云、资产平台、超自动化、机器人超脑,以API、低代码、软硬件一体和解决方案的方式,面向实体机器人和数字机器人建设N种场景化机器人。
全新的讯飞开放平台,通过原有组件升级、新组件发布,为开发者提供更优秀的服务能力,更广阔的应用场景。
能力云AIHUB,是在2018年发布的基础上进行升级和扩展,已开放513项AI能力并不断引入生态合作伙伴最优秀的能力,打造AI能力图谱。面向网络不稳定、信息安全敏感的环境,全新升级了全系离线版本,加深行业应用。值得一提的是,在大会现场刚刚发布的SMART-TTS多风格多情感语音合成技术,已在讯飞开放平台、讯飞有声APP同步上新,让开发者可以更早的体验到拥有10种场景、11种情感的语音合成。
交互云AIUI+,通过远近场多模语音增强,突破同向人声干扰难题,解决人机交互最后一公里问题。通过多模态技术,对人脸、唇形进行跟踪定位,实现主动交互、说话人保持、噪声抑制。在同向人声干扰下,语音识别准确率已由60.2%提升到86.8%。
模型云AILAB,面向细分模型定制场景,提供小样本训练平台,主要解决三类问题。面向格式多样场景,支持任意自定义格式单据识别;针对数据稀缺场景,实现5张图片训练出OCR定制模型、半小时音频生成商用发言人;遇到价格敏感场景,“0”成本提供多样唤醒词。
资产平台AIRES,联合生态,共建数字资产,让机器人交互形象生动有内容。目前平台已提供210个多语种技能、342个虚拟人形象、6000万首正版音乐、1200万小时有声内容,并开放数字藏品平台——星昼,为开发者提供丰富的内容资源。
超自动化AIRPA,用数字机器人激活人效潜能,助力企业数字化转型。由AI+RPA构建的数字机器人是讯飞面向企业场景打造的协作新模式,提供了数字机器人统一工作台、柔性人机协同、智能化员工助手等应用。
除以上组件升级焕新以外,讯飞还发布了机器人超脑平台AIBOT,让机器人在交互大脑的基础上,快速构建运动能力。
机器人超脑平台发布
让AI的赋能无处不在
“降低开发者使用门槛,快速实现超脑能力与实体机器人的结合,为实体机器人真正的智能化带来直接动力与贡献!”于继栋在发布机器人超脑平台AIBOT时如是说。
融入多模交互、深度理解、运动控制、硬件模组等核心能力的机器人超脑平台,为实体机器人提供高性能的算力支撑、高效率的地图导航以及高精度的定位功能,打造软硬一体的智能化机器人。 而这一项技术已经有了实际的应用案例。能说会跑的狗来自宇数科技的四足机器狗在讯飞机器人超脑平台的加持下,已实现自适应的地形能力、全局定位搜索能力、地图快速构建能力、更精细的运动控制能力。在这四大能力全面提升后,机器狗能跑会跳,能看会说,可应用于户外巡逻、工业巡检等多元化场景。
超强助手机械臂基于讯飞机器人超脑平台,珞石科技为柔性机械臂增加了语音交互、深度视觉以及运动控制能力,再加上算法的改造,让机械臂操作更智能、工业质检更高效、定位更实时,可以有效的适应各种应用。在工业质检、商业服务、远程超声、柔性生产等场景,柔性机械臂都可实现与人类更高效的工作配合。
开发者灯塔计划
让每个创新者享受AI乐趣
独木不成林 生态才永恒。依托越来越多优秀的人工智能应用的开放,讯飞开放平台期待让每个创新者享受AI的乐趣。 日常生活和企业工作中,很难要求每个人都懂程序开发。通过RPA、低代码等技术构建工作场景下的新型智能应用,讯飞开放平台为懂业务、想创新的伙伴提供服务,将更多智能化的体验带进千家万户。会上,于继栋发布了“开发者灯塔计划”,秉持“共生、共创、共享、多样繁荣”的理念,打造更丰富、便捷的AI服务,让AI科学家、设计师、企业管理人员与内容生产者等,都能享受AI的乐趣与价值,共创繁荣的AI新生态。
“希望与各位开发者携手共创,迈入人机协同新时代”,在大会最后,于继栋发出倡议。讯飞开放平台将继续秉持共建人工智能产业的初心,用生态定义未来,共筑数字经济新发展。
全部0条评论
快来发表一下你的评论吧 !