科大讯飞机器翻译首次达到专业译员水平 机器阅读超越人类平均水平

电子说

1.3w人已加入

描述

科大讯飞董事长刘庆峰在2019新品发布会上作主题发言

“亲爱的小伙伴们,你相信自己的眼睛和耳朵吗?看到的明明是刘庆峰,听到的却是罗永浩的声音”,科大讯飞董事长刘庆峰随即又将罗永浩的声音转为一把清脆女声与台下3000多观众互动,全场惊叹。

近日,上海世博中心,科大讯飞2019新品发布会。

会议主题是“你的世界 因A.I.而能”。镁光灯下,刘庆峰以声音仿真度极高的变声技术作为演讲开场白,他强调,这项技术一定不会随意开放,而是以一种安全有趣的方式与这个世界对接。

会上发布了五大单品和一个操作系统,具体是讯飞翻译机3.0、讯飞转写机、讯飞智能录音笔、讯飞智能办公本、讯飞学习机X1 Pro和iFLYOS 2.0。

过去的一年间,科大讯飞树立了A.I.发展史上两大里程碑:

机器翻译首次达到专业译员水平。去年11月,科大讯飞机器翻译系统参加CATTI全国翻译专业资格(水平)科研测试,达到英语二级《口译实务(交替传译类)》和三级《口译实务》合格标准,二级是专业译员水平;

机器阅读理解首次超越人类平均水平。今年3月,在机器阅读理解国际权威评测SQuAD 2.0任务中,科大讯飞再次登顶冠军,并同时在EM和F1两个指标上全球首次均超越人类平均水平,一举创下比赛全新纪录。

“2019年A.I.进入开始应用价值兑现红利年。”刘庆峰认为,跨越鸿沟后的人工智能技术价值兑现有三大标准:

必须要有看得见摸得着的真实应用案例;

要有能够规模化和可推广的对应产品;

要可以通过统计数据去说明应用成效。

应用价值兑现的案例就在会场上实时发生:

会场内,6幅吊屏通过维、藏、中、英、日、韩、法、西、葡萄牙、阿拉伯、泰、俄,12种语言实时翻译现场演讲内容,大屏幕两侧是讯飞听见屏幕的中英文实时转写翻译文字;

会场外,说9种语言的科大讯飞多语种A.I.虚拟主播“小晴”向全球同步直播。

刘庆峰还现场展示了最新的中英混读2.0引擎,“oh my god,这是谁的idea,后面居然有一个one more thing”。据悉,这样的技术,也应用在讯飞听见、讯飞输入法等多个产品中。

超过3小时的发布会可谓干货满满,刘庆峰和同事们的演讲字里行间充满A.I.之爱——用A.I.提升教育、医疗、司法等各行业的社会服务能力;用A.I.赋能研发人员,构建更加适用的操作系统;用A.I.帮助个体成为更好的自己;用A.I.与这个世界进行更深广的联结与沟通对话。

科大讯飞C端产品强势发力

5款单品让你的世界因A.I.而能

新品发布会上,5款硬件产品也满足了“粉丝”们的胃口——讯飞翻译机3.0、讯飞转写机、讯飞录音笔、讯飞智能办公本、以及讯飞学习机X1 Pro,覆盖生活、工作、学习多个场景。

2019年是人工智能规模化应用落地元年和效益兑现年,让每个人都因A.I.而能的愿景已越来越触手可及。

讯飞翻译机3.0:

独家发布七大行业A.I.翻译,离线内核更强大

去年成为“新国礼”的讯飞翻译机,全年提供翻译服务5亿+次,伴随用户走遍全球197个国家和地区,电商用户好评率达99%。

“A.I.翻译机要围绕听得清、听得懂、译得准、发音美四大标准为产品的核心要求,在实战中通过对说话人、对环境、对内容三大适应性的考验,才能称之为一台好用的翻译机。”科大讯飞翻译机产品经理翟吉博说。

讯飞翻译机3.0面对说话人的带口音普通话、方言、各式英语的翻译效果同样出色。针对离线环境的翻译搭载了新一代离线内核,离线翻译达到大学英语六级水平,0.5秒内就能完成一次翻译。同时,讯飞翻译机3.0还采用讯飞最新OCR技术、配备图文专业调校摄像头、高清视网膜屏幕、闪光灯,拍照翻译更加清晰、准确。

翻译机新品最赞的一个功能是,它可以和7个领域的专业人士充分对话,已涵盖医疗、金融、计算机、外贸、体育、能源、法律的行业术语。“七大行业A.I.翻译,这在业界也是独家。”在A.I.翻译的路上,讯飞翻译机越走越专业。

讯飞转写机:

A.I.办公时代的语音转写移动工作站

你能想到办公场景下那些最头疼的事情都是什么?开完会要马上出一份文字纪要?公司培训却恰好出差无法在现场?国际会议听不懂对方说什么?高管发言的全文整理千头万绪?

只要拥有一台讯飞转写机,这些问题都将迎刃而解。

科大讯飞消费者BG副总裁葛勇介绍了讯飞转写机的一系列优点——

一个小时的会议,它五分钟就能出文字记录;带有PPT的讲座,结束后它只要输出一个二维码,“PPT+文本+录音”马上可见可读。而且,它还首创“语音+图像”同步智能识别功能,可以将专业名词错误率下降50%。

一场中英文国际会议,它直接连接大屏幕输出中文文字和实时的英文翻译,同时还支持对讲话者中英文夹杂的语音进行实时转写。

尤其值得一提的是,这一切都可以在“线下”进行,因为它内置了“全离线”语音技术,尤其对于涉密度高的商业会议,企业再也不必担心数据安全问题。

讯飞智能录音笔:

1小时录音5分钟成稿,记录更高效

搭载2个哈曼定向+6个矩阵式麦克风硬核配置,融合讯飞智能场景拾音降噪技术于一身,讯飞智能录音笔支持语音实时转文字,是媒体采访、学习培训、会议纪要场景里的智能记录助手。

1小时录音5分钟成稿,识别准确率高达98%。还支持重要内容标记、语音搜索等。这台功能强大的讯飞智能录音笔在市场有多受欢迎?

科大讯飞消费者BG副总裁李传刚用一个数据告诉你:截至发布会之前,京东平台预约数量已达61961台。现在这款产品已全渠道开售。

讯飞智能办公本:

录音成文“一秒钟”,找到笔记“一句话”

拥有10.3英寸Eink柔性墨水屏,轻、薄设计,拿在手上感觉和普通纸质笔记本基本无差异。

讯飞智能办公本的屏幕表面的手写膜采用微蚀刻工艺,使得纸笔接触接近于钢笔在道林纸上的摩擦感。柔性屏下0.1毫米的悬空设计,使得落笔时,柔性屏会微微下凹、挤压空气,产生一种在“一沓纸”上书写的弹性。书写起来非常舒适。

这样一款“笔记本”你一定不舍得拿来盖泡面。发布会现场,讯飞读写科技总经理钟锟进行了互动演示:演讲内容被实时转化成了文字。记录人同时可以手写记录提纲,提纲和录音智能匹配。演讲结束、记录也就完成。记录的结果既有录音、也有手写提纲和被实时转化成的文字。而且,文字、手写提纲都可以即点即读、播放对应的录音,彻底解决了传统笔记本“记不全”的问题。

讯飞智能办公本还支持一键语音搜索。转写文本、手写笔迹、录音内容,只要一句话都能轻松找到。此外,和云端的对接,也实现了记录永不丢失的特性。

值得一提的是,通过和云端的结合,还可以实现“接力编辑”- 也就是在办公本上自动录制完成的笔记、可以在电脑上用Word打开排版、修改、分享。

讯飞智能办公本解决了纸质笔记记不全、找不到、容易丢等难题,而且可以存储相当于2000本纸质笔记本的内容。是办公、记录的好帮手。

讯飞学习机X1 Pro:

因材施教的A.I.家庭教师

为了提高数理化成绩,盲目刷题;学了多年英语却还是“哑巴英语”水平,在实际的学习中,付出时间未必就能学有所成。根据智学网调研400万学生35亿条数据的结果显示:学生60%的练习都属无效的。

怎么解决学习场景的这些痛点?讯飞学习机X1 Pro就是答案。

讯飞学习机X1 Pro具有的两大核心功能将大大提升学习的效率和质量,堪称一名优秀的A.I.家庭教师。

第一,它可以对数理化进行精准学习并提升效率。学生只要少量做题,即可找到知识弱项,并根据每个人掌握程度不同而提供不同的学习路径,实现“千人千面”的个性化精准学习,提高效率节省时间。

第二,它可以综合提升英语听说读写能力。可以对学生的口语训练和写作进行准确的评测,并给予一对一的纠错和改进提示,帮助学生从一开始就跟着标准学、按照标准练,更快提高口头表达和书面表达能力。

“我们希望讯飞学习机能成为每个学生度身定制的A.I.家庭教师,帮助他们减负增效,实现两千年来因材施教的梦想”。科大讯飞消费者BG副总裁章继东说。

iFLYOS 2.0发布

开放超过200项核心技能

随后,科大讯飞轮值总裁胡郁还介绍了全新升级的 iFLYOS 2.0,它是一款将AIUI与 iFLYOS 融合为一体,打造出以语音为主要交互形式,以智能硬件为载体,融合云端与终端的A.I. Agent(智能物联网操作系统),应用场景涵盖车载、智能家居、手机、玩具、穿戴式设备.... 触达用户生活中的方方面面。

科大讯飞轮值总裁胡郁发布智能物联网操作系统 iFLYOS 2.0

这套智能物联网操作系统具备 “人性化交互”、“深度自定义”、“端到端集成”、“高效率开发” 四大特点。为实现人性化交互,iFLYOS 做到了 “快”、“准”、“好”;在“深度自定义”方面,开放度进一步提升;在 “端到端集成” 方面,iFLYOS 在云端上提供各种能力、集成各种技能内容,在终端上提供算法和软硬一体化的解决方案;iFLYOS 2.0 还开放了强大集成开发环境(iFLYOS Studio),全面提升开放效率,让开发者能快速在云端集成自己想集成的服务。

为了让开发者能低门槛地使用到 iFLYOS,iFLYOS 基础版不论针对个人开发者或是企业开发者都是免费的。针对需要更高赋能的企业级别产品,科大讯飞推出 iFLYOS 专业版,增加了讯飞麦克风阵列、精品的内容包和自定账户体系、自定义唤醒词等定制开发权限。

作为案例,发布会现场展示了一款搭载了 iFLYOS 2.0 的产品——小飞 A.I. 助手。它是世界上首款能够利用离线语音识别和全覆盖红外遥控的智能家居中控设备。这款产品从立项到落地,仅仅花了三个月的时间;通过 iFLYOS 2.0 开发的产品可以被塑造成任何形式,并被快速开发。

关于共建A.I.生态系统,科大讯飞还在发布会上正式宣布启动2019年iFLYTEK A.I.开发者大赛,大赛分为“算法挑战赛”和“创新应用赛”,面向用算法解决社会或业务问题、或面向具体赛道进行开发应用,比赛奖金奖品颇具吸引力,包括100万人民币奖金、全量免费A.I.资源、全国创业孵化支持等。

科大讯飞刘庆峰董事长重磅演讲:

你的世界,因A.I.而能

六大产品正式逐一发布之前,科大讯飞董事长刘庆峰围绕三个问题做了一场精彩生动的主题演讲。

科大讯飞的人工智能技术过去一年成就如何,在全球地位如何?

两大核心技术获历史性突破,树立A.I.发展史里程碑

新品发布会上,刘庆峰透露,2018年11月,科大讯飞机器翻译系统参加CATTI全国翻译专业资格(水平)科研测试,达到英语二级《口译实务(交替传译类)》和三级《口译实务》合格标准,对一般的考生来说,三级意味着达到准译员水平,二级则意味达到专业译员水平。  

据悉,这是历史上首次参加并通过国家级权威口译水平科研评测的人工智能系统,这也标志着机器自动翻译在辅助人类跨语言信息沟通交流方面上了一个新台阶。与此同时,这也是人类在人工智能高级阶段——认知智能上的又一重大突破。

正是由于在翻译领域获得的显著成就,联合国日内瓦总部国际电信联盟正式采购科大讯飞的听见系统,中国的技术由此进入联合国的国际舞台。

通过CATTI测试的人工智能系统可以替代人类同传吗?答案显然是否定的。但是,未来必定属于人机耦合的新时代。

正如联合国前口译司司长李正仁曾说的那样:“真正好的翻译是会使用机器的翻译,而不是会被机器替代的翻译。”

在2019新品发布会的会场之内,6幅吊屏通过12种语言实时翻译现场演讲内容,大屏幕两侧是讯飞听见屏幕的中英文实时翻译文字。这些“炫酷”的现场背后其实是科大讯飞强劲的翻译技术在支撑。

科大讯飞另一项里程碑式的核心技术,则是在2019年3月,机器阅读理解国际权威评测SQuAD 2.0任务中科大讯飞再次登顶冠军,并同时在EM和F1两个指标上全球首次均超越人类平均水平,一举创下比赛的全新纪录。

“这个里程碑是由中国人写下的,这是英文的自然语言理解,机器已经超过真人水平”,刘庆峰说,让机器具备学习、理解、推理和决策的能力,这是人工智能未来的最高境界,而在认知智能中一个非常重要的核心就是机器阅读理解能力。早在2017年12月,国家在科大讯飞设立了迄今唯一的认知智能国家重点实验室。

刘庆峰认为,当下,对于中国企业未来的发展,尤其是人工智能领域,必须关注技术,如果不看技术,就没有未来,他认为核心技术持续突破非常重要。

“讯飞的企业使命,就是我们要让机器像人一样能听会说,能理解会思考,用人工智能来建设美好世界。在这个过程中只有保持顶天立地的技术信仰和战略定力,我们才可以达到人工智能星辰大海的未来目标”,刘庆峰的演讲,一如既往激情澎湃。

今天的人工智能规模化应用的标准用什么来衡量?

人工智能应用落地有三大标准

核心技术持续突破,人工智能技术价值如何兑现?

“有人说2019年开始大量人工智能创业企业将倒闭,大潮退去,泡沫破灭,而科大讯飞说,2019年开始是人工智能的应用红利兑现年”,刘庆峰说得铿锵有力,他认为,人工智能应用落地有三大标准——

第一,必须要有看得见摸得着的真实应用案例,而不是光讲故事。第二,要有能够规模化和可推广的对应产品。第三,要可以通过统计数据去说明应用成效,比如效率提升、成本降低等。

而在实践中,越来越多的应用落地案例正在进行时。

刘庆峰以司法为例,上海的刑事案件智能辅助办案系统(即206系统),最开始从杀人案、盗窃案、非法集资案和电信诈骗案作为“起点”,通过人工智能去打通公检法的证据链从而助力司法公正,而现在被纳入范围的已有102个最常见的刑事案件类型。直到去年,中央政法委已在7个省做试点并获得良好成效。刘庆峰认为,接下来要全面推广人工智能推动社会公平正义更好落到实处,这就是人工智能的价值红利。

刘庆峰再以教育为例说,科大讯飞的技术可以精准分析每个孩子的知识薄弱点,从而帮助其个性化学习。

“通过35亿份学生作业的分析结果,我们发现孩子们回到家的作业60%是无效重复训练”,他说,目前科大讯飞智慧教育系统精准分析学生学情,让每个孩子回家做的作业都不同,目前在全国百强校的68所学校开始使用,从针对35,000学生做的分析可以看到,作业时间已经降低32%,而学习兴趣提升30%,焦虑情绪下降20%,而且,课外活动时间增加了50%。

而在医疗方面,2017年科大讯飞与清华大学联合研发的人工智能机器人“智医助理”,以456分的优异成绩通过国家执业医师资格考试综合笔试评测,这也是全球首个通过国家执业医师资格测试笔试的A.I.系统。2018年10月至今,具备全科医生潜质的“智医助理”已提供了180万次A.I.辅诊意见,医生书写的有效病历完成率从10%提升到78%。

我们将如何跨越A.I.技术的鸿沟?

持续跨越鸿沟的三个关键路径

任何早期产品,先从发烧友即用户开始使用,然后是早期长线的用户使用,最终打动实用主义的用户,才可以实现鸿沟的跨越。互联网时代,跨越鸿沟主要是用户使用习惯和商业模式及细节的打磨,而在人工智能时代,技术鸿沟成为重点。

刘庆峰说,A.I.核心技术鸿沟的突破绝不可能一蹴而就,需要源于热爱和长期的坚守,2015年年底,科大讯飞的机器转写准确率超过人类最好的速记员,2017年,科大讯飞的“智医助理”通过了国家执业医师资格考试综合笔试评测并超过了96.3%的人类考生,这些都是已经跨越的鸿沟。

而未来,刘庆峰认为有以下方面的技术鸿沟值得突破:

第一是多模态拟人交互,将语音识别、图像识别、手势以及后台的自然语言理解整合起来,使得所有设备真的像一个乖巧的秘书和助理一样以人为中心,这还有很长的路要走。

第二是常识推理的突破,机器在给定文本内容、给定相关数据、有规律可循的领域,可以学习顶尖专家知识,超过一流专家水平。但是没有相关前提内容的常识推理领域,目前仍未达六龄童水平。进一步说,通用人工智能如何实现,还有非常多鸿沟需要跨越。

刘庆峰认为,2019年开始逐步进入到人工智能应用价值的红利兑现阶段,中国有极大希望能够在红利兑现中获得成功,关键是要瞄准未来提前布局。持续跨越人工智能新鸿沟有何重要方向?

刘庆峰认为有三个关键路径:首先是算法突破,即要在数学基础算法上进行持续理论突破;第二是脑智同飞,即要让脑科学和数学统计建模方法深度结合;第三是人机耦合,这是未来技术发展的方向,也是伦理和人文的需要。

“今天人工智能不仅是一项技术,而是一个深刻改变世界生产和生活方式的产业方向”,刘庆峰表示,人工智能是一个伟大的历史进程,除了技术,还要有产品,还要有社会管理、法律、伦理和人文,而最核心的是人工智能的核心价值观,“必须是阳光的、健康的,必须是能够帮助人类与人为善的”,他期待携手各界共建人工智能产业,“让世界充满爱,让每个人的世界因A.I.而能”。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分