电子说
王海峰是百度首席技术官,也是上海人工智能战略咨询专家委员会成员。在2019世界人工智能大会召开之际,王海峰接受解放日报。上观新闻记者专访,分享了他对人工智能热点话题的看法。
问:您认为,人工智能技术意味着什么?
答:众所周知,自18世纪60年代起,人类经历了三次工业革命,分别以机械技术、电气技术和信息技术为核心驱动力。当今,我们正身处第四次工业革命浪潮之中,而人工智能技术则是这次工业革命的核心驱动力量。人工智能技术将渗入到人们生产生活的各个角落,人工智能正将人类社会带入智能时代。
问:自从“人工智能”一词为公众所熟悉,有关“人工智能是否会取代人类”的争议就一直不断。您如何看待这个问题?
答:当前,部分公众对人工智能认识不足,存在一定的恐慌情绪,认为人工智能会取代人类的工作、会威胁到人类。所以,让公众对人工智能有正确认知和合理期待,是人工智能从业者,也是全社会需要解决的问题。
目前的人工智能技术整体而言依赖大数据、大模型和大的计算能力,这之中依旧有很多问题需要解决。现阶段,人工智能在特定应用、特定场景上的能力超过了人类,但想全面达到甚至超越人类还有很长的路要走,尤其是在语言与知识等认知技术上,还有很大的发展空间。
人工智能的使命不是替代人类,而是为人类服务。人工智能能够比人类更出色地完成某些任务,比如重复性、基础性或者纯体力工作;但是也有很多能力机器是不能替代人类的,比如科学家、工程师、艺术家等需要创造性的工作。
未来,人类将更多地充当管理者的角色,机器只是辅助人类做出决定。全社会对于人工智能应抱有正确的认识和预期,不能过高,也不能畏惧,这样才能更好地拥抱人工智能。
问:您更看重哪些领域的人工智能探索?
答:想要务实地推动人工智能发展,首先要看到人工智能发展过程中面临的机遇和挑战。我认为人工智能领域的探索,要从理论基础、应用技术、产业基础、应用系统四个层面同时展开。
在基础理论层面,小样本、低能耗、可解释是人工智能目前面临的最大挑战。人工智能,尤其是深度学习的发展离不开大数据和大的计算能力,但强大算力的背后,是巨大的能耗在支撑。另一方面,深度神经网络的结果很难解释,难以赋以物理意义。目前在这方面的探索包括迁移学习、图神经网络、对抗生成网络以及符号与神经网络的结合等等。因此,人工智能理论研究要探索如何让人工智能像人类一样、实现小样本学习、能耗低,且真正地被理解。
在应用技术上,感知技术与认知技术仍然是未来的重要方向,尤其是认知技术。与听觉、视觉相关的感知技术,在深度学习的这一波红利里得到了巨大的发展。但自然语言理解和知识图谱等认知技术,还有很多问题亟待解决。同时,融合感知与认知技术的多模态深度语义理解会进一步发展。
产业基础层面,软硬结合很重要,深度学习框架和AI芯片逐渐成为人工智能发展的新趋势,也是新的产业机会。另外,随着5G的到来,边缘计算也成为人工智能发展不可忽视的一环。
在应用系统层面,多技术综合应用、结合场景的系统性创新至关重要。随着人工智能与各行各业的融合越来越深入,真正落地的产业应用往往是多种技术的综合应用,需要结合特定场景、业务需求及数据特点,实现系统性的创新,才能切实为现有业务提升效率,或者发展新的业务模式。
总结而言,人工智能系统和生物、和人一样,是不断进化的。人工智能系统在应用场景中,与环境、用户互相作用,不断产生新数据,不断学习,沉淀知识,改进算法,越来越强大。
问:在百度的人工智能研究中,是否对这四个层面有所涉及?
答:百度从2010年开始人工智能技术布局和基础能力积累,2016年9月正式发布的百度大脑是百度人工智能技术多年积累和业务实践的集大成。在百度大脑的研发和业务实践中,对理论基础、应用技术、产业基础、应用系统均有涉及。
目前,百度大脑已经形成完整的技术体系,并全方位开放人工智能技术能力。其核心技术进入“多模态深度语义理解”阶段,能够对文字、声音、图像等多模态的数据和信息进行深层次多维度的语义理解。今年7月发布的百度大脑5.0,AI算法、计算架构和应用场景融合创新,成为“软硬一体AI大生产平台”,打通了人工智能产业化应用落地的全流程,从深度学习技术及平台到通用AI能力、应用技术方案,再到定制化模型开发平台,以及最终的部署和集成,实现了AI技术的标准化、自动化和模块化,深度赋能开发者,加速产业智能化进程。
问:能否请您以百度大脑5.0为例,简要介绍一下百度人工智能技术的进展及应用?
答:百度大脑5.0在语音、视觉、知识图谱、语义理解等核心技术层面持续创新,保持世界领先水平;在算力层面,实现面向人工智能的计算架构,发布AI芯片;同时不断完善和升级深度学习开源开放平台百度飞桨,降低人工智能技术门槛,促进人工智能应用落地。
比如在语音识别方面,成功将注意力模型应用于大规模线上语音识别系统,准确率进一步提升。该技术已经在智能音箱和语音输入法等产品中应用,实现高精准的中英文混合语音识别。
在语音合成方面,风格迁移技术把声音中的音色、风格、情感等不同元素解耦分离,独立组合,灵活控制合成的声音;同时只需录制20句话,就可以制作一个人的专属声音。
自然语言理解方面,结合知识和语义理解,发布可持续学习的知识增强语义理解框架ERNIE。首先结合先验知识和海量数据构建预训练任务,然后学习其中的语言、实体、关系、知识等等各种信息,模型能力可以持续增强,提升效果,快速应用。
百度大脑5.0还在机器同传领域取得了突破。综合联合词向量解码、语篇翻译模型等新技术,实现高准确、低时延的机器同传,并发布了语音到语音的机器同传系统“DuTongChuan(度同传)”以及全球首个中文-英文演讲场景语音翻译数据集(BSTC)。有机会试用一下就能发现,百度的机器同传效果已经媲美人类译员。
以上只是百度大脑5.0在语音和自然语言处理领域的部分技术进展及应用。整体上,百度大脑布局完整,核心技术领先。一方面,百度大脑是百度业务强有力的技术支撑;另一方面,百度大脑也是全方位开放的,助力合作伙伴和开发者,加速人工智能技术落地应用,赋能各行各业转型升级,促进社会经济变革。
百度搜索、信息流、百度地图、百度输入法等产品基于百度大脑的AI能力变得更加智能。比如,百度智能搜索可以更深入地理解用户需求、高效地连接人与信息、提升用户体验;百度地图,充分利用百度大脑的技术优势,成为业内智能化水平最高、搭载的人工智能技术最强最丰富的地图,实现了全流程AI化数据生产,为用户提供路线规划、智能语音助手、步行AR导航、实时路况、个性化推荐、智能旅游导览等智能出行服务。
还有,基于百度大脑技术能力,百度智能家居、自动驾驶等领域处于全球领先水平,拥有智能语音交互开放生态“小度助手(DuerOS)”,以及智能驾驶开放生态“Apollo”。此外,面向企业及开发者的智能云计算服务平台“百度智能云”,为各行业智能化转型提供解决方案,促进数字中国建设。
问:对于当下人工智能的研发和应用情况,您有什么建议或意见?
答:从研究的层面看,我认为人工智能的基础研究还相对薄弱,而基础研究是关乎人工智能核心竞争力的关键领域,亟需加强。从应用层面看,我觉得要避免对人工智能期望过高。眼下,部分产业、资本、公众等抱有人工智能“无所不能”的想法,有大量资金涌入人工智能领域;但以当下的技术条件和环境,不是所有的产业都能用人工智能解决核心问题,期望过高会给人工智能产业发展带来泡沫化风险。从另一个角度来说,技术也不是要做到100%的准确率才能应用,效果达到一定程度,就可以投入应用,让人工智能技术在场景化的应用中持续进化,同时更深入地推动人工智能的产业应用落地。所以在今年的百度AI开发者大会上,我们多次提及的关键词之一就是“产业智能化”,百度也会更关注技术和不同行业的融会贯通,促进产业智能化发展。
全部0条评论
快来发表一下你的评论吧 !