预算增至每日百万美元,苹果发力生成式AI,优化Siri!

描述

电子发烧友网报道(文/李弯弯)近日消息,据知情人士透露,苹果始终在增加构建人工智能所需计算的预算,并且已经扩大到每天数百万美元。该公司的一个目标是开放一些功能,允许iPhone用户使用简单的语音命令来自动执行涉及多个步骤的任务。
 
举例来说,这项技术可以让用户命令Siri语音助手用他们最近拍摄的五张照片创建GIF动图,并将其发送给朋友。如今,iPhone用户必须手动完成这个过程。
 
苹果很早就组建AI团队
 
相比于微软、谷歌等全球知名科技公司而言,苹果在人工智能技术上的发展看上去更慢些,包括近年来很火的生成式AI。不过据外媒报道,苹果正在加大投资力度,现在每天在人工智能上投资数百万美元,并且多个团队正在同时开发多种人工智能模型。
 
其中开发对话式人工智能的团队被称为基础模型(Foundational Models),该团队有几位曾在谷歌工作多年的工程师组成,目前拥有16名成员。事实上,早在四年前,苹果人工智能主管约翰·詹南德里亚(John Giannandrea)就授权组建团队,开发基于大语言模型(LLM)的对话式人工智能。约翰·詹南德里亚在2018年加入苹果,并主持Siri的升级。
 
除此之外,苹果还有另外至少两个团队在推进AI的研究。一个是视觉智能(Visual Intelligence)团队,该团队致力于开发能够生成图像、视频或3D场景的软件;另一个团队正在研究多模式人工智能,这种模型可以识别和生成图像、视频或文本。该团队的领导者之一是乔恩·什伦斯(Jon Shlens),他于2021年底加入苹果,之前在谷歌人工智能团队(DeepMind)工作。
 
同时,苹果还在加大对AI大模型研发人员的招聘力度。有报道称,苹果已经从Meta挖角了不少大模型相关研究人员,并还在全球积极招聘大语言模型方面的工程师。苹果官网显示,关于大语言模型相关的招聘广告就超过了600个,主要集中于优化AI软件的多媒体功能,包括生成图像或视频内容、视觉动作与交互等。
 
据了解,目前苹果的基础模型团队已经开发出几个先进的模型,并正在内部测试。其中最先进的语言模型,被称为Ajax GPT,该模型已经接受超过2000亿个参数的训练,据称其功能表现比OpenAI此前发布的GPT-3.5版本ChatGPT更强。
 
不同于谷歌、微软等大模型应用到企业等层面,苹果致力于在移动端使用生成式AI。不过大语言模型参数量大,需要更多存储空间和计算能力,将其在iPhone等移动设备上运行存在难度。然而这却并不是不可能,业界已经有企业通过量化等各种技术,来缩小模型规模,以便其能够在终端设备上使用。
 
从苹果最近的招聘信息,可以看到苹果也有这方面的研究,比如,它要求应聘者能够将最先进的基础模型带入我们口袋里的iPhone。有知情人士透露,苹果基于大语言模型的聊天机器人,最终可能会与使用苹果AppleCare的用户互动,另一种用途则是加强Siri,使其能够更轻松地执行复杂任务。
 
通过大语言模型优化Siri
 
近一年多时间,全球消费电子市场持续低迷,苹果业绩也受到影响,根据其2023财年第三财季财报,苹果营收818亿美元,同比下降1.4%,净利润199亿美元,同比增长2.3%。这是苹果营收连续第三个季度下滑,其主力产品iPhone、iPad、Mac都出现一定下滑。
 
虽然苹果将会在本周发布最新的产品iPhone15,不过就目前的形势来看,业界对其的预测也并不好,知名分析师郭明錤认为,iPhone 15系列的需求将低于今年的iPhone 14系列。
 
在这样的背景下,苹果似乎对人工智能大模型寄予厚望。近日,库克称,苹果多年来一直在研究生成式人工智能和其他模型,未来几个月,苹果将进一步增加用于生成式AI的研发支出。
 
行业人士认为,对于苹果而言,Siri是其新研发的GPT系统能够最快落地的地方,也是能够最快改善用户体验的地方。将Apple GPT与Siri结合升级,很可能是效率和用户交互体验上的一个突破,这将是苹果在大模型竞争中的最大优势。
 
Siri是苹果公司在iPhone、iPad、iPod Touch、HomePod、Apple Watch、Apple TV、Apple CarPlay等产品上应用的一个语音助手,利用Siri用户可以通过手机查找信息、拨打电话、发送信息、获取路线、播放音乐、查找苹果设备等。
 
Siri可以支持自然语言输入,并且可以调用系统自带的天气预报、日程安排、搜索资料等应用,还能够不断学习新的声音和语调,提供对话式的应答。
 
过去这些年里,苹果一直在积极优化Siri。然而不少用户对Siri目前的效果并不满意,甚至有网友称其为“人工智障”。消息称,苹果内部正在积极提高Siri的智力,预估将会在iOS 18系统中和大家见面。苹果正在积极扩展Siri的技能,可以基于用户的自然语音命令,自动执行各种复杂的多步骤任务。就如文章开头提到的,Siri可以根据一条语音命令,连续拍摄 5 张照片,然后自动转换成为 GIF 动图,并发送给指定的好友。
 
不过网友对苹果的这个优化各有看法,有人认为,将大模型集成到Siri里面,可能是一个错误方向,他表示,更希望得到一个有强大语音识别功能的AI助手,而不是一个对他口述内容进行智能解释的东西。
 
也有网友认为,加入新模型的Siri的可用性将大大提高,苹果将调整参数以确保人工智能驱动的Siri不会再那么啰嗦。或许再次升级Siri,它就不会只是傻傻地甩出一个网页链接,而是真正地对用户需求做出解答。
 
小结
 
相对于谷歌、微软等全球知名科技公司来说,苹果在人工智能技术的结果展示上,看上去较为缓慢,不过深究下可以发现,其组建团队开始研究方面其实并不晚。当前全球消费电子市场持续低迷,苹果业绩连续多季度受到影响,而将生成式AI与其原有的技术,比如说Siri等结合,苹果可能会带来更大的创新进展,这无论是对于苹果还是AI的创新应用都有意义。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分