预算增至每日百万美元，苹果发力生成式AI，优化Siri！

Carol Li 2023-09-11 3012

描述

电子发烧友网报道（文/李弯弯）近日消息，据知情人士透露，苹果始终在增加构建人工智能所需计算的预算，并且已经扩大到每天数百万美元。该公司的一个目标是开放一些功能，允许iPhone用户使用简单的语音命令来自动执行涉及多个步骤的任务。

举例来说，这项技术可以让用户命令Siri语音助手用他们最近拍摄的五张照片创建GIF动图，并将其发送给朋友。如今，iPhone用户必须手动完成这个过程。

苹果很早就组建AI团队

相比于微软、谷歌等全球知名科技公司而言，苹果在人工智能技术上的发展看上去更慢些，包括近年来很火的生成式AI。不过据外媒报道，苹果正在加大投资力度，现在每天在人工智能上投资数百万美元，并且多个团队正在同时开发多种人工智能模型。

其中开发对话式人工智能的团队被称为基础模型（Foundational Models），该团队有几位曾在谷歌工作多年的工程师组成，目前拥有16名成员。事实上，早在四年前，苹果人工智能主管约翰·詹南德里亚（John Giannandrea）就授权组建团队，开发基于大语言模型（LLM）的对话式人工智能。约翰·詹南德里亚在2018年加入苹果，并主持Siri的升级。

除此之外，苹果还有另外至少两个团队在推进AI的研究。一个是视觉智能（Visual Intelligence）团队，该团队致力于开发能够生成图像、视频或3D场景的软件；另一个团队正在研究多模式人工智能，这种模型可以识别和生成图像、视频或文本。该团队的领导者之一是乔恩·什伦斯（Jon Shlens），他于2021年底加入苹果，之前在谷歌人工智能团队（DeepMind）工作。

同时，苹果还在加大对AI大模型研发人员的招聘力度。有报道称，苹果已经从Meta挖角了不少大模型相关研究人员，并还在全球积极招聘大语言模型方面的工程师。苹果官网显示，关于大语言模型相关的招聘广告就超过了600个，主要集中于优化AI软件的多媒体功能，包括生成图像或视频内容、视觉动作与交互等。

据了解，目前苹果的基础模型团队已经开发出几个先进的模型，并正在内部测试。其中最先进的语言模型，被称为Ajax GPT，该模型已经接受超过2000亿个参数的训练，据称其功能表现比OpenAI此前发布的GPT-3.5版本ChatGPT更强。

不同于谷歌、微软等大模型应用到企业等层面，苹果致力于在移动端使用生成式AI。不过大语言模型参数量大，需要更多存储空间和计算能力，将其在iPhone等移动设备上运行存在难度。然而这却并不是不可能，业界已经有企业通过量化等各种技术，来缩小模型规模，以便其能够在终端设备上使用。

从苹果最近的招聘信息，可以看到苹果也有这方面的研究，比如，它要求应聘者能够将最先进的基础模型带入我们口袋里的iPhone。有知情人士透露，苹果基于大语言模型的聊天机器人，最终可能会与使用苹果AppleCare的用户互动，另一种用途则是加强Siri，使其能够更轻松地执行复杂任务。

通过大语言模型优化Siri

近一年多时间，全球消费电子市场持续低迷，苹果业绩也受到影响，根据其2023财年第三财季财报，苹果营收818亿美元，同比下降1.4%，净利润199亿美元，同比增长2.3%。这是苹果营收连续第三个季度下滑，其主力产品iPhone、iPad、Mac都出现一定下滑。

虽然苹果将会在本周发布最新的产品iPhone15，不过就目前的形势来看，业界对其的预测也并不好，知名分析师郭明錤认为，iPhone 15系列的需求将低于今年的iPhone 14系列。

在这样的背景下，苹果似乎对人工智能大模型寄予厚望。近日，库克称，苹果多年来一直在研究生成式人工智能和其他模型，未来几个月，苹果将进一步增加用于生成式AI的研发支出。

行业人士认为，对于苹果而言，Siri是其新研发的GPT系统能够最快落地的地方，也是能够最快改善用户体验的地方。将Apple GPT与Siri结合升级，很可能是效率和用户交互体验上的一个突破，这将是苹果在大模型竞争中的最大优势。

Siri是苹果公司在iPhone、iPad、iPod Touch、HomePod、Apple Watch、Apple TV、Apple CarPlay等产品上应用的一个语音助手，利用Siri用户可以通过手机查找信息、拨打电话、发送信息、获取路线、播放音乐、查找苹果设备等。

Siri可以支持自然语言输入，并且可以调用系统自带的天气预报、日程安排、搜索资料等应用，还能够不断学习新的声音和语调，提供对话式的应答。

过去这些年里，苹果一直在积极优化Siri。然而不少用户对Siri目前的效果并不满意，甚至有网友称其为“人工智障”。消息称，苹果内部正在积极提高Siri的智力，预估将会在iOS 18系统中和大家见面。苹果正在积极扩展Siri的技能，可以基于用户的自然语音命令，自动执行各种复杂的多步骤任务。就如文章开头提到的，Siri可以根据一条语音命令，连续拍摄 5 张照片，然后自动转换成为 GIF 动图，并发送给指定的好友。

不过网友对苹果的这个优化各有看法，有人认为，将大模型集成到Siri里面，可能是一个错误方向，他表示，更希望得到一个有强大语音识别功能的AI助手，而不是一个对他口述内容进行智能解释的东西。

也有网友认为，加入新模型的Siri的可用性将大大提高，苹果将调整参数以确保人工智能驱动的Siri不会再那么啰嗦。或许再次升级Siri，它就不会只是傻傻地甩出一个网页链接，而是真正地对用户需求做出解答。

小结

相对于谷歌、微软等全球知名科技公司来说，苹果在人工智能技术的结果展示上，看上去较为缓慢，不过深究下可以发现，其组建团队开始研究方面其实并不晚。当前全球消费电子市场持续低迷，苹果业绩连续多季度受到影响，而将生成式AI与其原有的技术，比如说Siri等结合，苹果可能会带来更大的创新进展，这无论是对于苹果还是AI的创新应用都有意义。

打开APP阅读更多精彩内容