内部员工称苹果AI至少落后2年，两大掣肘让苹果难以实现AI技术超越？

Felix分析 2024-10-22 3322

描述

电子发烧友网报道（文/吴子鹏）日前，彭博社知名记者Mark Gurman表示，Apple Intelligence的首批功能并不令人满意，而更令人印象深刻的功能将在之后推出。他指出，目前苹果公司内部员工认为，与谷歌、OpenAI 和 Meta的最新产品相比，苹果的人工智能仍然远远落后。至少到目前为止，其生成式AI技术落后于行业领先者两年多。

Mark Gurman称，在苹果网站上的iPad mini营销中，该公司重点介绍了四项功能，其中三项要到12月至3月之间才会推出。

苹果最新的AI功能

在今年的苹果全球开发者大会上，Apple Intelligence的亮相引起了广泛的关注。在6月10日，苹果公司宣布，个人智能化系统Apple Intelligence将为iPhone、iPad和Mac引入强大的生成式模型，为人工智能隐私树立了新标准，它能够理解个人背景，从而提供有用且相关的资讯。

根据苹果官方新闻稿，Apple Intelligence深度集成于iOS 18、iPadOS 18和macOS Sequoia中，充分运用Apple芯片对语言和图像的理解与创作能力，可做出多种跨App操作，同时结合个人场景，为用户简化和加快日常任务流程。

按照苹果公司的设想，Apple Intelligence会带来多个创新功能。在iOS 18、iPadOS 18和macOS Sequoia中会新增一个新的工具——Writing Tools。作为一款智能化的书写工具，Writing Tools能够为用户带来很多创新体验。比如，它可以帮助用户校对文本，包括单词选择和句子的格式；可以重写当前的内容，而不改变用户的本意；可以对文本进行总结，用户可以将这些结论作为关键点汇总，或者绘制成表格，这些摘要可以在邮件和信息应用中找到。

Apple Intelligence对Siri进行了全面的重构，使其具有更深的学习能力和更灵活的交互方式。Mark Gurman此前在报道中透露，Siri将能够分析用户的习惯、偏好，并提供个性化的建议。Siri里面也会加入一些新的工具，比如ImagePlayground、Genmoji等。这些工具均旨在提升用户创作趣味，以及社交互动的丰富度。

苹果官方对于ImagePlayground也会倍加推崇，认为其将为用户提供乐趣无穷的图像创作功能，帮助用户用全新方式进行交流和表达自我。ImagePlayground被内置在多款App中，借助这款工具，用户可以在数秒间创作出有趣的图像，且有动画、插画、手绘三种样式可以选择。用户还可以将使用ImagePlayground创作的趣味图像发送给朋友，甚至还会看到基于当前对话生成的个性化创意推荐。

当然，Apple Intelligence对于Siri的改变远不止于此。Siri还将有能力在各类Apple及第三方App中完成数百种新操作，且对于用户指令的执行更加准确，并具有个性定制的属性。参考苹果官方给出的示例，用户只需说出“从我的阅读列表里调出那篇关于蝉的文章”，或者“把周六那天的烧烤照片发给Malia”，Siri便会执行。

Apple Intelligence背后据悉拥有两套模型。本地模型是一个参数规模为3B的语言模型，测试得分高于Mistral-7B或Gemma-7B等市场上的7B模型；云上模型则是苹果在云端服务器部署的更大规模的大模型，云端大模型能够支持100k的词汇大小，而终端模型支持的是49k的词汇大小。

对于苹果公司而言，更显AI战略有重大改变的行为是，苹果公司将会在全平台中集成ChatGPT，用户利用Siri可以直接调用ChatGPT被集成的功能，如图像生成、文档理解等。用户也可以在Writing Tools等工具中使用ChatGPT的特殊功能，协助用户在自己的主题下生成需要的内容。

对于苹果Apple Intelligence的功能，用户肯定是十分期待，不过何时更新，还不太确定。Mark Gurman此前称，Siri的新特性预计将在iOS18.3系统中首次现身，这一时间点比之前设想的iOS18.4版本提前。不过，最近有用户在推特上发文称，已经在苹果下一版系统要更新的代码中出现对集成ChatGPT的描述，预计即将发布的 iOS 18.2 Beta中就会出现支持ChatGPT的Siri和iPhone 16的视觉智能。

苹果的AI创新挑战

虽然看起来苹果的AI创新还不错，且部分更新比预期的提前了，不过苹果内部员工对于该公司的AI水平并不满意。确实，深究苹果即将推出的AI应用，并没有出现行业创新引领的功能，都是别人已经展示过的AI应用。

苹果公司的内部测试显示，与苹果的Siri相比，ChatGPT的准确率要高出大约25%，并且能够回答的问题也多出约30%。因此，不少苹果技术人员认为，该公司的AI技术水平相较于最前沿的AI技术，落后了至少2年的时间。

为什么作为全球科技巨头的苹果，在关键的AI技术上落后了呢。目前来看，有两大重要的原因。其一是苹果的创新思维，过去很多年，苹果一直在以硬件创新为主导，尤其是在智能手机方面，iPhone的创新能力让全球科技人致敬。实际上，这些年苹果一直在践行创始人乔布斯的信念，那就是打造一个端到端的硬件全家桶，引领全球消费电子硬件产品的发展。

也就是在近几年，苹果在硬件创新方面开始乏力，设备全新外观、更强大的处理器、更强大的摄像头、新材料等苹果赖以成名的硬件创新方式，近两年的表现很难让人信服，因而产业界才开始更加关注苹果的AI技术创新。但苹果显然仍在经历硬件创新引领转变为软件创新引领的阵痛。

原因之二是苹果公司对于数据的保护态度，也就是苹果的隐私政策限制了苹果的AI创新。数据是AI技术发展的基础，没有数据的支持，再先进的算法和算力也无法发挥作用。要打造强大的AI模型，需要三项数据支撑：第一是高质量的数据集，能够显著提高AI大模型的精度与可解释性，并减少训练时长；第二是数据多样性，有助于模型更好地理解和捕捉不同的概念、语义和语法结构，从而提高其泛化能力；第三是大规模数据集，更大数据集通常意味着能够提供更丰富的信息供AI学习，减少拟合信息的输出，特别是对于深度学习模型而言，庞大的数据量是提高其性能的关键。

然而，保护隐私是苹果公司的金字招牌，这就导致苹果公司很难从其庞大的用户群里中间获取到大量的、有用的数据，因此到今天仍有相当一部分的Siri的答案来自人工撰写，这和ChatGPT生成差距明显。

生成式AI的下一步

随着苹果公司在全平台集成ChatGPT，苹果产品体现出来的AI能力并不会是弱项，因为OpenAI就是全球顶尖的AI公司。那么，后续苹果自己的AI技术还有希望赶超吗？我们先看一下生成式AI后续的趋势。

首先是强化学习和生成的融合。强化学习是一种通过与环境交互学习最优行为策略的机器学习方法，而生成式AI则是一种通过学习数据分布来生成新数据的技术。通过在生成式AI生成的过程中引入强化学习，可以增强图像生成和编辑、自然语言生成、视频生成、音频生成等方面的能力。不过，相较于完全推理生成，加入强化生成可能会带来生成答案的延迟，但结果质量会更高。

其次是跨模态生成能力提升，跨模态是指处理来自不同感官通道或表现形式的信息的能力，例如文本、图像、音频、视频等。跨模态理解与生成技术的目的在于建立不同模态信息之间的桥梁，实现它们之间的转换和交互。这种能力提升的意义在于，它能够突破单一模态的局限性，充分利用多模态信息的互补性，提高信息处理的准确性和丰富性。

第三是深度个性化生成，目前生成式AI 大多是基于大规模数据集的训练，生成结果缺乏个性化和定制化，随着算法的更新以及用户数据的进一步收集，可以让模型生成更加趋向于个人定制。

此外还有减少模型幻觉、提升模型创造力等。不过，在这些趋势里，有两个关键的因素，一个是算法，还有一个是数据。我们相信苹果软件算法团队的能力，但是苹果如果难以解决数据难题，那么其AI技术恐怕难以追上顶尖对手。

结语

Apple Intelligence让苹果的AI似乎又没有那么落后了，但其中一部分功劳要归功于OpenAI公司的ChatGPT，苹果自己的AI技术正如其员工所言，仍至少落后两年。生成式AI下一步的趋势已经明朗，但苹果自身的障碍仍在，目前来看除了引入外援，苹果很难靠自己引领AI创新了。

打开APP阅读更多精彩内容