谷歌推出Gemini 希望击败GPT-4

描述

谷歌首席执行官Sundar Pichai表示,这是人工智能新时代的开始:Gemini时代。Gemini是谷歌最新的大型语言模型,Pichai在6月份的I/O开发者大会上首次提出,现在向公众发布。听Pichai和谷歌DeepMind首席执行官Demis Hassabis描述,这是人工智能模型的一个巨大飞跃,最终将影响谷歌几乎所有的产品。Pichai说:“这一时刻的一个强大之处是,你可以研究一种底层技术,并使其变得更好,并且它会立即衍生到我们的产品中。”

Gemini不仅仅是一个单一的人工智能模型。有一个简单版本叫Gemini Nano,旨在在安卓设备上离线运行。有一个更强大的版本叫Gemini Pro,很快将为谷歌的许多人工智能服务提供动力,从今天开始,它是Bard的支柱。还有一个功能更强大的模型叫Gemini Ultra,这是谷歌迄今为止创建的最强大的LLM,似乎主要是为数据中心和企业应用程序设计的。

从12月13日开始,开发者和企业客户将能够通过谷歌Generative AI Studio或谷歌云中的Vertex AI访问Gemini Pro。Gemini目前只提供英语版本,其他语言显然很快就会出现。但Pichai表示,该模式最终将在全球范围内集成到谷歌的搜索引擎、广告产品、Chrome浏览器等中。这是谷歌的未来,它马上就要到来了。

OpenAI在一年多前推出了ChatGPT,该公司和产品立即成为人工智能领域最火爆的内容。现在,谷歌——这家创造了当前人工智能繁荣背后大部分基础技术的公司,近十年来一直称自己为“人工智能第一”组织,终于准备好反击了。

Hassabis表示:“我们已经对系统进行了非常彻底的并排分析和基准测试。” 谷歌运行了32个完善的基准测试来比较这两个模型,从广泛的整体测试(如多任务语言理解基准测试)到比较两个模型生成Python代码的能力的测试。Hassabis面带微笑地说:“我认为我们在32个基准中有30个基本领先。”

在这些基准(实际上大多非常接近)中,Gemini最明显的优势来自于它理解视频和音频并与之互动的能力。这在很大程度上是有意为之:多模式从一开始就是Gemini计划的一部分。谷歌没有像OpenAI创建DALL-E和Whisper那样,为图像和语音训练单独的模型;它从一开始就建立了一个多感官模型。“我们一直对非常、非常通用的系统感兴趣,”Hassabis说。他特别感兴趣的是如何混合所有这些模式——从任何数量的输入和感觉中收集尽可能多的数据,然后给出尽可能多种类的响应。

目前,Gemini最基本的模型是文本输入和文本输出,但像Gemini Ultra这样功能更强大的模型可以处理图像、视频和音频。Hassabis说:“这将变得更加普遍。还有一些东西,比如动作和触摸,更像机器人类型的东西。” 他说,随着时间的推移,Gemini会有更多的感觉,在这个过程中变得更准确、更接地气。Hassabis表示,这些模型知道的越多,他们就会得到更好的结果。

不过,基准测试只是基准测试,最终,对Gemini能力的真正考验将来自那些想用它集思广益、查找信息、编写代码等的日常用户。谷歌似乎特别将编码视为Gemini的杀手级应用;它使用了一种名为AlphaCode 2的新代码生成系统,称其性能优于85%的编码比赛参与者,高于原始AlphaCode的50%。但Pichai表示,用户会注意到该模型所涉及的几乎所有方面都有所改进。

对谷歌来说同样重要的是,Gemini显然是一个效率高得多的模式。它是在谷歌自己的张量处理单元上训练的,运行起来比谷歌以前的模型(如PaLM)更快、更便宜。除了新模型,谷歌还推出了其TPU系统的新版本TPU v5p,这是一种设计用于数据中心的计算系统,用于训练和运行大型模型。

与Pichai和Hassabis交谈发现,很明显,他们认为Gemini的发布既是一个更大项目的开始,也是其本身的一个阶段性变化。Gemini是谷歌一直在等待的模式,也是它多年来一直在努力打造的模式,甚至可能是它在OpenAI和ChatGPT“接管”世界之前就应该准备好的模式。

谷歌在ChatGPT发布后宣布进入“code red”,此后一直被认为在迎头赶上,似乎仍在努力坚持其“大胆而负责任”的口号。Hassabis和Pichai都表示,他们不愿意为了跟上而走得太快,尤其是在我们离终极人工智能梦想通用人工智能越来越近的时候。通用人工智能是一种自我塑造、比人类更聪明并准备改变世界的人工智能。“随着我们接近AGI,情况将有所不同,”Hassabis说,“这是一种积极的技术,所以我认为我们必须谨慎、谨慎但乐观地对待它。”谷歌表示,它通过内部和外部测试以及红队合作,努力确保Gemini的安全和责任。Pichai指出,确保数据安全性和可靠性对于企业优先的产品尤为重要,而这正是最具生成性的人工智能赚钱的地方。

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分