GPT-4发布！多领域超越“人类水平”，专家：国内落后2-3年

Felix分析 2023-03-16 6000

描述

电子发烧友网报道（文/吴子鹏）北京时间3月15日凌晨，人工智能研究公司OpenAI正式发布了其下一代大型语言模型GPT-4。目前，ChatGPT的Plus订阅用户已经可以使用GPT-4，其他用户需要排队申请内测。

对于GPT-4的性能，很多国外网友的描述都是“GPT-4，起飞！”

多模态大型语言模型GPT-4

GPT-4被定义为OpenAI发展的另一里程碑，其相较于上一代产品GPT-3.5所带来的提升是巨大的。OpenAI工作人员表示，“我们还在为机器学习模型设计的传统基准上对GPT-4进行了评估。GPT-4大大超过现有的大语言模型，与多数最先进的（SOTA）模型并驾齐驱。”

官方介绍称，GPT-4作为一个多模态大模型（接受图像和文本输入，生成文本），主要在四个方面做了增强。

首先是可以更准确地解决难题，具有更广泛的常识和解决问题的能力。在GPT-3.5时代，ChatGPT的精准度时常被吐槽。GPT-3.5根据从互联网上搜罗的大量文章、网站和社交媒体帖子以及用户与OpenAI雇用的人工雇员的实时英文对话进行训练的，因此在输出结果时，一些错误的源数据，也导致ChatGPT给出的答案看似合理，实际上有很大的漏洞。就以考试来衡量，上一代GPT-3.5在很多专业考试中的成绩都是倒数10%，而GPT-4在已测试的考试中，基本都是高分通过，超越了“人类的水平”。

GPT-4在多项考试中优于GPT-3.5

其次是更具创造性和协作能力。在上一代基于GPT-3.5打造的ChatGPT中，很多问题给出的回答都是很简短的，虽然具备一定的逻辑性，不过在专业人士看来还略显“幼稚”。到了GPT-4，该模型能够处理超过25000个（GPT-3.5是3000个）单词的文本，允许长文内容创建、扩展对话以及文档搜索和分析等用例。在显示过程中，GPT-4可以完成总结文章、写诗这样的创造性任务。

第三点是GPT-4的高级推理能力更强。此前，基于GPT-3.5打造的ChatGPT，被很多使用者定义为“一本正经的胡说八道”，在计算方面的能力更是弱于十四五岁的孩子，约等于八九岁孩子。因此，很多人说如果将ChatGPT比作是一个学生，他在数理化方面是严重偏科的。在GPT-4中，这方面的能力得到了显著的增强。在专业测试和学术基准测试中，GPT-4都表现出了不俗的实力。在官网上，OpenAI用会议预约展示了GPT-4的推理能力，GPT-4明显更“擅长”做这个。

最后一点是安全性。针对基于GPT-3.5打造的ChatGPT，曾有内测人员通过引导的方式让其表现出攻击性。同时，有很多报道都指出，上一代ChatGPT曾出现辱骂用户、表白用户、诱导用户离婚、监视开发人员等行为。有业内人士在推特上表示，微软需要关闭必应中的类ChatGPT功能，因为系统有时表现得像精神病一样，会给用户错误答案。特斯拉马斯克也表示，上一代ChatGPT是“不安全的”。OpenAI花了6个月时间使GPT-4更安全、更具一致性。在内部评估中，与GPT-3.5相比，GPT-4对不允许内容做出回应的可能性降低82%，给出事实性回应的可能性高40% 。

当然，GPT-4也还存在自己的局限性，尤其是在事实性、社会偏见、幻觉和对抗性等方面，需要得到持续的优化。在内部的对抗性事实性评估中，GPT-4的得分比GPT-3.5高40%，很显然这还是不够的。

在发布会当晚，微软表示GPT-4已在新必应搜索引擎上运行。

全行业追赶GPT-4

ChatGPT的火热是有目共睹的，在去年11月30日发布后的5天时间里，收获了100万用户；推出仅仅2个月，月活跃用户就成功过亿，成为历史上增长最快的消费者应用程序。如今，GPT-4的发布进一步延续了这股热潮，甚至是让火烧的更旺了。

为了不让微软或者是OpenAI在该领域一骑绝尘，也为了自己能够在AIGC方面得到更大份额的蛋糕。目前，全球科技巨头都在抓紧时间追赶GPT-4。

为了提升旗下类ChatGPT模型的优化速度，谷歌在博文中宣布正式开放其PaLM大型语言模型API。谷歌表示，“我们看到新一轮的生成性人工智能应用正在改变人们与技术互动的方式。在谷歌，我们希望通过提供易于使用的API和工具，使所有开发人员能够开始用生成性人工智能构建下一代应用程序，从而继续使人工智能变得容易使用。”谷歌于2022年4月宣布PaLM，随后一直在优化。北京时间2月8日晚，谷歌正式发布类ChatGPT应用Bard，不过由于演示中出现事实错误，谷歌因此股价大跌，一天市值蒸发近千亿美元。

目前，谷歌正在全力优化PaLM。北京时间3月7日，谷歌和柏林工业大学的团队重磅推出了史上最大的视觉语言模型——PaLM-E，参数量高达5620亿，是GPT-3（参数量为1750亿）参数规模的数倍。

除了谷歌，目前国内科技行业都在关注百度文心一言的发布。百度将于北京时间3月16日下午两点发布自己的类ChatGPT应用文心一言。根据此前的爆料消息，文心一言是百度基于文心大模型技术推出的生成式对话产品，被外界誉为“中国版ChatGPT”。2021年12月，百度与鹏城实验室联合发布共同研发的全球首个知识增强千亿大模型——文心，当时百度首席技术官（CTO）王海峰表示，该模型参数规模达到2600亿，是目前全球最大中文单体模型。这段时间，百度在加班加点地调教文心一言，可能综合实力会比更新的ChatGPT有差距，不过在中文能力上估计会是全球独一档的存在。

针对国内类ChatGPT应用的发展，360周鸿祎表示，ChatGPT比造芯更容易，在国家鼓励性政策的支持下，中国用两三年就能追上美国的水平。不过，在ChatGPT训练必需的通用算力GPU方面，国内和英伟达的总体差距预计在10年左右。

总结

比尔盖茨曾表示，以ChatGPT为代表的人工智能的进步是目前“最重要的”创新，重要性不亚于互联网的发明。目前，全球科技迷对GPT-4趋之若鹜，国内马上也要有自己的“中国版ChatGPT”——文心一言，AIGC掀起的颠覆浪潮已经一浪高过一浪了。

打开APP阅读更多精彩内容