OpenAI发布GPT-4参加考试击败九成人类,人工智能会替代人类吗?
ChatGPT的热度还没有散去,它的开发商——人工智能研究公司OpenAI日前又发布了大型多模态模型GPT-4。与ChatGPT所用的模型相比,GPT-4不仅能够处理图像内容,并且回复的准确性有所提高。
GPT-4只根据一个粗糙的草图,用10秒就做出了一个网站。在模拟律师考试中,GPT-4的得分约为前10%,也就是说它击败了90%的人类。它为什么这么强大?人工智能替代人类工作,真的指日可待了吗?记者采访到南京大学人工智能学院教授俞扬,来听听他怎么说。
根据OpenAI官方的介绍,GPT-4是一个大型多模态模型,它接收你的提示,给你想要的答案。一方面,GPT-4是强大的工具,帮助你完成和语言相关的任务;另一方面,GPT-4是一个智能系统,将你的梦想、思考、观点用文字的形式呈现在眼前。南京大学人工智能学院教授俞扬进一步介绍说,所谓模态指的是信息来源的形态,它可以是语言文字,也可以是视觉看到的图像,还可以是听觉听到的声音。
俞扬:就像人一样,除了有语言以外,我们还有眼睛。这是很重要的一个信息来源,我们可以去看这个世界,这叫做用视觉去感知世界。所以它大模型往多模态发展,就会更接近于人类的视觉、听觉,能够去阅读文字,能够看得懂图像。
OpenAI介绍,GPT-4一次能接收和生成2.5万字的文本,是ChatGPT的8倍。它还能理解图像,能够有逻辑地给出推理和解释,这一点被认为是质的飞跃。
俞扬:这确实是一个非常大的飞跃。对于人来说,我们感知这个世界的信息,70%是靠我们的眼睛去看的,所以能“看”这件事情对于我们来说是非常关键的。但是之前的这种语言模型,虽然它做语言做得非常好,但是它还不能“看”,它不能和人处在同一个维度下面。现在它也能“看”了,而且还能“说”,就会使得新的模型和人类是处在同样的时空下面的。我们人可以看什么,它也可以去看什么,人可以用语言和它再进行沟通,所以它对模型的应用范围就会变得更加宽广。
OpenAI联合创始人兼总裁格雷格·布罗克曼(Greg Brockman)在发布会直播上也对GPT-4接受图像输入并理解图像内容进行了详细演示:简单在纸上画一个网站的草稿图,拍一张照片上传给GPT-4,它可以快速识别,并根据要求生成网页代码。
格雷格·布罗克曼:我这里有一张很棒的网站草图,我拿出我的手机,给这张草图拍张照,发到我们的讨论区。来吧!现在技术正在解决它。我想最令人惊叹的是,我们正在这里与一个神经网络交流,而这个神经网络被训练用于预测接下来发生的事情。它玩了一个游戏,给它展示一部分文件,再根据无法想象的大量文件预测下一步。从那里,它学到了这些技能,你可以灵活应用这些技能。好!现在我们能看到输出了,我们从那张图输出了HTML文件。来做个对比吧,从一张手绘草稿,到一个能工作的网站。
除普通图片外,GPT-4还能处理更复杂的图像信息,比如直接把论文截图发给GPT-4,它可以按像素处理其中的文字和图片,并给出对整篇论文的总结摘要。几乎所有的办公室案头工作,GPT-4都可以完成。在性能表现上,OpenAI更是直接表示:GPT-4“在各种专业和学术基准上和人类相当!”比如模拟律师考试,GPT-4取得了前10%的好成绩,做美国高考SAT试题,GPT-4也在阅读写作中拿下710分的高分。
另外,值得关注的是,GPT-4对于英语以外的语种支持也得到了极大的优化,在多种语言方面均表现出优越性。其中,GPT-4的中文达到了80.1%的准确性,英文准确性提高到了85.5%。不过,俞扬观察发现,GPT-4在一些方面的能力似乎并没有达到预期。
俞扬:因为它就是一个语言模型,所以我们默认它在语言任务上面应该会表现得比较好,应该会表现得基本上要超过人类。但是我发现它有几个考试,好像没有比人做得好,考试得分没有我们想象得高,这里面可能涉及比较深层次的逻辑思考。另外,虽然它在数学题上面增加了很多训练的数据,但是要做深层次的数学思考,依然是比较困难的。用它现有的这种模型的能力,从根源上来说,它是不太适合做数学思考或者逻辑思考这一类任务的。
OpenAI介绍说,GPT-4的核心价值在于为每个人的人生创造无穷的价值,并最终带来更高质量的生活。而更强大的功能,意味着GPT-4接受了更多数据的训练,因此运行起来也更加昂贵。据了解,目前GPT-4没有免费版本,仅向ChatGPT Plus的付费订阅用户及企业和开发者开放。在GPT-4发布后,有不少人感叹它太强了,也有人调侃,我们的失业危机是不是又加强了?人工智能替代人类工作,还有多远?
俞扬:像这样的模型,不管它能力有多强,这个模型本身是不会取代人的。那么,有可能会增加什么?增加人和人之间竞争力的差别。比如原来一个项目可能需要100个程序员,现在把模型的能力提上去了以后,使得每一个程序员的开发效率得到了大幅提升,现在可能只需要20个程序员就够了。在这种情况下,可能会导致80个程序员需要去做别的事情。但这样导致的结果其实并不是模型在替代人,而是模型在加强个人的能力,剩下的80个人可能会去寻找新的工作,在新的岗位上面也可能达到更多的生产力。对于我们每一个人来说,只要能够很好地掌握和利用新的技术,我们预期的收入水平应该是会提升的,因为我们的生产力在提升。