世界视点！AI升级：正在接近“人”的GPT-4-大众银行网

当前位置：首页 >深度 > 正文

世界视点！AI升级：正在接近“人”的GPT-4

2023-03-15 21:33:31 21世纪经济报道

记者杨清清北京报道 AI的“下一步”，OpenAI并没有让市场等太久。

3月15日，OpenAI正式发布了多模态预训练大模型GPT-4。作为迄今为止规模最大、功能最强大的多模态预训练模型，GPT-4实现了语言与图片的融合，令计算机更好地理解了人类的交流方式。

【资料图】

“这是OpenAI努力扩展深度学习的最新里程（002219）碑。”OpenAI在对GPT-4的官方介绍中表示，“GPT-4是一个大型多模态模型，它接受图像和文本输入、进行文本输出，虽然在许多现实场景中它尚不如人类，但在各种专业和学术基准上表现出与人类相当的性能。”

自1956年人工智能概念首次被提出后，人工智能在巅峰与暗流中游走数年，如今再次来到了转折时刻。

已经足够“聪明”

从整体而言，GPT-4实现了多重能力的跃升。

与此前的版本相比，GPT4在语言、文本、图像三个层面利用大量数据训练AI系统。由此，GPT-4具备强大的识图能力，文字输入限制也提升至2.5万字；GPT-4的回答准确性也显著提升，还能够生成歌词、创意文本从而实现风格变化。同时，GPT-4在各类专业测试及学术基准上也表现优良。

“在日常对话中，GPT-4与GPT-3.5之间的差距或许微妙，但当任务复杂度足够高的时候，GPT-4将具备更可靠、更具创造性的特点，且能够处理更细致的指令。”围绕GPT-4与前代大模型的对比，OpenAI介绍称。

例如，根据OpenAI公布的实验数据，GPT-4参加了多种基准考试测试，包括美国律师资格考试 Uniform Bar Exam、法学院入学考试 LSAT、“美国高考” SAT数学部分和证据性阅读与写作部分的考试，在这些测试中，它的得分高于88%的应试者。相较之下，GPT-3.5版本大模型的成绩是倒数10%。

“如果说GPT3系列模型给大家证明了，AI能够在一个模型里做多个任务（也就是所谓通用），GPT4在很多任务上已经是人类水平（human-level），在很多专业和学术考试上超越90%的人类。”出门问问创始人&CEO李志飞评论称。

除了足够“聪明”之外，相较于此前的GPT模型而言，GPT-4最大的突破之一是在文本之外还能够处理图像内容。OpenAI表示，用户同时输入文本和图像的情况下，比如带有文本和照片的文档、图表或者屏幕截图，它能够生成相应的自然语言和代码等文本。

除了普通图片，GPT-4还能处理更复杂的图像信息，包括表格、考试题目截图、论文截图、漫画等。

此外，在多语种方面，GPT-4也体现出优越性。在测试的26种语言中，GPT-4在24种语言方面的表现均优于GPT-3.5等其他大语言模型的英语语言性能，其中包括部分低资源语言如拉脱维亚语、威尔士语等。在中文语境中，GPT-4能够达到80.1%的准确性。

与ChatGPT语言风格平静、固定冗长的特点不同， GPT-4引入了全新的API功能“系统”消息，允许用户以及开发人员通过该功能定制AI风格和任务，实现不同的用户体验。

尽管GPT-4功能强大，但同时OpenAI仍坦言，与早期GPT模型类似，GPT-4也具备局限性。其依然会形成推理错误，因而在使用语言模型输出时需要非常小心，最好以人工核查、附加上下文或避免高风险使用的方式予以辅助。

在参数量方面，此次OpenAI并未公布GPT-4的模型参数和数据规模，也并未给出技术原理。此前，GPT-3的参数量则为1750亿。OpenAI 表示，正在开源 OpenAI Evals 软件框架，它被用于创建和运行基准测试以评估GPT-4 等模型，同时可以逐样本地检查模型性能。

“GPT-4的模型发布，本身是技术持续升级迭代发展的必然阶段。AI行业每一年都会有些新模型发布，趋势就是大模型、多模态。”在接受记者采访时，IDC中国研究总监卢言霞表示，“多模态肯定是必然趋势，毕竟AI要真正达到人的智慧，需要处理多模数据。且在各行业场景里，大都是涉及多模态数据的处理。”

探索商业应用

尽管GPT-4已经引爆舆论，多位从业人员跃跃欲试，但目前GPT-4没有免费版本。

从应用角度而言，在GPT-4发布后，OpenAI也直接升级了ChatGPT。目前，GPT-4的访问权限仅面向ChatGPT Plus的付费订阅用户及企业和开发者开放。OpenAI方面称，想要访问GPT-4的API，用户可以注册等待，公司将邀请部分开发者进行体验。

目前，GPT-4已有部分行业应用。根据OpenAI官网给出的案例，GPT4已在教育、社会公益、金融、娱乐等方面进行应用并展开商业合作，包括Duolingo（多邻国）、Khan Academy（可汗学院）等教育企业。

此外，在微软的产品生态中，GPT-4也有落地。在GPT-4发布后，微软方面宣布，目前全新必应预览版中已经搭载了定制版本的GPT-4。

“微软有望在产业中通过GPT-4不断拓展下游新兴领域，应用于更多的场景中，并利用其多模态模型成本改变传统AI客制化与定制化的特点，逐步向通用化方向发展。”华鑫证券计算机研究团队分析称。

作为微软的对手之一，谷歌也在紧锣密鼓地追赶ChatGPT。近日，谷歌联合柏林工业大学团队推出史上最大的视觉语言模型——PaLM-E，参数量高达5620亿。作为一种多模态具身视觉语言模型（VLM），PaLM-E不仅可以理解图像，还能理解、生成语言，可以执行各种复杂的机器人指令而无需重新训练。

而在3月14日，谷歌进一步宣布，计划将人工智能技术整合到Gmail电子邮件和Google Docs文档等办公应用中。谷歌的一位发言人表示，将向部分个人消费者和一些商业及教育用户开放上述新功能，但并未说明何时将广泛推出这些新功能，以及是否会额外收费。

不过从用户角度而言，对GPT-4的热情仍高于一切。由于GPT-4仅限于ChatGPT Plus订阅用户使用，当晚大批新订用户涌入，以至于OpenAI的付款系统一度宕机。

不仅仅是GPT-4，市面上所有的大模型，都有可能替代现有的AI应用。关键是在哪些场景里，大模型能够取得比现有应用更好的效果。（实习生陈军燕对本文亦有贡献）

关键词：

相关新闻

世界视点！AI升级：正在接近“人”的GPT-4

瑞士信贷计划分拆投行业务2025年IPO上市环球快播报

世界排名铁定回到前三能否超陈梦关键看她本周能走多远？-环球观察

全英赛首日国羽8战全胜！石宇奇领衔战次日，谁会成出局第一人？热点聚焦

英国将向量子计算10年投资25亿英镑天天热闻

天使动漫2021_天使动漫网站官网天天快讯

汽车润滑油的作用和工作原理（汽车润滑油的作用是什么）|最新消息

天天简讯:3D感应板块3月14日涨0.6%，晶方科技领涨，主力资金净流入5547.83万元

成飞集成：2022年净利润同比增长4.82%，拟10派0.5元

全球实时：罗马诺：那不勒斯与洛博特卡谈续约，新合同至2027附1年延长选项

天天要闻：南充二诊2023各科试卷及参考答案汇总_更新中

男子藏女厕偷拍，被女生“瓮中捉鳖”，一旁大爷薅住其一顿胖揍|天天最新

天天滚动:六年级上册数学易错题100道_六年级上册数学易错题

港股异动 | 长城汽车(02333)跌近6%领跌汽车股车市价格战愈演愈烈需求回暖但弹性不足_天天热门

环球速递！代收代付业务账务处理

天天精选！陕北种什么药材最赚钱_种什么药材最赚钱

新股消息 | 耐看娱乐三度递表港交所主板大部分收益来自网剧及网络电影

焦点快看：官方回应山西泽州二三孩中考将加10分：由于加分对象十几年后才中考，加分措施还未执行过

环球焦点！中央气象台：西北华北等地有沙尘天气

招商积余（001914）3月13日主力资金净卖出353.17万元

暖暖的味道何亮大厨_暖暖的味道

美国监管机构出手救市，硅谷银行英国分行或纳入破产程序

健康元：公司将持续推进数字化营销平台建设和终端市场活动支持，线上线下有效结合，全面做好医生端和患者端的品牌深入认知工作-环球通讯

实时：杭州锐美健身管理有限公司_关于杭州锐美健身管理有限公司简述

会计专硕考试科目一览表_会计专硕考试科目-世界速看

安井食品：预制菜等动销良好 1至2月营收同比增长约37.4%

全球集装箱运价指数本周下降12% 中国/东亚至北欧运价下降30%_独家焦点

速读：windows esd安装文件可以删除吗_windows安装临时文件可以删除

虎扑比赛中心今日nba战况_nba战况天天速看料

怎么解决win10发送错误报告_win10发送错误报告处理方法-全球今日讯

三七粉能冷冻保存吗三七粉是否可以保存_环球热门

焦点日报：电动车什么牌子的质量好点_电动车什么牌子的质量好

肖战第一次去天天向上是什么时候_肖战第一次上天天向上是哪一期天天播报

碳元科技：杨军拟合计减持不超1%股份

华特气体（688268）3月10日主力资金净卖出967.07万元

遗迹套装效果_遗迹套

内蒙古民警暴雪中徒步8小时寻回走失牛群

就业

雄安新区开展就业援助“暖心活动”招聘会助力困难群众就业创业京菜美食节发布三大餐饮榜单北京全市餐饮消费明显向好国台办：民进党当局阻挠限制两岸正常交流合作，倒行逆施不得人心国台办：“以武拒统”只会将台湾推向灾难国台办：台湾是中国的一部分，解放军开展有关军事行动天经地义

理论

当前位置：首页 >深度 > 正文

华为汪涛：加速基础软件发展共建数字经济生态底座

述评：共享中国机遇同促开放合作

陆金所控股发布第三季度财务报告营业总收入同比增长21.8%

富士胶片（中国）总裁田中健一：深耕中国市场助力实现“健康中国2030”

叙利亚总统巴沙尔会见到访的阿联酋外长

中东企业共享进博商机感受中国开放“磁场”

疫情缓和以色列谨慎“开放”

数读进博会 | 贸易投资对接会收获满满！超千家中外企业达成200余项合作意向

开放，激活世界经济一池春水——第四届进博会成果丰硕

泰国孔敬大学孔子学院“本土中文教师高级研修班”结业

中国驻美大使秦刚：希望旅美侨胞发挥桥梁作用，促进中美友好合作

中美两国领导人向美中关系全国委员会年度晚宴致贺信

南水北调大事记为你解锁跨越半个世纪的超级工程

厚植创新沃土引才“汇盐”

当前位置：首页 >深度 > 正文

华为汪涛：加速基础软件发展 共建数字经济生态底座

述评：共享中国机遇同促开放合作

陆金所控股发布第三季度财务报告 营业总收入同比增长21.8%

富士胶片（中国）总裁田中健一：深耕中国市场助力实现“健康中国2030”

叙利亚总统巴沙尔会见到访的阿联酋外长

中东企业共享进博商机 感受中国开放“磁场”

疫情缓和 以色列谨慎“开放”

数读进博会 | 贸易投资对接会收获满满！超千家中外企业达成200余项合作意向

开放，激活世界经济一池春水——第四届进博会成果丰硕

泰国孔敬大学孔子学院“本土中文教师高级研修班”结业

中国驻美大使秦刚：希望旅美侨胞发挥桥梁作用，促进中美友好合作

中美两国领导人向美中关系全国委员会年度晚宴致贺信

南水北调大事记 为你解锁跨越半个世纪的超级工程

厚植创新沃土引才“汇盐”

华为汪涛：加速基础软件发展共建数字经济生态底座

陆金所控股发布第三季度财务报告营业总收入同比增长21.8%

中东企业共享进博商机感受中国开放“磁场”

疫情缓和以色列谨慎“开放”

南水北调大事记为你解锁跨越半个世纪的超级工程