财联社5月14日电(编辑石)北京时间周二凌晨1点,自年初以来很久没有给市场带来惊喜的OpenAI举行了春季发布会。该公司首席技术官米拉·穆拉提(Mira Murati)向外界展示了与ChatGPT相关的多项更新。
简而言之,OpenAI的推出主要做了两件事:发布了最新的GPT-4o多模态模型,比GPT-4 Trubo更快、更便宜。
通过大幅提高响应速度,该车型已经能够在语音模式下实现“实时”响应。用户可以像真人一样与ChatGPT聊天-在机器人回答期间打断它并提出更多问题(例如改变话题并要求机器人改变语音和语调),并且无需等待机器人回答前一个问题后再提出新问题。
第二件事是宣布ChatGPT的免费用户也可以使用最新的GPT-4o模型(在更新之前只能使用GPT-3.5)进行数据分析、图像分析、互联网搜索、访问应用商店和其他操作。这也意味着GPT应用商店的开发者将面临大量新用户。
当然,付费用户将获得更高的消息限制(OpenAI称至少是5倍)。当免费用户的消息用完时,ChatGPT会自动切换到GPT 3.5。此外,OpenAI将在下个月左右向Plus用户推出基于GPT-4o的改进语音体验。目前,GPT-4o的API不包括语音功能。
最后,苹果电脑用户将迎来一款专为macOS设计的ChatGPT桌面应用程序,用户可以通过快捷键“拍摄”桌面并向ChatGP提问。OpenAI表示,Windows版本将于今年晚些时候推出。
-新闻发布会全过程回顾-
01:00:倒计时结束,直播正式开始。首席技术官米拉·穆拉提出现了。
01:01:Mira Murati说她今天将谈论三件事:1)为什么一个免费且广泛使用的工具对OpenAI非常重要?2)如何减少摩擦并使ChatGPT可供所有人使用,该公司将发布ChatGPT的桌面版本;3)该公司将于今日发布名为GPT-4o的最新旗舰机型。
这里的“O”表示“omni”——它指的是GPT-4o的多模态特性。
01:05:对于桌面版的ChatGPT,OpenAI意味着UI经过了重新设计。(注:OpenAI在公告中表示,桌面应用程序适用于macOS,Windows版本将于今年晚些时候推出。)
01:08:GPT-4o的智能与GPT-4相同,但运行速度更快,并具有文本、音频和视频功能。这是OpenAI历史上第一次在“易用性”的目标上取得巨大进展。
01:13:直到今天,在语音模式下,OpenAI仍然需要调用三个模型——音译、智能和语音,这也造成了体验的极大延迟。GPT-4o自然可以根据图片、文件和声音进行推理。
01:17:通过提高效率,OpenAI还可以向免费用户提供GPT-4智能。
01:19:Murati重申,由于GPT-4o带来的效率提高,现在OpenAI可以让每个人都可以使用(GPT-4)工具。
01:20:目前,GPT商店中有超过100万名GPT。随着免费开放,GPTs开发者将获得更大的用户群。
01:22:免费用户还可以使用“浏览器”功能上传图片、分析图片和搜索实时信息。同时,GPT-4o还将支持记忆功能。GPT-4o还将支持API供开发人员调用。与GPT-4 Turbo相比,GPT-4o速度快两倍,价格便宜50%,速率限制高五倍。
01:25:两位研究主管陈唐山和巴雷特·佐夫将登台展示一系列新功能。
01:26:陈唐山正在和ChatGPT聊天。机器人可以从快速的喘气声音中理解“紧张”的含义,并引导他深呼吸。
01:28:陈表示,他的演示是为了表明在当前的语音模式下,无需与机器进行机械问答,可以进行实时交流。没有必要在实时通信中每次都“尴尬地等待2-3秒钟”。
01:30:在实时演示过程中,主持人不断要求ChatGPT改变语气,包括夸张的语气、机器人的期待以及用“唱歌”来讲故事。
01:35:Barret Zoph启动相机,并要求ChatGPT帮助他实时求解一元方程。
01:37:除了图像识别和解决问题的能力之外,ChatGPT还展示了根据图像的变化与Barret进行实时交互的能力。
01:40:Barret进一步展示了ChatGPT桌面版实时解释代码和计算机桌面(一个温度图表)的能力。
01:42:穆拉提和陈唐山展示了ChatGPT在意大利语和英语之间的实时翻译。
发布会结束时,OpenAI表示,今天的发布会主要关注免费用户,这些功能将在未来几周内逐步推送给所有用户。
根据OpenAI官网公告,GPT-4o将同时面向付费Plus用户、团队用户和免费用户推出。Plus用户的消息数量将是免费用户的五倍,团队和企业用户可用的消息数量也将更高。当免费用户的使用达到限制时,ChatGPT将自动切换到GPT-3.5继续对话。