今天看啥  ›  专栏  ›  腾讯科技

OpenAI教谷歌做语音助手!新模型GPT-4o科幻级语音交互,零延迟满情绪,AI进入HER时代

腾讯科技  · 公众号  · 科技媒体  · 2024-05-14 06:15
课代表系列——最快最全拆解AI大事儿。本文关注OpenAI最新发布,详细解读新模型GPT-4o。文 / 腾讯科技 郭晓静、郝博阳5月14日凌晨,OpenAI终于发布了Sam Altman提前造势的“Magic(魔法)”,主要包括三个重点发布,ChatGPT新UI、桌面版GPT、以及最重要的,新的多模态模型GPT-4o。当模型变得越来越复杂,新的ChatGPT用户界面变得更加简洁,交互体验实际上变得更加自然和简单。ChatGPT新UI桌面版GPT实时在线,能随时帮你解决写代码、读图表等任务,且从演示视频看上去,桌面版GPT可以直接通过视觉等方式“读懂”你的任务,这大大提高了端侧任务处理的想象力。最重磅的是新的模型GPT-4o。根据OpenAI的官网解释,"o"代表“全知”,是朝着更自然的人类与计算机交互迈出的一步。总结下来,新模型GPT-4o有三大“魔法”:①多模态:接受文本、音频、图像作为组合 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照