OpenAI 发布旗舰型号“GPT-4o”。能够以类人的速度响应语音输入信息

OpenAI于5月14日宣布ChatGPT新旗舰型号“GPT-4o”被宣布。据说末尾的“o”是“Omni”的首字母。

GPT-4o支持多种音频、视频和文本输入信息，并且可以以每种格式输出。语音输入耗时232毫秒，平均响应时间为320毫秒。这是反应速度与人类交谈时的反应速度相似。。英语和代码的性能与 GPT-4 Turbo 相当，英语以外的语言也更快。

GPT-4o计划分阶段部署。从今天开始，所有用户都可以使用文本和图像功能。 ChatGPT Plus 用户将在未来几周内获得语音模式的 alpha 版本。

向 GPT-4o 打个招呼，这是我们的新旗舰模型，它可以实时跨音频、视觉和文本进行推理：https://t.co/MYHZB79UqN
今天在 API 和 ChatGPT 中推出文本和图像输入，并在未来几周内推出语音和视频。pic.twitter.com/uuthKZyzYx
— OpenAI (@OpenAI)2024 年 5 月 13 日