大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API
大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品
(图片来源:钛媒体 App 编辑林志佳拍摄)
钛媒体 App 10 月 25 日消息,钛媒体 App 独家获悉,AI 大模型领域的独角兽 MiniMax 将于今年 11 月发布对标 GPT-4o 的 Realtime API 服务,将提升端到端实时多模态处理能力,并带来更低延时、更自然、更沉浸的实时语音对话,为企业协作、社交、直播、游戏等多种场景提供服务。
这是 MiniMax 推出的首款端到端实时语音对话产品。消息人士告诉钛媒体 App,内部正在打磨这款产品,并非常希望 11 月发布时产品效果直接对标 OpenAI GPT-4o。
据悉,今年 5 月,OpenAI 公司推出可免费使用的全新旗舰 AI 模型 GPT-4o,可实时进行音频、视觉和文本推理,它可以在短至 232 毫秒、平均 320 毫秒的时间内响应音频输入,与人类在对话中的反应速度一致。在 API 使用方面,相比去年 11 月发布的 GPT-4-turbo,GPT-4o 价格降低一半(50%),速度提升两倍(200%)。
OpenAI CEO 奥尔特曼(Sam Altman)在推文中表示,新的 GPT-4o 是 OpenAI 有史以来最好的模型,它很智能,速度很快,是原生多模态,并且它可供所有 ChatGPT 用户使用,无论是免费版本还是付费 GPT-4 版。
今年 10 月,实时语音技术公司、声网的兄弟公司 Agora 作为语音 API 合作者出现在了 OpenAI 发布的 Realtime API 公开测试版中。而 MiniMax 也看到了机会,开始与声网进行合作,声网创始人兼 CEO 赵斌在 RTE 2024 第十届实时互联网大会上表示,声网与 MiniMax 正在打磨中国第一个 Realtime API,基于该 API 的智能体产品,能够与人类进行轻松且流畅的实时语音交流。
除了 MiniMax,目前包括科大讯飞、智谱 AI、商汤科技等中国企业都在研发生成式 AI 对话产品,均与 GPT-4o 效果不相上下,OpenAI 近期也开放了 ChatGPT-4o 对话功能。
根据艾瑞咨询的统计,2021 年,对话式 AI 的市场规模为 45 亿元,带动规模 126 亿元。预计 2026 年,对话式 AI 市场规模将达 108 亿元,带动规模超 385 亿元,五年复合年均增长率(CAGR)达 32.5%。
(本文首发于钛媒体 App,作者|林志佳,编辑|胡润峰)
标签: