文章预览
甲子发现推荐 北京时间凌晨1点,OpenAI开了一场直播,发布了 2个比Whisper更好的语音转文本的STT模型: gpt-4o-transcribe 和 gpt-4o-mini-transcribe ,1个文本生成语音的TTS模型: gpt-4o-mini-tts 。新的语音模型效果如何?「甲子发现」转载数字生命卡兹克的一手实测,带你了解。 作者|卡兹克、dongyi OpenAI最近总是喜欢搞突袭。 昨晚11点的时候突然发了一个预告,4秒钟的音频的大概意思,就是太平洋时间10点我们发个产品。 然后就在北京时间凌晨1点,开了一场直播,发了一些新玩意。 总结一下就是: 2个比Whisper更好的语音转文本的STT模型: gpt-4o-transcribe 和 gpt-4o-mini-transcribe ,1个文本生成语音的TTS模型 : gpt-4o-mini-tts 。这些模型都 提供了API的接入方式。没了。 一个一个说。 1. STT模型:gpt-4o-transcribe gpt-4o-transcribe 和 gpt-4o-mini-transcribe 说是两个,其实也就是一个
………………………………