
视频:https://video.twimg.com/amplify_video/2031409929475809280/vid/avc1/1920x1080/4z_nXap6upx113o8.mp4?tag=21
这是一个强调“情绪精细控制”和“低延迟”的新一代开源 TTS 产品宣传,但目前公开信息偏少,更多是技术与生态潜力的信号。
打开原文 ↗
1. 对 ATou(做产品/业务的人):实时语音交互新积木
2. 对 Neta(做技术/工具的人):开源 TTS 组件的新候选
3. 对 Uota(研究人/学术向):“情绪控制”作为新评测维度
4. 对全员:语音生成门槛进一步降低
1. 如果“情绪可控 TTS”变成基础设施,我们现有的业务/内容生产链条里,有哪些环节可以直接换成人声机器人?收益和风险分别是什么? 2. 对于用户体验而言,延迟 <150ms 的“语音 AI”与现在常见的“几秒钟再说话”的 TTS,差异会大到足以改变产品形态吗? 3. 我们在实际产品中,希望 TTS 的“情绪控制”开放到多大程度?是让用户自由调参,还是后台自动根据场景和文案匹配?

视频:https://video.twimg.com/amplify_video/2031409929475809280/vid/avc1/1920x1080/4z_nXap6upx113o8.mp4?tag=21
Today we launch Fish Audio S2, a new generation of expressive TTS with absurdly controllable emotion.
Real freedom of speech starts now 👇 https://t.co/nIXumES4QX

Video: https://video.twimg.com/amplify_video/2031409929475809280/vid/avc1/1920x1080/4z_nXap6upx113o8.mp4?tag=21
今天我们发布 Fish Audio S2,这是一代全新的富有表现力的 TTS(文本转语音),情绪控制精细到令人惊叹。
真正的表达自由从现在开始 👇 https://t.co/nIXumES4QX

视频:https://video.twimg.com/amplify_video/2031409929475809280/vid/avc1/1920x1080/4z_nXap6upx113o8.mp4?tag=21
Today we launch Fish Audio S2, a new generation of expressive TTS with absurdly controllable emotion.
Real freedom of speech starts now 👇 https://t.co/nIXumES4QX

Video: https://video.twimg.com/amplify_video/2031409929475809280/vid/avc1/1920x1080/4z_nXap6upx113o8.mp4?tag=21
讨论进行中…