语音合成-奈飞网

Resemble AI 发布开源语音合成模型 Chatterbox Turbo

AI初创企业ResembleAI正式推出开源文本转语音模型“ChatterboxTurbo”，仅需5秒语音样本即可完成高质量人声克隆。官方表示，该模型在语音自然度与保真度方面超越ElevenLabs和...

据通义大模型官方发布，通义百聆正式推出升级版语音大模型Fun-CosyVoice3与Fun-ASR，并同步向全球开源。本次迭代重点强化模型的核心能力与落地实用性，旨在为开发者及企业用户提供更高效、更可...

奈飞网 2025-12-15 12 #语音合成 #https

面壁智能正式发布面向高保真语音合成的全新端到端TTS模型——VoxCPM1.5版本。本次升级核心特性如下：高保真音频克隆能力：AudioVAE采样率由16kHz升级至44.1kHz，显著提升音质还原度...

奈飞网 2025-12-13 11 #端到端 #语音合成 #tts

微软正式推出全新实时文本转语音模型VibeVoice-Realtime-0.5B。虽然参数量仅为0.5B，却实现了近乎实时的语音合成能力，最快约300毫秒即可启动发声，达成“话音未落、语音已起”的丝滑...