Resemble AI 发布开源语音合成模型 Chatterbox Turbo AI初创企业ResembleAI正式推出开源文本转语音模型“ChatterboxTurbo”,仅需5秒语音样本即可完成高质量人声克隆。官方表示,该模型在语音自然度与保真度方面超越ElevenLabs和... 奈飞网 2025-12-31 5 #语音合成 #人工智能 #chatterbox
通义百聆语音双子星升级并开源,大幅提升语音合成与识别能力 据通义大模型官方发布,通义百聆正式推出升级版语音大模型Fun-CosyVoice3与Fun-ASR,并同步向全球开源。本次迭代重点强化模型的核心能力与落地实用性,旨在为开发者及企业用户提供更高效、更可... 奈飞网 2025-12-15 3 #语音合成 #https
面壁智能发布 VoxCPM 1.5,面向高拟真语音生成的新型端到端 TTS 模型 面壁智能正式发布面向高保真语音合成的全新端到端TTS模型——VoxCPM1.5版本。本次升级核心特性如下:高保真音频克隆能力:AudioVAE采样率由16kHz升级至44.1kHz,显著提升音质还原度... 奈飞网 2025-12-13 2 #端到端 #语音合成 #tts
微软发布 VibeVoice 0.5B:仅 0.5B 参数却实现 300 毫秒实时开口 微软正式推出全新实时文本转语音模型VibeVoice-Realtime-0.5B。虽然参数量仅为0.5B,却实现了近乎实时的语音合成能力,最快约300毫秒即可启动发声,达成“话音未落、语音已起”的丝滑... 奈飞网 2025-12-05 2 #毫秒 #人工智能 #语音合成