12月23日,阿里巴巴集团发布的技术模型Z-Image Turbo在全球知名基准测试平台的图像生成模型评估中位列榜首。
根据公开的测试数据显示,这款参数规模为6B的模型在综合评分上超越了其他更大参数规模的开源模型,目前已在阿里云平台提供服务,其图像生成成本约为每千张5美元。
测试结果显示,Z-Image Turbo获得了1152的ELO评分,创造了该榜单的新纪录。行业观察人士指出,该模型在性能表现、生成效率及使用成本方面具备显著优势。
技术资料显示,该模型支持在配备16GB显存的消费级显卡上运行。在高效能计算环境中,其图像生成响应时间可缩短至约1秒,且输出画质可媲美更大规模的模型。

在生成效果方面,该模型提升了图像的细节还原能力,能够细致呈现皮肤质感、发丝以及各类材质纹理。同时,其对中英文文本的渲染能力进行了强化,即使在复杂版式或小字号场景下,也能保持文字的清晰度与布局的自然感。

在技术架构上,该模型采用了单流扩散Transformer设计,将文本、图像潜变量等条件统一为序列输入,从而提升了参数利用效率。通过解耦式蒸馏与强化学习训练技术,其图像生成所需的推理步骤得以大幅减少,有效提升了生成速度。
此外,模型内置的提示词理解模块能够解析复杂的语义描述。例如,当用户输入古诗词意境时,模型可生成与之匹配的视觉图像。
据了解,该模型于11月下旬面向全球开源,发布当日即在主流开发者社区的热门榜单中位居首位,并持续保持高关注度。截至目前,其下载量已突破400万次。