基于扩散 Transformer 和 ConvNeXt V2,提供更快的训练和推理性能。
来源:据 README 描述Flat-UNet Transformer 模型,提供与论文最接近的复现。
来源:据 README 描述推理时的流步骤采样策略,显著提高性能。
来源:据 README 描述代码结构包括 .github 工作流程、Dockerfile、LICENSE、README.md、数据目录、源代码目录等。
来源:代码目录结构key_deps: torch, torchaudio | language: Python | framework: PyTorch
来源:据 README 描述适用于语音合成、语音转换等场景。
来源:据 README 描述1.1.18 (2026-03-24): 添加阿拉伯语模型细节,添加 F5TTS v1 Small + LibriTT。
来源:GitHub Releases