暂无菜单项

Pandrator - 开源高质量文本转语音工具

发布于 更新于
175

工具介绍

一种工具,旨在将文本、PDF、EPUB 和 SRT 文件转换为多种语言的语音音频,包括语音克隆、LLM 基于文本的预处理以及通过将同步输出与视频的原始音轨混合来直接将生成的字幕音频保存到视频文件的能力。 它利用

XTTS

Silero

  和

VoiceCraft

模型进行文本到语音转换和语音克隆,并通过 RVC_CLI 进行增强,以提高质量和更好的语音克隆结果,并通过 NISQA 进行音频质量评估。 此外,它还集成了 Text Generation Webui 的 API,用于基于本地LLM的文本预处理,从而在音频生成之前实现广泛的文本操作。

工具地址

GitHub:

https://github.com/lukaszliniewicz/Pandrator

0 讨论
热门最新
总结
暂无总结
0 / 600