Voice Studio 是一款轻量可扩展的声音处理工作台,集成语音识别(STT)与语音合成(TTS)功能。基于 faster-whisper 实现中英文混合识别,支持 edge-tts 云端合成和 Piper TTS 本地离线合成,提供 Web UI、桌面悬浮话筒和 CLI 工具,同时暴露 FastAPI REST API 便于开发者集成。

🎯 核心功能
STT + TTS 一体化: 基于 faster-whisper 语音识别和 edge-tts/Piper TTS 语音合成
多接口支持: 提供 Web UI、桌面悬浮话筒、CLI 命令行和 REST API 四种使用方式
中英混合合成: ONNX 模型支持中英文无缝混合语音合成,自动处理长文本
GitHub地址:https://github.com/mjlzz/voice-studio
声明:本站内容均收集于互联网,如不慎侵犯到您的版权利益,请附带相关证明文件来信本站将立即予以下架删除。

评论(0)