高性能音视频转录和翻译工具 - 基于 Faster Whisper 和音声优化 VAD 的日文转中文优化版本
✨ 功能特性
🎯 高精度日文转中文翻译: 基于5000小时音频数据训练的"海南鸡v2"日文转中文优化模型
🚀 GPU加速: 支持 NVIDIA CUDA 11.8/12.2/12.8 及 AMD ROCm/HIP(RDNA1–RDNA4)
☁️ 云端推理: 支持 Modal 云端 GPU 推理,无本地显卡也能使用
📝 多格式输出: 支持SRT、VTT、LRC等多种字幕格式
🎬 音视频支持: 支持常见音频(mp3/wav/flac等)和视频格式(mp4/mkv/avi等)
💾 智能缓存: 自动跳过已处理文件,提高批量处理效率
🔧 灵活配置: 可自定义转录参数,满足不同场景需求
基本用法:
将需要转录/翻译的音频或视频文件(或包含它们的文件夹)拖放到相应的批处理文件上运行。
=== 选择运行模式 ===
CPU模式:
- 拖放到 "运行(CPU).bat" - 使用CPU进行处理
GPU模式(仅限NVIDIA显卡):
- 拖放到 "运行(GPU).bat" - 显存≥6GB时使用
- 拖放到 "运行(GPU,低显存模式).bat" - 显存4GB时使用
- 建议先更新显卡驱动到最新版本
视频专用模式:
- 拖放到 "运行(翻译视频)(CPU).bat" - 使用CPU处理视频
- 拖放到 "运行(翻译视频)(GPU).bat" - 使用GPU处理视频
- 拖放到 "运行(翻译视频)(GPU,低显存模式).bat" - 低显存GPU处理视频
输出到指定文件夹:
- 拖放到 "运行(GPU)(输出到当前文件夹).bat" - 字幕输出到"输出"文件夹
=== 支持的格式 ===
音频格式: mp3, wav, flac, m4a, aac, ogg, wma
视频格式: mp4, mkv, avi, mov, webm, flv, wmv
输出格式:
- LRC (歌词格式,适合音乐播放器)
- SRT (常用字幕格式,适合视频播放器)
- VTT (WebVTT格式,适合网页视频)
所有批处理文件默认会生成这三种格式的字幕。如果字幕文件已存在,将自动跳过。
GitHub地址:https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice

评论(0)