高性能音视频转录和翻译工具Faster Whisper TransWithAI ChickenRice-星云资源网

高性能音视频转录和翻译工具 - 基于 Faster Whisper 和音声优化 VAD 的日文转中文优化版本

✨ 功能特性

🎯 高精度日文转中文翻译: 基于5000小时音频数据训练的"海南鸡v2"日文转中文优化模型
🚀 GPU加速: 支持 NVIDIA CUDA 11.8/12.2/12.8 及 AMD ROCm/HIP（RDNA1–RDNA4）
☁️ 云端推理: 支持 Modal 云端 GPU 推理，无本地显卡也能使用
📝 多格式输出: 支持SRT、VTT、LRC等多种字幕格式
🎬 音视频支持: 支持常见音频(mp3/wav/flac等)和视频格式(mp4/mkv/avi等)
💾 智能缓存: 自动跳过已处理文件，提高批量处理效率
🔧 灵活配置: 可自定义转录参数，满足不同场景需求

基本用法:

将需要转录/翻译的音频或视频文件（或包含它们的文件夹）拖放到相应的批处理文件上运行。

=== 选择运行模式 ===

CPU模式:
- 拖放到 "运行(CPU).bat" - 使用CPU进行处理

GPU模式（仅限NVIDIA显卡）:
- 拖放到 "运行(GPU).bat" - 显存≥6GB时使用
- 拖放到 "运行(GPU,低显存模式).bat" - 显存4GB时使用
- 建议先更新显卡驱动到最新版本

视频专用模式:
- 拖放到 "运行(翻译视频)(CPU).bat" - 使用CPU处理视频
- 拖放到 "运行(翻译视频)(GPU).bat" - 使用GPU处理视频
- 拖放到 "运行(翻译视频)(GPU,低显存模式).bat" - 低显存GPU处理视频

输出到指定文件夹:
- 拖放到 "运行(GPU)(输出到当前文件夹).bat" - 字幕输出到"输出"文件夹

=== 支持的格式 ===

音频格式: mp3, wav, flac, m4a, aac, ogg, wma
视频格式: mp4, mkv, avi, mov, webm, flv, wmv

输出格式:
- LRC (歌词格式，适合音乐播放器)
- SRT (常用字幕格式，适合视频播放器)
- VTT (WebVTT格式，适合网页视频)

所有批处理文件默认会生成这三种格式的字幕。如果字幕文件已存在，将自动跳过。

GitHub地址：https://github.com/TransWithAI/Faster-Whisper-TransWithAI-ChickenRice