
最近刷B站、油管时,经常会遇到一些精彩的外文视频,但是听不懂怎么办?
虽然很多平台有自动翻译字幕,但要么翻译质量一般,要么没有配音,看着还是费劲。如果能把外文视频一键翻译成中文,还能配上自然的中文语音,那就太完美了。
前几天在 GitHub 上闲逛,发现了一个开源项目——pyVideoTrans,体验了一下,感觉还不错。

这个工具把语音识别、字幕翻译、AI 配音、音视频合成串成了一条自动化流水线,上传视频就能一键输出另一种语言的版本,效果还相当不错。
pyVideoTrans 是一款功能强大的开源视频翻译、语音转录、AI 配音、字幕翻译工具,由开发者 jianchang512 维护。
它的核心目标就是将视频从一种语言无缝转换为包含另一种语言配音和字幕的视频。
这个项目在 GitHub 上已经有 17.6K Star 了,属于热门项目了!

1、全自动视频翻译流水线
pyVideoTrans 最吸引人的地方就是它的全自动化流程。一个视频放进去,它会依次完成四个阶段的处理:
整个过程一键完成,不需要你一步步手动操作。
2、声音克隆,让配音听不出换人
这是一个非常惊艳的功能!pyVideoTrans 集成了 F5-TTS、CosyVoice、GPT-SoVITS 等声音克隆模型,支持零样本语音克隆。
也就是说,你只需要提供一小段原说话人的声音,它就能用相同的音色生成目标语言的配音,听起来就像原说话人自己在说另一种语言一样。
这个功能对于处理访谈、讲座等视频特别有用,能保持视频的连贯性和代入感。
3、多说话人识别,对话视频轻松处理
对于有多个人说话的视频,pyVideoTrans 支持说话人识别(Speaker Diarization),能够自动区分不同的说话人。
你可以给不同的说话人分配不同的 AI 配音角色,处理对话类视频时特别实用,不会出现所有人都用同一种声音的尴尬情况。
4、每个阶段都能暂停手动校对
虽然是自动化流程,但 pyVideoTrans 给了你充分的控制权。
在语音识别、字幕翻译、配音的每个阶段,你都可以暂停下来,手动校对和修改,确保最终效果完全符合你的要求。识别不准的地方可以改,翻译不对的地方可以调,不满意的配音可以换。
5、丰富的模型和 API 支持
pyVideoTrans 支持市面上主流的各种模型和 API,你可以根据自己的需求和预算选择:
语音识别(ASR):
字幕翻译:
语音合成(TTS):
6、开箱即用的 Windows 安装包
对于 Windows 用户来说,pyVideoTrans 提供了预打包的 .exe 版本,不需要配置 Python 环境,下载解压就能用,非常友好。
除了核心的视频翻译功能,pyVideoTrans 还集成了很多实用的工具:
Windows 用户(推荐)
Windows 用户使用预打包版本最简单:
D:\pyVideoTrans(注意:路径不要包含中文、空格或特殊符号,也不要放在 C:\Program Files 等系统文件夹)sp.exe 启动软件首次启动可能需要几十秒甚至 2-3 分钟,请耐心等待。
源码部署(macOS / Linux / Windows 开发者)
如果你是开发者,或者使用 macOS/Linux,可以通过源码部署:
1. 环境要求:
2. 安装 uv(推荐的包管理工具):
# macOS/Linux
curl -LsSf https://astral.sh/uv/install.sh | sh
# Windows (PowerShell)
powershell -c "irm https://astral.sh/uv/install.ps1 | iex"3. 克隆项目并安装依赖:
git clone https://github.com/jianchang512/pyvideotrans.git
cd pyvideotrans
uv sync4. 启动软件:
# 启动 GUI 界面
uv run sp.py
# 或者使用 CLI
uv run cli.py --help5. (可选)GPU 加速配置: 如果你有 NVIDIA 显卡,可以安装 CUDA 版本的 PyTorch 加速处理:
uv remove torch torchaudio
uv add torch==2.7 torchaudio==2.7 --index-url https://download.pytorch.org/whl/cu128
uv add nvidia-cublas-cu12 nvidia-cudnn-cu12命令行使用示例
如果你需要批量处理,可以使用 CLI:
视频翻译:
uv run cli.py --task vtv --name "./video.mp4" --source_language_code zh --target_language_code en音频转字幕:
uv run cli.py --task stt --name "./audio.wav" --model_name large-v3字幕翻译:
uv run cli.py --task sts --name "./subtitle.srt" --target_language_code en文字配音:
uv run cli.py --task tts --name "./subtitle.srt" --voice_role "zh-CN-YunyangNeural" --target_language_code zh-cnpyVideoTrans 是一款功能全面、实用且开源的视频翻译工具,它把复杂的视频翻译流程简化成了一键操作,还支持声音克隆、多说话人识别等高级功能。对于经常需要处理外文视频的朋友来说,这个工具绝对值得一试。
项目的文档也非常完善,官方网站提供了详细的教程和 FAQ,还有在线问答社区,遇到问题可以随时求助。
如果你对这个项目感兴趣,不妨去 GitHub 上给它点个 Star,支持一下开发者。
GitHub: https://github.com/jianchang512/pyvideotrans
如果本文对您有帮助,也请帮忙点个 赞👍 + 在看 哈!❤️
在看你就赞赞我!