turnvoice：将youtube视频的声音重新翻译替换-凯发k8一触即发

2023年12月18日下午1:30 • 工具软件

项目简介

一个命令行工具，用于转换 (youtube) 视频中的语音，并具有附加翻译功能。它号称可以：
– 语音替换：去除人声轨道并重新组合以保留原始背景音频
– 对发言人分类：替换视频中特定说话人的声音

特征

语音转换
使用免费的 coqui tts 转语音，无需任何运营成本 (supports voice cloning)
声音种类
支持流行的 tts 引擎，例如 elevenlabs、openai tts 或 azure，以提供更多语音。2
翻译
由免费深度翻译器提供支持，零成本翻译视频。
改变说话风格 (ai powered)
使用提示，使每一个口语句子都以自定义的说话风格呈现，以获得独特的风格。
完全渲染控制
通过自定义句子文本、时间和语音选择来精确控制渲染。
本地视频处理
处理任何本地视频文件。
背景音频保存
保持原始背景音频完好无损。

安装

pip install turnvoice

为了使用 gpu 更快地渲染，请在安装后准备 cuda 环境：

for cuda 11.8 对于 cuda 11.8
pip install torch==2.1.1 cu118 torchaudio==2.1.1 cu118 –index-url https://download.pytorch.org/whl/cu118

for cuda 12.1 对于 cuda 12.1
pip install torch==2.1.1 cu118 torchaudio==2.1.1 cu211 –index-url https://download.pytorch.org/whl/cu211

用法

turnvoice [-i] <youtube url|id|local file> [-l] <translation language> -e <engine(s)> -v <voice(s)> -o <output file>

示例命令

arthur morgan 讲述烹饪教程：

turnvoice -i amc9smcbuj4 -v arthur.wav -o cooking_with_arthur.mp4

参数解释：

-i 、 –in ：输入视频。接受 youtube 视频 url 或 id，或本地视频文件的路径。
-l 、 –language ：翻译语言。coqui 合成支持：en、es、fr、de、it、pt、pl、tr、ru、nl、cs、ar、zh、ja、hu、ko。省略保留原始视频语言。
-il 、 –input_language ：转录的语言代码，自动检测失败时设置。
-v 、 –voice ：用于合成的声音。接受多个值来替换多个扬声器。
-o 、 –output_video ：最终输出视频的文件名（默认值：’final_cut.mp4’）。
-a 、 –analysis ：打印转录和说话人分析，无需合成或渲染视频。
-from ：开始处理视频的时间。
-to ：停止处理视频的时间。
-e 、 –engine ：用于合成的引擎。可以是 coqui、elevenlabs、azure、openai 或 system。接受多个值，链接到提交的声音。
-s 、 –speaker ：要转换的发言人编号。
-snum 、 –num_speakers ：帮助二值化。如果您事先知道，请指定视频中发言者的确切数量。
-smin 、 –min_speakers ：帮助二值化。如果您事先知道，请指定视频中的最少发言者人数。
-smax 、 –max_speakers ：帮助二值化。如果您事先知道，请指定视频中发言者的最大数量。
-dd 、 –download_directory ：保存下载文件的目录（默认值：“downloads”）。
-sd 、 –synthesis_directory ：保存合成音频文件的目录（默认值：’synthesis’）。
-exoff 、 –extractoff ：禁用从视频文件中提取音频。从互联网下载音频和视频。
-c 、 –clean_audio ：从最终视频中删除原始音频，从而获得清晰的合成效果。
-tf 、 –timefile ：定义要处理的时间戳文件（类似于多个 –from/–to 命令的功能）。
-p 、 –prompt ：定义提示以将样式更改应用于诸如“captain jack sparrow 的说话风格”之类的句子 3
-prep 、 –prepare ：编写包含说话人分析、句子转换和翻译的完整脚本，但不执行合成或渲染。可以继续。
-r 、 –render ：采用完整脚本，仅对其进行合成和渲染，但不进行说话人分析、句子转换或翻译。

-i 和 -l 可以用作位置参数和可选参数。

发生什么

早期 alpha / 正在进行中，因此可能会出现错误（请报告，需要注意修复）
可能并不总是能实现完美的唇形同步，尤其是在翻译成不同的语言时
说话人检测效果不太好，可能是做错了什么，或者技术 8 尚未准备好变得可靠
翻译功能目前处于实验原型状态（由 deep-translate 提供支持），但仍然产生非常不完美的结果
有时，合成可能会在音频中引入意外的噪音或失真（我们使用新的 v0.0.30 算法可以更好地减少伪影）
当源音频中同时出现口语和带有歌唱的背景音乐时，斯普利特可能会感到困惑

项目链接

https://github.com/koljab/turnvoice

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/yun271278.html

nbsp 定义音频

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

上一篇 2023年12月18日上午11:20

look scanned是一款pdf扫描工具

下一篇 2023年12月18日下午1:36

工具软件

tolan：人格化的 chatbot

tolan：人格化的 chatbot 一个友好的小外星人，你可以和他谈论任何事情，他甚至可以帮助你想象你的想法。看起来支持类似实时语音能力，小外星人的形象也可以自定义非常可爱

2024年9月20日
工具软件

advancedliveportrait：自定义面部表情动画

advancedliveportrait：自定义面部表情动画 live portrait 被玩出花了。advancedliveportrait 这个插件可以让你手动编辑人脸图片的表…

2024年9月20日
谷歌google

android 上的 chrome 现在是一款“画中画”应用程序

google chrome 现在有一个有价值的小功能，称为“最小化 chrome 标签页”，可让您在画中画窗口中最小化 chrome 自定义标签页。有了它，您可以打开本机应用程序的…

2024年5月31日
已解决：microsoft商店中缺少realtek音频控制台

https://u.jd.com/kz2klti 我们都使用microsoft商店作为应用程序的一站式商店，但是当realtek音频控制台丢失时，它引出了一个问题，这是商店问题还是…

2024年5月29日 • 微软microsoft
spotify 无损（几乎）在这里，但不要抱有希望！

经过多年的失望等待，spotify用户以研究的怀疑态度看待有关spotify无损音频的大多数泄漏和猜测。谁能责怪他们？自宣布以来已经三年了，几乎没有关于确切发布日期的消息！因此，每…

2024年5月20日 • 工具软件
谷歌 pixel 8a 如何重新定义整个中端智能手机细分市场

pixel 8a终于来了。谷歌最新的中端智能手机几乎没有被隐藏过，是几次泄密和谣言所暗示的一切。但是，随着规格的确定，我们现在可以更好地确定最新的a系列pixel设备的全部内容。 …

2024年5月20日 • 最新资讯
工具软件

krea ai 发布 ai 视频生成功能

krea ai 发布 ai 视频生成功能是可以定义首位帧的，而且每张图片对应的提示词都可以自定义。看起来像是之前发过的基于 ipadapter 的 animatediff 的工作…

2024年5月20日
cohere 发布 cohere toolkit ai 工具包

cohere 发布 cohere toolkit ai 工具包 cohere 发布 cohere toolkit ai 工具包，初始应用程序是一个知识助手。可以连接到企业数据并针…

工具软件 2024年5月10日
工具软件

chatgpt 体验优化

chatgpt 体验优化：现在 open ai 给免费的 gpt3.5 用户增加了使用速率限制，达到限制会要求注册账号。 “context connectors”，它的首次实现很…

2024年5月10日
工具软件

ai音乐生成工具udio发布

ai音乐生成工具udio发布音乐生成应用udio正式发布比suno有更多的自定义能力。同时整个软件的设计也更偏向内容消费，不只是单纯的当工具在做。前谷歌deepmind的顶尖a…

2024年5月10日
工具软件

谷歌发布了一堆ai能力和升级

谷歌发布了一堆ai能力和升级 google next 2024上周放出了不少狠货，这次 open ai 没能够压下去热度。首先是 gemini pro 1.5 进行了一大波升级，…

2024年5月10日
无法在iphone中发送音频消息：这是修复

无法在 iphone 上从 imessage 发送音频消息？音频消息始终优先于普通短信。它不仅速度快，而且比输入消息更方便。如果您无法发送音频消息，请不要担心。这些简短且易于实施的…

2024年5月3日 • 苹果apple
微软microsoft

microsoft 引入了新的 windows 11 24h2 更新 cpu 要求

microsoft 最近增强了即将推出的 windows 11 版本 24h2 的系统要求，表明有意阻止非常旧的处理器运行最新的操作系统。随着上个月向 canary 频道发布 wi…

2024年4月25日
win 11

被黑客利用的windows dos到nt路径转换过程

safebreach 安全研究员 or yair 最近公布了 windows dos 到 nt 路径转换过程中的一系列漏洞，这些漏洞可能允许攻击者在不需要管理权限的情况下获得类似 …

2024年4月25日
微软microsoft

microsoft 由于错误警报而暂时撤回 outlook 安全更新

microsoft 最近撤回了 outlook 的安全更新，因为发现它在用户打开 ics 日历文件时会导致不正确的安全警报。该问题是在 12 月针对 outlook 桌面应用程序的…

2024年4月25日
工具软件

microsoft 通过最新的修补程序更新解决了 exchange server 问题，并添加了 ecc、hma 支持

microsoft 宣布发布修补程序更新，旨在解决在安装 2024 年 3 月安全更新后影响 exchange 服务器的几个问题。除了修复这些问题之外，2024 年 4 月修补程序…

2024年4月25日
已解决：帐户图片错误此图片无法保存

帐户头像错误。当您尝试在 windows 上为用户帐户设置个人资料图片时，屏幕上出现此图片无法保存错误消息，任何人都可能发生此图片。除了基本身份识别外，设置个人资料图片还可以帮助…

2024年4月19日 • 工具软件
此连接不是iphone中safari上的私人错误：修复

在iphone上通过safari浏览网站时，您可能会遇到此错误提示“此连接不是私人的”消息。有很多可能的原因可以归咎于此。如果您按照以下步骤对 safari 中的问题进行故障排除，…

2024年4月16日 • 苹果apple
如何使用 powertoys 在 windows 上查看音频文件

powertoys 中的 peek 实用程序现在支持预览音频文件。从 powertoys 版本 0.80.0 开始，您将能够查看多种音频文件格式的内容，而无需在其专用应用程序中打开…

2024年4月11日 • win 11
远程桌面无法验证远程计算机的身份：修复

远程桌面连接或 rdc 并非完全防错。有很多设置可能会影响远程桌面连接。连接到远程桌面系统时，可能会出现此错误消息“远程桌面无法验证远程计算机的身份”。通常，主机和远程设备之间的时…

2024年4月1日 • 工具软件
ms outlook中未显示的组日历：组

集团日历总结了即将举行的活动并记录了重要会议，以保持可持续的工作流程。但是，如果组日历未显示在 microsoft outlook 中怎么办？鉴于所有组成员都使用组日历，这可能会很…

2024年4月1日 • 工具软件
excel visual basic中的运行时错误13类型不匹配：修复

在 excel 电子表格中执行 visual basic 代码时，您可能会遇到以下“运行时错误 13.类型不匹配“提示。visual basic 应用程序模块可帮助您增强工作表。但…

2024年3月29日 • 工具软件
微软microsoft

微软为厂商定义 ai pc：必须配备 copilot 键

英特尔、微软、高通以及 amd 等科技巨头，近月来一直在推广所谓的「ai pc」概念。虽然我们仍在等待微软就其windows中人工智能大计的更多细节进行分享，英特尔已开始公布微软…

2024年3月29日
工具软件

array.prototype.map（）期望从箭头函数：fix 返回值

javascript 中可能会弹出错误提示“array.prototype.map（） expects a return value from arrow function”（ar…

2024年3月28日
工具软件

20 种专为内容创作者设计的 ai 工具

20 种专为内容创作者设计的 ai 工具在快节奏的内容创作世界中，人工智能（ai）改变了游戏规则。它提供了大量的工具来简化创作过程，使您能够以更高的效率制作引人入胜的高质量内…

2024年3月28日