音频 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签音频

#音频

video-use：Agent 剪视频的关键，不是“看视频”，而是“读视频”

唐斩 2小时前2026-07-11 09:31:31

我最近看到 browser-use/video-use 这个开源项目，它把视频剪辑这件事，重新翻译成了 Agent 可以阅读、判断、执行和自检的工程流程。

100

影石Mic Air x TRAE 无线麦「Vibe Coding 版」来了！这设计，老罗看了都想当场退役

不惑

腾讯云TDP ｜产品KOL (已认证)

15小时前2026-07-10 20:30:29

联名款嘛，市面上见得多了，大多是换个配色贴个logo，核心体验没什么变化.但影石和TRAE这次搞的这个东西，拆开包装的那一刻我就知道，这次不太一样。

900

HappyHorse 是谁家的，这个问题今天炸了全球AI圈

不惑

腾讯云TDP ｜产品KOL (已认证)

15小时前2026-07-10 20:21:00

一款名为 HappyHorse-1.0 的文本转视频模型，悄然登顶权威 AI 评测平台 Artificial Analysis 的 AI Video Arena...

700

写作和思考，应该被AI改变么？

程序新视界 17小时前2026-07-10 18:23:22

自己常年保持着写作输出的习惯（包括技术类文章、个人思考以及日记记录等），截止目前，今年的日记字数已经突破四万字了。

2300

做一本100万字的有声书大概多少钱？从画本、演播、后期到审听完整拆解有声书制作成本

声音那些事 1天前2026-07-09 18:41:37

最根本的原因，是有声书的制作模式不同。而在每种模式背后，AI技术的深度介入，也正在悄然改变着有声书制作流程中每一个环节的成本结构。

3010

【直播】AI时代的“工具价值”：还需要学习软件吗？

Tableau喜乐君 2天前2026-07-08 20:22:51

以下是话题二（技术公式与AI）、话题三（分析师职业终局）、话题四（工具与思维训练）的完整精修逐字稿。

6800

19K stars：Meetily 把会议录音从云端搬回本机

智能时代蛮子 2天前2026-07-08 15:30:05

Meetily 是一款基于 Tauri + whisper.cpp + Ollama 的全本地 AI 会议助手，把 Otter.ai / Fireflies.a...

12610

一本小说真的可以一键变成多人有声剧吗？全自动AI多播有声剧生产流程揭秘

声音那些事 3天前2026-07-07 15:10:13

全自动方案的生产成本较传统人工制作有显著降低，具体因所选模型方案、音色数量和音频质量要求而异。对比传统人工制作通常需要的成本，差距在一个数量级以上。⚠ 实际成本...

9410

ICML 2026 | 一个模型，统一人、物、声、动作:OmniShow把多模态可控视频生成卷成系统工程！

AI生成未来 7天前2026-07-03 19:51:03

更妙的是，gating vector 顺便当了一把"探针"：通过观察 gate norm，团队发现音频影响集中在 dual-stream blocks，于是只在...

13200

牛！一款国产AI语音登顶全球第一，首个可编辑语音模型来了！

开源星探 7天前2026-07-03 12:56:34

传统的语音克隆需要提供一段说话人的音频，以及对应的准确文字内容。但ViiTorVoice首创了"无参考文本（Zero-Shot）"的跨语种语音克隆能力，你只需要...

35510

多模态大模型落地：开发者最该避开的三个坑

用户12493922 8天前2026-07-03 06:42:52

14410

多模态大模型实战：从选型到落地指南

用户12493922 8天前2026-07-03 00:45:49

12010

有声书到底是怎么做出来的？全面解析有声书制作体系、产业生态与未来趋势

声音那些事 4天前2026-07-06 15:31:50

从版权授权、商业模式、文本工程、导演统筹、录音制作、声音后期、质量控制，到平台发行、国内外制作模式比较，以及 AI 技术带来的行业变革与未来趋势，系统梳理有声书...

13510

从技术视频到短视频：AI辅助剪辑全流程技术复盘

heidsoft 9天前2026-07-02 10:53:58

A: 检查是否使用了 -an 参数（禁止音频）。竖屏转制时如果不需要单独处理音频，应去掉该参数。

13610

登上 GitHub 日榜 TOP5，收获 1.2 万标星的自动剪辑视频开源工具。

开源星探 9天前2026-07-01 19:26:14

前两天看到一个自动剪视频的开源项目，只需要对着 AI 说："把这些剪成一条发布视频"，然后，它就自动去口癖、调颜色、加字幕，甚至做动画。

59010

Voicebox：本地优先的 AI 语音工作室

山行AI 9天前2026-07-01 18:28:40

Captures 则把每次听写、应用内录音、上传音频都保存下来：原始音频、transcript、重新转写、refine、inline edit、转成 voice...

38810

PHP Neuron V3 正式全面支持多模态

Tinywan 9天前2026-07-01 15:01:49

通常纯 AI 音频服务不支持工具和对话等完整的代理能力。因此，您可以将这些组件作为独立服务在代理工作流程中使用，或者因为它们实现了 AIProviderInte...

12010

LTX2.3 最强导演台工作流来了！一键实现「视频参考 + 相机运动控制 + 音频驱动」附工作流踩坑记录

疯狂的KK 11天前2026-06-29 13:48:58

如果一个视频的运镜非常的炫酷，但是对专业的运镜又不懂，那么怎么实现？反推视频？又不够细节，我们生图都可以参考图，如果视频能够严格遵循轨迹运动就好了，LT...

32010

国外大学生都用FPGA做什么项目（十六）

FPGA技术江湖 11天前2026-06-29 13:04:02

阔别已久的大学生项目，今天又开始了，主要是2024年和2026年两年的（之前是到2023年的）。

12610

#音频

video-use：Agent 剪视频的关键，不是“看视频”，而是“读视频”

影石Mic Air x TRAE 无线麦「Vibe Coding 版」来了！这设计，老罗看了都想当场退役

HappyHorse 是谁家的，这个问题今天炸了全球AI圈

写作和思考，应该被AI改变么？

做一本100万字的有声书大概多少钱？从画本、演播、后期到审听完整拆解有声书制作成本

【直播】AI时代的“工具价值”：还需要学习软件吗？

19K stars：Meetily 把会议录音从云端搬回本机

一本小说真的可以一键变成多人有声剧吗？全自动AI多播有声剧生产流程揭秘

ICML 2026 | 一个模型，统一人、物、声、动作:OmniShow把多模态可控视频生成卷成系统工程！

牛！一款国产AI语音登顶全球第一，首个可编辑语音模型来了！

多模态大模型落地：开发者最该避开的三个坑

多模态大模型实战：从选型到落地指南

有声书到底是怎么做出来的？全面解析有声书制作体系、产业生态与未来趋势

从技术视频到短视频：AI辅助剪辑全流程技术复盘

登上 GitHub 日榜 TOP5，收获 1.2 万标星的自动剪辑视频开源工具。

Voicebox：本地优先的 AI 语音工作室

PHP Neuron V3 正式全面支持多模态

LTX2.3 最强导演台工作流来了！一键实现「视频参考 + 相机运动控制 + 音频驱动」附工作流踩坑记录

国外大学生都用FPGA做什么项目（十六）

热门专栏

腾讯开源的专栏

进击的Coder

贤羽的前端小栈

张善友的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

#音频

video-use：Agent 剪视频的关键，不是“看视频”，而是“读视频”

影石Mic Air x TRAE 无线麦「Vibe Coding 版」来了！这设计，老罗看了都想当场退役

HappyHorse 是谁家的，这个问题今天炸了全球AI圈

写作和思考，应该被AI改变么？

做一本100万字的有声书大概多少钱？从画本、演播、后期到审听完整拆解有声书制作成本

【直播】AI时代的“工具价值”：还需要学习软件吗？

19K stars：Meetily 把会议录音从云端搬回本机

一本小说真的可以一键变成多人有声剧吗？全自动AI多播有声剧生产流程揭秘

ICML 2026 | 一个模型，统一人、物、声、动作:OmniShow把多模态可控视频生成卷成系统工程！

牛！一款国产AI语音登顶全球第一，首个可编辑语音模型来了！

多模态大模型落地：开发者最该避开的三个坑

多模态大模型实战：从选型到落地指南

有声书到底是怎么做出来的？全面解析有声书制作体系、产业生态与未来趋势

从技术视频到短视频：AI辅助剪辑全流程技术复盘

登上 GitHub 日榜 TOP5，收获 1.2 万标星的自动剪辑视频开源工具。

Voicebox：本地优先的 AI 语音工作室

PHP Neuron V3 正式全面支持多模态

LTX2.3 最强导演台工作流来了！一键实现「视频参考 + 相机运动控制 + 音频驱动」 附工作流踩坑记录

国外大学生都用FPGA做什么项目（十六）

腾讯开源的专栏

进击的Coder

贤羽的前端小栈

张善友的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

LTX2.3 最强导演台工作流来了！一键实现「视频参考 + 相机运动控制 + 音频驱动」附工作流踩坑记录