语音 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签语音

#语音

老婆问我什么是多模态能力

不惑

腾讯云TDP ｜产品KOL (已认证)

3小时前2026-07-10 19:50:40

那天晚上，我躺在沙发上刷手机，老婆突然从厨房探出头来问我："你天天看那些AI新闻，我问你个事儿——什么叫多模态能力？我看好多文章都在说这个词，感觉很厉害的样子。...

100

写作和思考，应该被AI改变么？

程序新视界 4小时前2026-07-10 18:23:22

自己常年保持着写作输出的习惯（包括技术类文章、个人思考以及日记记录等），截止目前，今年的日记字数已经突破四万字了。

700

AI（原生）产品中如何平衡自然语言交互与GUI交互？（第二讲）

程序新视界 5小时前2026-07-10 18:21:09

在写完《“提供溢出的情绪价值”是AI产品极具可能性的方向》这篇文章之后，感觉有必要针对“AI产品”从产品视角写一个系列。目的和初衷也很简单，那就是倒逼自己去发现...

200

在 AI 面前，不要再“端着”说话了

桑榆肖物 2天前2026-07-08 17:11:56

作为一个每天高强度使用 AI 辅助编程的人，我对大模型的各种“脾气”算是摸得比较熟了。从写代码、查 Bug，到拆需求、整理思路，AI 已经成了我工作流里很重要的...

8610

个人办公 AI 选型指南：桌面 AI 智能体平台怎么选

hollyx 2天前2026-07-08 17:00:28

摘要：个人用户选桌面 AI 智能体，更看重上手门槛、免费额度与单兵生产力。本文从个人视角对比主流平台，给出可按需套用的选型思路。一、个人为何需要桌面 AI ...

12610

我在地铁上用手机写完了一个网页，Trae手机版实测

袁锐钦 2天前2026-07-08 16:39:38

操作路径：打开Trae App → 点击底部输入框 → 语音或文字输入指令 → 选择执行设备（云端/我的电脑）→ 等结果推送。

9110

语音钓鱼受害非现场理赔与交易标识优化监管机制研究

芦笛

中国互联网络信息中心｜工程师 (已认证)

6天前2026-07-04 07:55:38

语音钓鱼（Voice Phishing）长期成为韩国金融领域高频电信诈骗类型，传统线下网点提交理赔材料的处置模式存在流程繁琐、受害群众维权成本高、资金止付溯源效...

10510

牛！一款国产AI语音登顶全球第一，首个可编辑语音模型来了！

开源星探 7天前2026-07-03 12:56:34

无论是短视频配音、有声书制作，还是游戏角色语音生成，AI语音都在深刻改变着我们的创作方式。

35010

Claude Code 语音模式上线！按住空格说话，Coding 效率直接起飞

用户1640761 9天前2026-07-01 21:50:06

各位正在用 Claude Code 刷终端、修 Bug、建 Feature 的 coder 们，好消息直接砸脸了！

14110

Voicebox：本地优先的 AI 语音工作室

山行AI 9天前2026-07-01 18:28:40

这就是 Voicebox 的核心价值：它把语音输入、语音输出、语音创作和 Agent 语音交互放在同一个本地闭环里。

38210

PHP Neuron V3 正式全面支持多模态

Tinywan 9天前2026-07-01 15:01:49

这些组件对于创建本地语音助手以实现免提与模型交互非常有帮助。典型的流程包括捕获音频，使用单独的语音转文本（STT）服务将其转录为文本，将文本发送到代理进行处理，...

11910

AI 赋能自动语音诈骗全链路检测与 STIR/SHAKEN 协同防御研究

芦笛

中国互联网络信息中心｜工程师 (已认证)

9天前2026-07-01 11:19:37

AI 技术规模化普及推动自动语音外呼（Robocall）、语音钓鱼、垃圾骚扰通信形成产业化黑产，传统静态黑名单、单一号码拦截手段难以适配攻击者动态规避策略。美国...

13910

Shopify Shop 应用虚假订单收据语音钓鱼攻击机理与防护研究

芦笛

中国互联网络信息中心｜工程师 (已认证)

10天前2026-06-30 10:53:11

移动端统一订单聚合类 App 依托多渠道订单同步能力简化用户购物查询流程，但数据聚合机制带来的信任边界模糊问题催生新型社会工程钓鱼攻击。本文以 2026 年 6...

15310

DevSecOps 视角下语音钓鱼（Vishing）通信安全全链路防护研究

芦笛

中国互联网络信息中心｜工程师 (已认证)

10天前2026-06-30 10:00:09

AI 深度伪造语音技术普及推动网络攻击由邮件钓鱼（Phishing）向语音钓鱼（Vishing）迁移，传统 DevSecOps 体系仅聚焦代码、应用层安全，忽略...

11810

自部署 LiveKit 的降噪与回声消除：能力边界与工程选型

buzzfrog 12天前2026-06-28 11:37:07

这已经能覆盖很多常见场景。只有当用户环境很吵、语音识别准确率要求很高，或者存在多人背景说话干扰时，再考虑更强的降噪或语音隔离方案。

10410

Qwen3.5-Omni 技术报告精读：一个模型同时"看、听、说"，215 项 SOTA 正面挑战 Gemini

唐国梁Tommy 15天前2026-06-25 21:40:11

ARIA 的做法是在文本 token 与语音 token 之间做动态对齐，让 Talker 在生成每一段语音单元时，都能精确锚定到对应的语义片段。结果是：

20600

微软 VibeVoice：迈向超长、高质量、多人的对话语音生成

唐国梁Tommy 15天前2026-06-25 21:09:24

在AI语音合成领域，我们已经习惯了手机导航的清晰指引、智能音箱的简短应答。这些单一、短句的文本到语音（Text-to-Speech, TTS）技术已相当成熟。但...

14610

小微智能体v2.2：让陪伴智能体更像真的在你身边

陈宇明 15天前2026-06-25 09:15:29

在小微智能体v2.0 中，你可以直接在小程序里创建通用型智能体，用来做问答、客服、内容创作、学习助手等。

13310

美加墨世界杯裁判三件套

bisal 16天前2026-06-24 20:51:54

1. 哨子和麦克风：裁判嘴里含着传统的哨子，嘴边配有麦克风，用于与视频助理裁判(VAR)及场上其他裁判进行清晰的语音沟通。

17810

#语音

老婆问我什么是多模态能力

写作和思考，应该被AI改变么？

AI（原生）产品中如何平衡自然语言交互与GUI交互？（第二讲）

在 AI 面前，不要再“端着”说话了

个人办公 AI 选型指南：桌面 AI 智能体平台怎么选

我在地铁上用手机写完了一个网页，Trae手机版实测

语音钓鱼受害非现场理赔与交易标识优化监管机制研究

牛！一款国产AI语音登顶全球第一，首个可编辑语音模型来了！

Claude Code 语音模式上线！按住空格说话，Coding 效率直接起飞

Voicebox：本地优先的 AI 语音工作室

PHP Neuron V3 正式全面支持多模态

AI 赋能自动语音诈骗全链路检测与 STIR/SHAKEN 协同防御研究

Shopify Shop 应用虚假订单收据语音钓鱼攻击机理与防护研究

DevSecOps 视角下语音钓鱼（Vishing）通信安全全链路防护研究

自部署 LiveKit 的降噪与回声消除：能力边界与工程选型

Qwen3.5-Omni 技术报告精读：一个模型同时"看、听、说"，215 项 SOTA 正面挑战 Gemini

微软 VibeVoice：迈向超长、高质量、多人的对话语音生成

小微智能体v2.2：让陪伴智能体更像真的在你身边

美加墨世界杯裁判三件套

热门专栏

腾讯开源的专栏

腾讯云服务器团队的专栏

张善友的专栏

TEG云端专业号的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐