首页
学习
活动
专区
圈层
工具
发布
首页标签语音合成

#语音合成

拟真高效的文本转语音服务

有字幕,没配音?用浏览器自带语音能力,让网页视频直接“开口说话”

桑榆肖物

如果还想继续往停顿、重音、局部语速、角色风格这些更细的维度走,那就不得不提一下 Azure 语音合成服务的SSML1。它本质上是一套基于 XML 的语音合成标记...

3810

语音合成中的韵律建模新方法

用户11764306

在ICASSP 2021上,某机构的文本到语音团队展示了两篇关于从文本合成具有上下文恰当韵律(即语音的节奏、重音、旋律、时长和响度)的语音的新论文。文本到语音(...

15410

从自回归到掩码生成:拆解零样本 TTS 在长视频配音场景下的技术路径

用户12383947

做过短剧出海或者影视译配的工程师大概都遇到过这样一个场景:拿一段十分钟的中文剧情,翻译成英文之后用一个看起来效果不错的 TTS 模型合成配音,前两分钟听起来非常...

15510

语音钓鱼(Vishing)统计特征、技术机理与全链路防御研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

语音钓鱼(Vishing)依托号码仿冒、AI 语音克隆与实时社会工程学交互,已成为 2025—2026 年全球增长最快的网络攻击形式之一。SQ Magazine...

12910

跨部门协同治理下语音钓鱼防控效能提升与技术实现研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

本文以韩国政府跨部门电信金融诈骗综合应对小组成立半年来的治理实践为研究样本,结合警方公开数据与技术防控机制,系统分析语音钓鱼案件数量下降 31.6%、涉案损失下...

14910

TTS文字转语音芯片选型指南:串口驱动、音质、功耗一次说清

用户12353126

嵌入式产品加语音播报,看起来是个小功能,但选型如果没选对,后面会有很多麻烦。这篇文章从三个最核心的维度——串口驱动方式、音质、功耗——把TTS芯片选型的关键点说...

7500

10个GitHub热门的配音/语音合成/语音克隆项目

搜罗万相

这里推荐几个GitHub上热门、好用的配音/语音合成/语音克隆项目,有通用TTS、语音克隆、视频配音、流式/轻量等不同需求的。

74110

Interspeech 2023论文速览:语音识别与对话AI技术

用户11764306

语音识别占据主导地位,但某机构的研究还涉及数据表示、对话管理、问答系统等多个领域。

9410

基于语音钓鱼的Aura客户数据泄露机制与防御架构研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着通信技术的演进,网络攻击正从传统的文本钓鱼向更具欺骗性的语音钓鱼(Vishing)形态演变。近期,智能照明品牌Aura遭遇的客户数据泄露事件,揭示了攻击者利...

16110

韩国语音钓鱼案件中资金隐匿机制与检方补充侦查策略研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着信息通信技术的迭代升级,电信网络诈骗犯罪呈现出组织化、智能化及非接触化的显著特征。其中,语音钓鱼(Voice Phishing)作为传统社会工程学攻击的现代...

14710

ICASSP 2022:语音转换与数据增强技术新突破

用户11764306

在《Voice Filter: Few-shot text-to-speech speaker adaptation using voice conversio...

7610

从零搭建一个免费的文本转语音在线工具(基于 Edge TTS)

西门吹雪1997

最近有个需求,需要把一段文字转换成语音,找了几个在线工具,要么收费,要么有水印,要么音质惨不忍睹。后来发现微软 Edge 浏览器的 TTS(Text-to-Sp...

1.2K10
领券