拟真高效的文本转语音服务
如果还想继续往停顿、重音、局部语速、角色风格这些更细的维度走,那就不得不提一下 Azure 语音合成服务的SSML1。它本质上是一套基于 XML 的语音合成标记...
在ICASSP 2021上,某机构的文本到语音团队展示了两篇关于从文本合成具有上下文恰当韵律(即语音的节奏、重音、旋律、时长和响度)的语音的新论文。文本到语音(...
做过短剧出海或者影视译配的工程师大概都遇到过这样一个场景:拿一段十分钟的中文剧情,翻译成英文之后用一个看起来效果不错的 TTS 模型合成配音,前两分钟听起来非常...
中国互联网络信息中心 | 工程师 (已认证)
语音钓鱼(Vishing)依托号码仿冒、AI 语音克隆与实时社会工程学交互,已成为 2025—2026 年全球增长最快的网络攻击形式之一。SQ Magazine...
本文以韩国政府跨部门电信金融诈骗综合应对小组成立半年来的治理实践为研究样本,结合警方公开数据与技术防控机制,系统分析语音钓鱼案件数量下降 31.6%、涉案损失下...
嵌入式产品加语音播报,看起来是个小功能,但选型如果没选对,后面会有很多麻烦。这篇文章从三个最核心的维度——串口驱动方式、音质、功耗——把TTS芯片选型的关键点说...
这里推荐几个GitHub上热门、好用的配音/语音合成/语音克隆项目,有通用TTS、语音克隆、视频配音、流式/轻量等不同需求的。
语音识别占据主导地位,但某机构的研究还涉及数据表示、对话管理、问答系统等多个领域。
随着通信技术的演进,网络攻击正从传统的文本钓鱼向更具欺骗性的语音钓鱼(Vishing)形态演变。近期,智能照明品牌Aura遭遇的客户数据泄露事件,揭示了攻击者利...
随着信息通信技术的迭代升级,电信网络诈骗犯罪呈现出组织化、智能化及非接触化的显著特征。其中,语音钓鱼(Voice Phishing)作为传统社会工程学攻击的现代...
在《Voice Filter: Few-shot text-to-speech speaker adaptation using voice conversio...
最近有个需求,需要把一段文字转换成语音,找了几个在线工具,要么收费,要么有水印,要么音质惨不忍睹。后来发现微软 Edge 浏览器的 TTS(Text-to-Sp...