搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏深度学习|机器学习|歌声合成|语音合成
基于HMM的语音识别搭建（未用HTK）
1.最近研究语音识别，就顺便研究了一下隐马尔科夫链。 2.其中核心代码为： 3.训练样本数据集，请联系作者。
1.4K10发布于 2021-01-14
来自专栏深度学习|机器学习|歌声合成|语音合成
HTS音源训练教程
1.HTK安装方法 HTK:始于剑桥大学工程系，后被微软收购。版权属于微软的。一、下载安装包下载两个安装包（下载链接）分别是HTK-3.5.beta-2.tar.gz以及HDecode-3.5.beta-1.tar.gz 二、安装所需要的依赖库 1\. sudo apt-get libx11-dev sudo apt-get install g++-multilib sudo apt-get install osspd } 三、解压编译安装 1、解压 tar xzf HTK -3.5.beta-2.tar.gz tar xzf HDecode-3.5.beta-1.tar.gz 2、编译 1> HTK 3.5带有三套Makefiles（在这里以 CPU (standard HTK 3.5（可以不更改，我没有更改）。
78720发布于 2021-01-14
来自专栏深度学习|机器学习|歌声合成|语音合成
2019年最新中文TTS算法实现个合成样本
│ ├── validation.py │ └── work_in_progress └── tools ├── COPYING ├── ChangeLog ├── HTK -3.4.1.tar.gz.1 ├── HTS-2.3alpha_for_HTK-3.4.1.patch ├── HTS-2.3alpha_for_HTK-3.4.1.tar.bz2 ├── HTS-2.3alpha_for_HTK-3.4.1.tar.bz2.1 ├── HTS_Document.pdf ├── INSTALL ├── INSTALL.md ─ README ├── REAPER ├── SPTK-3.9 ├── WORLD ├── WORLD_v2 ├── bin ├── compile_htk.sh ─ compile_tools.sh ├── compile_unit_selection_tools.sh ├── festival ├── festvox ├── htk
1.5K20发布于 2021-01-14
来自专栏数据派THU
独家 | 一文读懂语音识别（附学习资源）
，HTK Book。工具包 HTK HTK（ http://htk.eng.cam.ac.uk ）是剑桥大学开发的一个非常经典的语音识别工具包，全球大约有10万专业用户。 HTK的最大优点是代码和功能非常稳定，并且集成的都是最主流的语音识别技术；并且HTK的很多扩展包本身也非常经典，比如最重要的统计语音合成工具包HTS。 HTK的另一大优点是它有相对最完善的文档手册，也就是前文提到的HTK Book。HTK的缺点之一是更新相对缓慢，并且部分代码由于编写时间比较久，需要一定的更新。另外值得一提的是，Dan Povey博士也是HTK的作者之一，于是Kaldi和HTK的技术思路比较相近，但经过若干年的发展，Kaldi集成的技术已经多于HTK。
3.1K60发布于 2018-01-30
来自专栏AI研习社
横评：五款免费开源的语音识别工具
为此，我们对比了五款基于 HMM 和 N-gram 模型的语音识别工具：CMU Sphinx，Kaldi，HTK，Julius 和 ISIP。另外，HTK 并不是严格开源的，它的代码并不能重新组织发布，也不能用于商业用途。想知道更多语音识别工具的用户请点击以下链接，其中列出了几乎所有开源/非开源的语音识别工具，非常全面。 HTK 始于 1989 年的剑桥大学，曾一度商业化，但目前又回归剑桥。如前所述 HTK 现在并不是一款严格意义的开源工具，而且更新缓慢（虽然它的最新版本更新于 2015 年 12 月，但前一个版本的更新时间却是 2009 年，中间隔了差不多 6 年时间）。如果你并不熟悉语音识别，那么可以通过对 HTK 官方文档（注册后可以使用）的学习对该领域有一个概括的认识。同时，HTK 的文档还适用于实际产品设计和使用等场景。
7.6K130发布于 2018-03-29
来自专栏奋飞安全
安卓高版本安装系统证书 HTTPS 抓包 - 终极解决方案
Show me the Code # htk-inject-system-cert.sh set -e # Fail on error # Create a separate temp directory Without this, when we add the mount we can't read the current certs anymore. mkdir -m 700 /data/local/tmp/htk-ca-copy # Copy out the existing certificates cp /system/etc/security/cacerts/* /data/local/tmp/htk-ca-copy/ cacerts # Copy the existing certs back into the tmpfs mount, so we keep trusting them mv /data/local/tmp/htk-ca-copy /etc/security/cacerts/* # Delete the temp cert directory & this script itself rm -r /data/local/tmp/htk-ca-copy
12.1K40编辑于 2023-03-08
来自专栏机器之心
资源 | 横向对比5大开源语音识别工具包，CMU Sphinx最佳
2014 年 Gaida 等人的一篇论文评估了 CMU Sphinx、Kaldi 和 HTK。其中 HTK 严格意义上来说并不是开源的，因为其代码并不能重用或作为商业用途使用。 HTK 始于 1989 年的剑桥大学，已经商用一段时间了，但是现在它的版权又回到了剑桥大学并且已经不是开源软件了。它的最新版本更新于 2015 年 12 月，先前发布于 2009 年。 HTK 也有讨论群但是没有开放资源库。Julius 网站上的用户论坛坏掉了，但是在日本站里可能有更多的信息。ISIP 主要用于教育目的，而且邮件清单档案现在已经不再实用。如果你缺乏语音识别的知识，HTK 的教程文档（注册用户可看）对这一领域有详尽的描述。
3.4K60发布于 2018-05-08
来自专栏小鹏的专栏
[语音识别] 01 语音识别概述
aidatatang_200zh，200小时，开源(http://openslr.org/62/) • MAGICDATA，755小时，开源(http://openslr.org/68/) 工具包 • HTK : http://htk.eng.cam.ac.uk/ (c) • Kaldi: http://kaldi-asr.org/ (c++, python)【推荐】 • ESPNet: https://
4.9K20发布于 2020-03-25
来自专栏深度学习|机器学习|歌声合成|语音合成
歌声合成方法和工具总结1
octave, cents])：将midi数字转化为音符符号 note_to_midi(note[, round_midi])：音符符号转化为midi数字格式 hz_to_mel(frequencies[, htk ])：频率转化为梅尔谱 hz_to_octs(frequencies[, A440])：频率转化为八度音符 mel_to_hz(mels[, htk])：梅尔谱到频率转化 octs_to_hz(octs [, A440])：八度音符到频率转化 fft_frequencies([sr, n_fft])： mel_frequencies([n_mels, fmin, fmax, htk])：梅尔谱到频率的转化
1.6K10发布于 2021-01-14
来自专栏Pulsar-V
SLAM初探（三）
) Numpy(python) Matplotlib(python) Scipy(python) CUDA OpenCL Boost 除此之外笔者还用过一些比较少见的辅助框架，主要使用在语音识别当中 HTK Sphinx 注：下载HTK时需要注册一个账号,邮箱请使用国外邮箱，如OutLook,Gmail等邮箱才能接收到来自HTK官方网站欧洲的来信。
1.1K50发布于 2018-04-18
来自专栏算法工程师的学习日志
语音识别的一些开源项目整理
thu-spmi/CAT （14）torchaudio star数量：1.5k 工具特点：pytorch的audio库链接：https://github.com/pytorch/audio （15）htk 链接：https://htk.eng.cam.ac.uk/2、其他工具包 2、其他功能型工具包/库（1）kaldiio 链接：https://github.com/nttcslab-sp/kaldiio
3.6K30编辑于 2022-07-27
来自专栏深度学习|机器学习|歌声合成|语音合成
基于DNN的歌声演唱系统的测试结果
演唱引擎简单的描述思路样本：wav 和对应乐谱xml格式样本的预处理 wav需要运用ffmpeg软件转化为raw格式的文件 xml格式的乐谱需要借助festival 或者praat 或者HTK
63730发布于 2021-01-14
来自专栏深度学习|机器学习|歌声合成|语音合成
语音识别调研报告
1.1 核心的框架HTK包 - 2. 人工神经网络，也就是DNN方法。 - - 2.1 主流的语音识别解码器为（WFST)：该解码器把语言模型和声学模型集成为一个大的网络，大大的提高了解码速度。
5.1K40发布于 2021-01-14
来自专栏鸿蒙开发笔记
基于 OpenHarmony 音符检测实现原理
bands - uniformly spaced between limits mel_f = mel_frequencies(n_mels + 2, fmin=fmin, fmax=fmax, htk =htk) fdiff = np.diff(mel_f) ramps = np.subtract.outer(mel_f, fftfreqs) for i in range(n_mels
40010编辑于 2024-07-30
来自专栏云时之间
NLP入门-学习路径
:HMM的三个基本问题 15:NLP的基本解码问题求解 16:NLP的基本序列问题求解 17:HMM的参数估计与训练 18:EM算法 19:HMM的应用 20:层次化马尔科夫模型和马尔科夫网络 21:HTK
82990发布于 2018-04-11
来自专栏新智元
语音界传奇Dan Povey突遭美霍普金斯大学解雇，计划转投中国
有趣的是，Dan Povey 也是剑桥大学语音识别工具包 HTK 的作者之一，他是领导 HTK 工具包开发的 Phil Woodland 教授的学生。经过若干年的发展，Kaldi 集成的技术已经多于 HTK，老师开发了第一代语音识别开源软件，学生开发了第二代语音识别开源软件。
93330发布于 2019-08-23
来自专栏MySQL入坑记
人工智能 - 语音识别的技术原理是什么
The HTK book (v3.4). Cambridge University, 2006. HTK Book，开源工具包HTK的文档。虽然现在HTK已经不是最流行的了，但仍然强烈推荐按照书里的第二章流程做一遍，你可以搭建出一个简单的数字串识别系统。 4. Graves A.
3.8K20发布于 2020-07-06
来自专栏小馒头学Python
三、get请求和post请求
FxDOJeC62ZAYIcbf9ihcjNK1U26H3ITTH6aouo2rOtPcNaxu0uzyEG0PXU8g0Kub-FL1ogKKQmOTHACF_2uxOjjg8UtVJeC6EG0Ptf8g0f5; H_BDCLCKID_SF=JnItoI_htK03q5rcbJQEbCCShGRmBbQ9WDTm_D_XLRjEMPoIetrsKPINyNQPXPbeK6 FxDOJeC62ZAYIcbf9ihcjNK1U26H3ITTH6aouo2rOtPcNaxu0uzyEG0PXU8g0Kub-FL1ogKKQmOTHACF_2uxOjjg8UtVJeC6EG0Ptf8g0f5; H_BDCLCKID_SF_BFESS=JnItoI_htK03q5rcbJQEbCCShGRmBbQ9WDTm_D_XLRjEMPoIetrsKPINyNQPXPbeK6
1.8K50编辑于 2023-11-12
来自专栏devops探索
k8s解决pod调度不均衡的问题
descheduler I0729 08:48:45.399567 1 evictions.go:102] Evicted pod: "flink-taskmanager-7c7557d6bc-t2htk I0729 08:48:45.399613 1 lownodeutilization.go:270] Evicted pod: "flink-taskmanager-7c7557d6bc-t2htk 278] Event(v1.ObjectReference{Kind:"Pod", Namespace:"default", Name:"flink-taskmanager-7c7557d6bc-t2htk
17.1K66发布于 2020-07-31
来自专栏Linux内核深入分析
Linux音频驱动-OSS和ALSA声音系统简介及其比较
概述昨天想在Ubuntu上用一下HTK工具包来绘制语音信号的频谱图和提取MFCC的结果，但由于前段时间把Ubuntu升级到13.04，系统的声卡驱动是ALSA（Advanced Linux Sound Architecture，高级Linux声音体系），而不是HTK中所使用的OSS（Open Sound System，开放声音系统）。
6.8K31发布于 2020-03-24

第 2 页第 3 页

点击加载更多

基于HMM的语音识别搭建（未用HTK）

HTS音源训练教程

2019年最新中文TTS算法实现个合成样本

独家 | 一文读懂语音识别（附学习资源）

横评：五款免费开源的语音识别工具

安卓高版本安装系统证书 HTTPS 抓包 - 终极解决方案

资源 | 横向对比5大开源语音识别工具包，CMU Sphinx最佳

[语音识别] 01 语音识别概述

歌声合成方法和工具总结1

SLAM初探（三）

语音识别的一些开源项目整理

基于DNN的歌声演唱系统的测试结果

语音识别调研报告

基于 OpenHarmony 音符检测实现原理

NLP入门-学习路径

语音界传奇Dan Povey突遭美霍普金斯大学解雇，计划转投中国

人工智能 - 语音识别的技术原理是什么

三、get请求和post请求

k8s解决pod调度不均衡的问题

Linux音频驱动-OSS和ALSA声音系统简介及其比较

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐