首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏深度学习|机器学习|歌声合成|语音合成

    基于HMM的语音识别搭建(未用HTK

    1.最近研究语音识别,就顺便研究了一下隐马尔科夫链。 2.其中核心代码为: 3.训练样本数据集,请联系作者。

    1.3K10发布于 2021-01-14
  • 来自专栏深度学习|机器学习|歌声合成|语音合成

    HTS音源训练教程

    1.HTK安装方法 HTK:始于剑桥大学工程系,后被微软收购。版权属于微软的。 一、下载安装包 下载两个安装包(下载链接) 分别是HTK-3.5.beta-2.tar.gz以及HDecode-3.5.beta-1.tar.gz 二、安装所需要的依赖库 1\. sudo apt-get libx11-dev sudo apt-get install g++-multilib sudo apt-get install osspd } 三、解压编译安装 1、解压 tar xzf HTK -3.5.beta-2.tar.gz tar xzf HDecode-3.5.beta-1.tar.gz 2、编译 1> HTK 3.5带有三套Makefiles(在这里以 CPU (standard HTK 3.5(可以不更改,我没有更改)。

    73320发布于 2021-01-14
  • 来自专栏深度学习|机器学习|歌声合成|语音合成

    2019年最新中文TTS算法实现个合成样本

    │ ├── validation.py │ └── work_in_progress └── tools ├── COPYING ├── ChangeLog ├── HTK -3.4.1.tar.gz.1 ├── HTS-2.3alpha_for_HTK-3.4.1.patch ├── HTS-2.3alpha_for_HTK-3.4.1.tar.bz2 ├── HTS-2.3alpha_for_HTK-3.4.1.tar.bz2.1 ├── HTS_Document.pdf ├── INSTALL ├── INSTALL.md ─ README ├── REAPER ├── SPTK-3.9 ├── WORLD ├── WORLD_v2 ├── bin ├── compile_htk.sh ─ compile_tools.sh ├── compile_unit_selection_tools.sh ├── festival ├── festvox ├── htk

    1.4K20发布于 2021-01-14
  • 来自专栏数据派THU

    独家 | 一文读懂语音识别(附学习资源)

    HTK Book。 工具包 HTK HTK( http://htk.eng.cam.ac.uk )是剑桥大学开发的一个非常经典的语音识别工具包,全球大约有10万专业用户。 HTK的最大优点是代码和功能非常稳定,并且集成的都是最主流的语音识别技术;并且HTK的很多扩展包本身也非常经典,比如最重要的统计语音合成工具包HTS。 HTK的另一大优点是它有相对最完善的文档手册,也就是前文提到的HTK Book。HTK的缺点之一是更新相对缓慢,并且部分代码由于编写时间比较久,需要一定的更新。 另外值得一提的是,Dan Povey博士也是HTK的作者之一,于是Kaldi和HTK的技术思路比较相近,但经过若干年的发展,Kaldi集成的技术已经多于HTK

    3K60发布于 2018-01-30
  • 来自专栏AI研习社

    横评:五款免费开源的语音识别工具

    为此,我们对比了五款基于 HMM 和 N-gram 模型的语音识别工具:CMU Sphinx,Kaldi,HTK,Julius 和 ISIP。 另外,HTK 并不是严格开源的,它的代码并不能重新组织发布,也不能用于商业用途。 想知道更多语音识别工具的用户请点击以下链接,其中列出了几乎所有开源/非开源的语音识别工具,非常全面。 HTK 始于 1989 年的剑桥大学,曾一度商业化,但目前又回归剑桥。 如前所述 HTK 现在并不是一款严格意义的开源工具,而且更新缓慢(虽然它的最新版本更新于 2015 年 12 月,但前一个版本的更新时间却是 2009 年,中间隔了差不多 6 年时间)。 如果你并不熟悉语音识别,那么可以通过对 HTK 官方文档(注册后可以使用)的学习对该领域有一个概括的认识。同时,HTK 的文档还适用于实际产品设计和使用等场景。

    7.2K130发布于 2018-03-29
  • 来自专栏奋飞安全

    安卓高版本安装系统证书 HTTPS 抓包 - 终极解决方案

    Show me the Code # htk-inject-system-cert.sh set -e # Fail on error # Create a separate temp directory Without this, when we add the mount we can't read the current certs anymore. mkdir -m 700 /data/local/tmp/htk-ca-copy # Copy out the existing certificates cp /system/etc/security/cacerts/* /data/local/tmp/htk-ca-copy/ cacerts # Copy the existing certs back into the tmpfs mount, so we keep trusting them mv /data/local/tmp/htk-ca-copy /etc/security/cacerts/* # Delete the temp cert directory & this script itself rm -r /data/local/tmp/htk-ca-copy

    11.7K40编辑于 2023-03-08
  • 来自专栏机器之心

    资源 | 横向对比5大开源语音识别工具包,CMU Sphinx最佳

    2014 年 Gaida 等人的一篇论文评估了 CMU Sphinx、Kaldi 和 HTK。其中 HTK 严格意义上来说并不是开源的,因为其代码并不能重用或作为商业用途使用。 HTK 始于 1989 年的剑桥大学,已经商用一段时间了,但是现在它的版权又回到了剑桥大学并且已经不是开源软件了。它的最新版本更新于 2015 年 12 月,先前发布于 2009 年。 HTK 也有讨论群但是没有开放资源库。Julius 网站上的用户论坛坏掉了,但是在日本站里可能有更多的信息。ISIP 主要用于教育目的,而且邮件清单档案现在已经不再实用。 如果你缺乏语音识别的知识,HTK 的教程文档(注册用户可看)对这一领域有详尽的描述。

    3.3K60发布于 2018-05-08
  • 来自专栏小鹏的专栏

    [语音识别] 01 语音识别概述

    aidatatang_200zh,200小时,开源(http://openslr.org/62/) • MAGICDATA,755小时,开源(http://openslr.org/68/) 工具包 • HTK : http://htk.eng.cam.ac.uk/ (c) • Kaldi: http://kaldi-asr.org/ (c++, python)【推荐】 • ESPNet: https://

    4.8K20发布于 2020-03-25
  • 来自专栏深度学习|机器学习|歌声合成|语音合成

    歌声合成方法和工具总结1

    octave, cents]):将midi数字转化为音符符号 note_to_midi(note[, round_midi]):音符符号转化为midi数字格式 hz_to_mel(frequencies[, htk ]):频率转化为梅尔谱 hz_to_octs(frequencies[, A440]):频率转化为八度音符 mel_to_hz(mels[, htk]):梅尔谱到频率转化 octs_to_hz(octs [, A440]):八度音符到频率转化 fft_frequencies([sr, n_fft]): mel_frequencies([n_mels, fmin, fmax, htk]):梅尔谱到频率的转化

    1.5K10发布于 2021-01-14
  • 来自专栏Pulsar-V

    SLAM初探(三)

    ) Numpy(python) Matplotlib(python) Scipy(python) CUDA OpenCL Boost 除此之外笔者还用过一些比较少见的辅助框架,主要使用在语音识别当中 HTK Sphinx 注:下载HTK时需要注册一个账号,邮箱请使用国外邮箱,如OutLook,Gmail等邮箱才能接收到来自HTK官方网站欧洲的来信。

    1.1K50发布于 2018-04-18
  • 来自专栏算法工程师的学习日志

    语音识别的一些开源项目整理

    thu-spmi/CAT (14)torchaudio star数量:1.5k 工具特点:pytorch的audio库 链接:https://github.com/pytorch/audio (15)htk 链接:https://htk.eng.cam.ac.uk/2、其他工具包 2、其他功能型工具包/库 (1)kaldiio 链接:https://github.com/nttcslab-sp/kaldiio

    3.5K30编辑于 2022-07-27
  • 来自专栏深度学习|机器学习|歌声合成|语音合成

    基于DNN的歌声演唱系统的测试结果

    演唱引擎 简单的描述思路 样本:wav 和对应乐谱xml格式 样本的预处理 wav需要运用ffmpeg软件转化为raw格式的文件 xml格式的乐谱需要借助festival 或者praat 或者HTK

    56530发布于 2021-01-14
  • 来自专栏深度学习|机器学习|歌声合成|语音合成

    语音识别调研报告

    1.1 核心的框架HTK包 - 2. 人工神经网络,也就是DNN方法。 - - 2.1 主流的语音识别解码器为(WFST):该解码器把语言模型和声学模型集成为一个大的网络,大大的提高了解码速度。

    4.7K40发布于 2021-01-14
  • 来自专栏鸿蒙开发笔记

    基于 OpenHarmony 音符检测实现原理

    bands - uniformly spaced between limits    mel_f = mel_frequencies(n_mels + 2, fmin=fmin, fmax=fmax, htk =htk)    fdiff = np.diff(mel_f)    ramps = np.subtract.outer(mel_f, fftfreqs)    for i in range(n_mels

    35210编辑于 2024-07-30
  • 来自专栏云时之间

    NLP入门-学习路径

    :HMM的三个基本问题 15:NLP的基本解码问题求解 16:NLP的基本序列问题求解 17:HMM的参数估计与训练 18:EM算法 19:HMM的应用 20:层次化马尔科夫模型和马尔科夫网络 21:HTK

    76990发布于 2018-04-11
  • 来自专栏新智元

    语音界传奇Dan Povey突遭美霍普金斯大学解雇,计划转投中国

    有趣的是,Dan Povey 也是剑桥大学语音识别工具包 HTK 的作者之一,他是领导 HTK 工具包开发的 Phil Woodland 教授的学生。 经过若干年的发展,Kaldi 集成的技术已经多于 HTK,老师开发了第一代语音识别开源软件,学生开发了第二代语音识别开源软件。

    87630发布于 2019-08-23
  • 来自专栏MySQL入坑记

    人工智能 - 语音识别的技术原理是什么

    The HTK book (v3.4). Cambridge University, 2006. HTK Book,开源工具包HTK的文档。 虽然现在HTK已经不是最流行的了,但仍然强烈推荐按照书里的第二章流程做一遍,你可以搭建出一个简单的数字串识别系统。 4. Graves A.

    3.6K20发布于 2020-07-06
  • 来自专栏小馒头学Python

    三、get请求和post请求

    FxDOJeC62ZAYIcbf9ihcjNK1U26H3ITTH6aouo2rOtPcNaxu0uzyEG0PXU8g0Kub-FL1ogKKQmOTHACF_2uxOjjg8UtVJeC6EG0Ptf8g0f5; H_BDCLCKID_SF=JnItoI_htK03q5rcbJQEbCCShGRmBbQ9WDTm_D_XLRjEMPoIetrsKPINyNQPXPbeK6 FxDOJeC62ZAYIcbf9ihcjNK1U26H3ITTH6aouo2rOtPcNaxu0uzyEG0PXU8g0Kub-FL1ogKKQmOTHACF_2uxOjjg8UtVJeC6EG0Ptf8g0f5; H_BDCLCKID_SF_BFESS=JnItoI_htK03q5rcbJQEbCCShGRmBbQ9WDTm_D_XLRjEMPoIetrsKPINyNQPXPbeK6

    1.4K50编辑于 2023-11-12
  • 来自专栏devops探索

    k8s解决pod调度不均衡的问题

    descheduler I0729 08:48:45.399567 1 evictions.go:102] Evicted pod: "flink-taskmanager-7c7557d6bc-t2htk I0729 08:48:45.399613 1 lownodeutilization.go:270] Evicted pod: "flink-taskmanager-7c7557d6bc-t2htk 278] Event(v1.ObjectReference{Kind:"Pod", Namespace:"default", Name:"flink-taskmanager-7c7557d6bc-t2htk

    16.8K66发布于 2020-07-31
  • 来自专栏Linux内核深入分析

    Linux音频驱动-OSS和ALSA声音系统简介及其比较

    概述 昨天想在Ubuntu上用一下HTK工具包来绘制语音信号的频谱图和提取MFCC的结果,但由于前段时间把Ubuntu升级到13.04,系统的声卡驱动是ALSA(Advanced Linux Sound Architecture,高级Linux声音体系),而不是HTK中所使用的OSS(Open Sound System,开放声音系统)。

    6.5K31发布于 2020-03-24
领券