一,HTK目录结构
htk是一个开源的软件,解压之后的目录如下:
[root@localhost htk]# ls
AUTHORS config.status env HTK HTKTools Makefile.in
ChangeLog config.sub FAQ HTKBook install-sh README
config.guess configure HLMLib HTKLib LICENSE
config.log configure.ac HLMTools HTKLVRec Makefile
[root@localhost htk]#
除去一些编译文件之外,几个重要的文件说明如下:
- env。编译的环境变量设置。
- HLMLib。HMM语言模型库。
- HLMTools。HMM语言模型工具。
- HTKBook。开发帮助文档。
- HTKLib。HTK的声学库文件。
- HTKTools。HTK的声学开发工具。
对于声学部分来说,比较重要两个文件夹是后面的两个文件夹。
二,HTK原理
HTK软件的体系结构如下图所示:
整个HTK是使用HMM作为语音识别的核心,当HMM应用于孤立词语音识别时,它用不同的隐含状态来描述不同的语音发音,对于连续语音识别系统,多个孤立词HMM子模型按一定的语言模型组成的复合HMM模型序列来刻画连续的语音信号,在序列中每个模型直接对应于相关的发音,并且每一个模型都有进入和退出状态,这两个状态没有对应的观察矢量,只用于不同模型的连接。
上图中的 HTK Tool周边的一些库都是HTKLib,这些库是语音信号处理时必须的资源或者通用库文件,HTK Tool正是利用HTKLib文件夹中的库文件(如HMem,HSigP等库文件),链接生成一些可执行程序。如HSigP库完成信号的预加重,信号加窗,FFT等方面的计算。
三,HTK工具使用
HTK工具的使用主要分布在使用过程中的四个阶段:
- 数据准备。
- 模型训练。
- 模式识别/结果测试。
- 模型分析。
如下图所示:
每一个HTK命令行工具都在特定的阶段完成特定的任务。整个入口就是原始的声音文件和对声音文件的文本记录信息。
分享到:
相关推荐
HTK使用方法簡介 语音识别 ppt,剑桥大学语音识别工具,台大的htk课件
HTK使用方法简介.pptx
这个是关于HTK的资料,HTK是语音识别的一个重要途径和方法,对做语音识别的朋友很有用!
内含HTK语音识别工具包的详细使用方法,并有完整的实例,对于刚刚接触的HTK的初学者很有价值。
HTK-win下编译好的文件及htkDemo,具体编译方法请参考我写的教程,请在网络上搜索(原创)windows下编译htk3.4傻瓜式教程 或 登录我的163博客blog.163.com/cqusuperyang,谢谢,有什么问题请留言
MatLab环境下调用HTK的连续语音识别方法.pdf
大多数情况下,安装 htk_io 的最简单方法是使用 pip。 例如在 Debian 和 Ubuntu 中: sudo apt-get install python-numpy sudo pip install htk_io 第一个命令从系统存储库安装 numpy,因为通常不建议使用 pip 安装...
研究语音识别的重要窗口工具资料。 资料描述了识别原理,HTK工具包的具体内容及试用方法。
基于HTK的发音评估系统设计与实现,孟平,,本文给出了一种用于英语学习的发音评估系统的实现方法。该系统采用语音识别技术,通过评估引擎对待测语音的发音准确度进行评估,
在编码的MFCC波声音:运行python mfcc_and_gammatones.py --htk-mfcc $DATASET/train和python mfcc_and_gammatones.py --htk-mfcc $DATASET/test制造.mfc与根据HCOPY文件wav_config ( .mfc_unnorm是无正常化) ...
这个文件里面主要说明了隐马尔科夫模型的使用方法。
現今大詞彙語音辨識最常使用的方法多為統計模行,HMM(隱藏式馬可夫模型)為其中最為廣泛應用的一種
custom_fe HCopy_UP是bash包装器,用于可与HTK和Kaldi一起使用的自定义前端。 它模仿HTK的HCopy接口,但在内部调用Matlab或Python代码。 这样可以轻松创建以HTK或Kaldi格式编写功能的自定义前端,因此可以将它们合并...
期刊论文 基于HTK的连续语音识别系统及其在TIMIT上的实验 - 现代计算机(专业版) - 2009(11) 会议论文 Iterative Language Model Adaptation for Large Vocabulary Continuous Speech Recognition - 2011 4th ...
http://www.holtek.com.cn/referanc/htk_book.htm HOLTEK-p.htm" target="_blank" title="HOLTEK货源和PDF资料">HOLTEK单片机软件/硬件应用范例下载地址: ...
采用C+ +编程和语音识别工具箱HTK相结合的方法进行软件设计,然后以数字信号处理(DSP)芯片TMS320C5409为主完成硬件设计,实验结果表明该控制方法的正确识别率达到98%以上,具有一定的可行性。
根据藏语的特点,提出藏语...以音素和声韵母为声学建模单元,在HTK平台上建立上下文相关的连续隐马尔可夫声学模型,以实现藏语拉萨话特定人大词表连续语音识别。实验结果表明,在最优情况下,该模型词错误率只有7.8%。