HTK在数据准备工具是主要是处理标签标记数据和音频数据,HCopy工具可以将音频数据转换成HTK的特征文件数据(参见数据准备HCopy),HList并不处理什么数据,从字面意思就可以知道,这是一个查看工具,也非常有用
一,功能
查看所有HTK支持的格式文件的内容,可以支持多个文件。
二,语法
HList [options] file ....
这个命令会输出file的文件内容,如果没有file被指定,但是源的格式是HAUDIO,那么audio的数据也会被显示出来。这个命令还可以根据源文件输出指定的格式数据,如源文件输入是WAV,但是我想输出转换之后的MFCC特征数据,也是可以的,通过-C 批量配置文件就行了。
三,选项
- -e N。如果输出采样N之后,就不输出了。
- -h,输出源文件的头信息。
- -i N .每一行输出多少个。
- -s N ,从哪个采样点开始输出,默认是0.
- -F fmt,指定源数据格式为fmt,如果源数据格式是wav音频,就指定为WAV就可以了。
- -z 。这个选项和-h一起使用是比较有效果的,可以输出多个文件的头信息,而不输出内容.
四,使用例子
1)如查看某一个WAV文件的信息,如下
[root@localhost data]# HList -F WAV -h wav/sample01.wav| less
------------------------- Source: wav/sample01.wav --------------------------
Sample Bytes: 2 Sample Kind: WAVEFORM
Num Comps: 1 Sample Period: 62.5 us
Num Samples: 215040 File Format: WAV
---------------------------- Samples: 0->215039 -----------------------------
0: 2 1 2 1 2 1 2 1 2 1
10: 2 1 2 1 17 22 20 20 20 20
20: 20 20 21 20 20 20 21 21 19 20
30: 20 20 20 20 20 20 19 20 20 20
40: 20 20 20 20 20 19 19 19 19 19
50: 20 20 19 19 20 20 19 18 19 19
60: 19 19 19 19 19 19 19 19 19 19
70: 18 18 18 19 18 18 19 18 18 18
80: 19 18 18 18 18 18 18 19 18 19
90: 18 18 18 18 18 18 17 18 18 18
100: 18 18 18 18 18 18 18 18 18 18
110: 17 18 18 17 18 18 18 17 17 17
120: 18 17 17 17 17 17 17 17 17 17
130: 17 17 17 17 17 17 17 17 17 17
140: 17 17 17 17 17 16 17 17 17 16
150: 16 16 17 16 16 16 17 16 16 17
2)查看WAV文件的输出信息
[root@localhost data]$ HList -h -z -t -C wav_config -o -s 100 -e 104 wav/sample01.wav
------------------------------- Source: wav/sample01.wav -------------------------------
Sample Bytes: 2 Sample Kind: WAVEFORM
Num Comps: 1 Sample Period: 125.0 us
Num Samples: 215040 File Format: WAV
---------------------------------------- Target ----------------------------------------
Sample Bytes: 156 Sample Kind: MFCC_D_A_Z_0
Num Comps: 39 Sample Period: 16000.0 us
Num Samples: 1679 File Format: HTK
-------------------------------- Observation Structure ---------------------------------
x: MFCC-1 MFCC-2 MFCC-3 MFCC-4 MFCC-5 MFCC-6 MFCC-7 MFCC-8 MFCC-9 MFCC-10
MFCC-11 MFCC-12 C0 Del-1 Del-2 Del-3 Del-4 Del-5 Del-6 Del-7
Del-8 Del-9 Del-10 Del-11 Del-12 DelC0 Acc-1 Acc-2 Acc-3 Acc-4
Acc-5 Acc-6 Acc-7 Acc-8 Acc-9 Acc-10 Acc-11 Acc-12 AccC0
---------------------------------- Samples: 100->104 -----------------------------------
100: -2.341 -2.018 -0.443 -1.752 -5.100 -1.193 -4.605 -7.662 -1.047 -3.528
-4.766 1.584 -3.738 -0.111 0.298 -0.234 -0.617 -2.545 0.424 1.299
0.479 -2.836 -0.081 -0.007 -2.740 0.427 0.100 -0.305 -0.497 0.403
0.462 0.685 0.788 0.478 0.059 0.053 0.186 0.009 -0.028
101: -1.759 -3.905 0.907 1.865 -2.963 -1.062 -5.488 -1.268 -0.789 0.332
-0.523 1.616 -2.745 0.163 -0.295 -1.079 0.437 0.543 1.757 1.675
-0.162 -1.864 -1.036 0.057 -1.114 0.453 0.134 -0.120 -0.141 0.552
0.644 0.480 0.237 -0.285 0.976 0.073 -0.158 0.513 -0.132
102: -2.112 -2.328 -2.316 -1.382 -7.942 -1.394 1.699 -6.864 -8.398 -2.340
-1.575 -0.482 -3.500 0.103 -0.546 -0.540 1.653 0.316 1.440 0.856
0.499 1.156 0.728 -0.076 0.404 -0.071 0.079 -0.033 0.269 0.327
0.598 -0.133 -0.662 -0.005 1.590 0.458 -0.365 0.738 -0.142
103: -1.375 -4.578 -0.863 4.933 0.199 6.362 -4.723 -6.458 3.418 -0.977
-5.196 -0.058 -2.663 0.255 -0.069 -0.244 0.993 0.368 1.685 0.345
-0.753 2.642 0.474 -0.693 -0.118 -0.129 0.007 0.161 0.408 -0.318
-0.203 -0.859 -0.605 0.089 0.570 0.553 -0.303 -0.027 -0.046
104: -2.020 -4.412 -2.257 4.981 -5.100 2.295 -0.708 -2.574 2.629 0.767
-2.809 4.443 -4.134 0.238 0.021 0.691 0.739 0.533 -0.206 -1.345
0.751 2.864 1.455 -1.455 0.453 0.007 -0.067 0.017 0.136 -0.571
0.020 -0.733 -0.285 -0.150 -0.687 0.191 -0.225 -0.222 0.104
----------------------------------------- END ------------------------------------------
[root@localhost data]$
可以看到这么多信息的,有用。
分享到:
相关推荐
强制对齐HTK工具-3.4.1-windows,包括HTK-3.4.1.zip;HTK-samples-3.4.1.zip。
语音处理工具,HTK 的中文版,方便大家了解和认识HTK 更容易入门
隐马项目\HTK-samples-3.4.zip 这是一个以HMM为基础的语音训练模形源码从中可以了解HMM如何做参数撷取及如何辨识
英国剑桥大学开发的新版本语音识别工具开发包HTK。
本文介绍了如何在WIN7下安装HTK及利用HTK进行YES/NO识别的过程,及HTK 3.4安装包。
隐马尔科夫模型工具箱最新版本,可以广泛应用于识别等领域
是语音识别开发工具包HTK的详细阐述,里面有文档和例子程序。覆盖面很广。
HTK 3.4.1 windows下可执行文件
HTK开发工具包,是编译好的可执行程序,下载后可以直接使用
应用HTK建立的语音识别系统,PPT文档-Application of HTK speech recognition system established, PPT document
HTK3.4语音识别的实用例子
HTK 3.4.1 源代码,及在64位windows上编译出的可执行文件,已用官方samples测试过,samples的源代码也放在压缩包里了
强制对齐htk-3.4.1-linux/Unix,包括HTK-samples-3.4.1.tar;HTK-3.4.1.tar。
python库,解压后可用。 资源全名:htk-1.1.0-py2.py3-none-any.whl
由英国剑桥大学语音视觉和机器人小组开发的语音识别工具包
HTK-3.4.1,HTK-samples-3.4.1,htkbook.pdf
HMM toolkit, HTK. http://htk.eng.cam.ac.uk/ftp/software/
隐马尔科夫模型工具箱使用样本文件,可以广泛应用于识别等领域
2.3.1 数据准备工具 2.3.2 训练工具 2.3.3 识别工具 2.3.4 分析工具 2.4 版本3.4中的更新 2.4.1 版本3.3中的更新 2.4.2 版本3.2中的更新 2.4.3 版本3.1中的更新 2.4.4 版本2.2中的更新 2.4.5 版本2.1中的 新特征 3 ...