大词汇连续汉语语音的MLP声学特征的研究 |
|
|
中国论文联盟*编辑。 大词汇连续汉语语音的MLP声学特征的研究
摘要:短时声学特征参数如MFCC,PLP作为输入向量的高斯混合模型(GMM)的隐马尔可夫模型(HMM)的经典模型在大词汇连续语音识别系统(LVCSR)已取得了良好识别效果。但针对短时声学特征区分性差的特点,本文提出采用神经网络多层感知器(MLP)产生的两种类型差异特征HATs与TANDEM代替短时特征,分别训练GMM参数模型。实验结果表明,差异特征的GMHMM的LVCSR系统优于传统的短时特征的系统;为了更进一步提高系统识别率,该文又将两种类型差异特征HATs与TANDEM进行复合,构成MLPs特征流重建GMHMM,系统的错字率(CER)有2%~3.8%的明显改善。 关键词:多层感知器;差异特征;隐马尔可夫;高斯混合模型 中图分类号:TN912文献标识码:A文章编号:1009-3044(2010)13-3470-02 MLP Features for Large Vocabulary Continuous Mandarin Speech Recognition System LV Dan-ju1, Ch. Plahl2, B.HoffmEister2 (1.Computer Science Dept., Southwest Forestry University, Kunming 650224, China; 2.Lehrstuhl Fur Informatik 6-Computer Science Department RWTH Aachen University, Aachen 52056, Germany) Abstract: Typically Hidden Markov Model (HMM) in large vocabulary continuous speech recognition system (LVCSR),using short-term acoustic features vectors (MFCC/PLP) as input features to the Gaussian mixture model (GMM), has achieved good recogni [1] [2] [3] [4] [5] [6] [7] 下一页 |
|
|
|
上一个论文: 艺术人类学:艺术与艺术家的魅惑 下一个论文: 音乐声学原理在构建录音棚中的作用 |
|