大词汇连续汉语语音的MLP声学特征的研究


\| 网站首页 \| 范文 \| 演讲致词 \| 汇报体会 \| 总结报告 \| 公文方案 \| 领导讲话 \| 党建工会 \| 论文 \| 文档 \|

您现在的位置：范文大全网 >> 论文 >> 今日更新 >> 正文

用户登录

新用户注册

大词汇连续汉语语音的MLP声学特征的研究

大词汇连续汉语语音的MLP声学特征的研究

中国论文联盟*编辑。

大词汇连续汉语语音的MLP声学特征的研究

　　摘要:短时声学特征参数如MFCC,PLP作为输入向量的高斯混合模型(GMM)的隐马尔可夫模型(HMM)的经典模型在大词汇连续语音识别系统(LVCSR)已取得了良好识别效果。但针对短时声学特征区分性差的特点,本文提出采用神经网络多层感知器(MLP)产生的两种类型差异特征HATs与TANDEM代替短时特征,分别训练GMM参数模型。实验结果表明,差异特征的GMHMM的LVCSR系统优于传统的短时特征的系统;为了更进一步提高系统识别率,该文又将两种类型差异特征HATs与TANDEM进行复合,构成MLPs特征流重建GMHMM,系统的错字率(CER)有2%～3.8%的明显改善。
　　关键词:多层感知器;差异特征;隐马尔可夫;高斯混合模型
　　中图分类号:TN912文献标识码:A文章编号:1009-3044(2010)13-3470-02
　　MLP Features for Large Vocabulary Continuous Mandarin Speech Recognition System
　　LV Dan-ju1, Ch. Plahl2, B.HoffmEister2
　　(1.Computer Science Dept., Southwest Forestry University, Kunming 650224, China; 2.Lehrstuhl Fur Informatik 6-Computer Science Department RWTH Aachen University, Aachen 52056, Germany)
　　Abstract: Typically Hidden Markov Model (HMM) in large vocabulary continuous speech recognition system (LVCSR),using short-term acoustic features vectors (MFCC/PLP) as input features to the Gaussian mixture model (GMM), has achieved good recogni

[1] [2] [3] [4] [5] [6] [7] 下一页

上一个论文：艺术人类学:艺术与艺术家的魅惑

下一个论文：音乐声学原理在构建录音棚中的作用