嵌入式语音识别技术-深圳市智能媒体和语音重点实验室

嵌入式语音识别技术

　　各种新型智能化的设备日益广泛地走进人们的工作和生活,而人与这些智能化终端之间的自然、快捷、稳定、可靠的交互方式有助于提高人机交互的效率,增强人对智能化设备的控制。作为人机交互最自然的方式,语音识别成为了当今最便捷的人机交互使用方式。
　　嵌入式语音识别技术是指应用各种先进的微处理器在板级或是芯片级用软件或硬件实现语音识别。语音识别技术的嵌入式实现要求算法在保证识别效果的前提下尽可能优化,以适应嵌入式平台存储资源少、实时性要求高的特点。
　　根据此特点，深圳市智能媒体和语音重点实验室研发了嵌入式语音识别系统，该系统是不同规模词表的高性能嵌入式语音识别引擎，可为第三方提供开发接口，提供语音识别功能。该系统针对嵌入式系统资源受限的特点，对搜索算法作了改进与优化，在资源占用、可移植性等方面取得了突破性的进展，使系统在保证语音识别效果的前提下，达到既提高语音速度又保持良好识别率的目的。

嵌入式语音识别系统：

	非特定人嵌入式语音识别，无需训练，一般噪声和词表环境下，多候选情况下，识别准确率或正确拒绝率不低于92％；车载环境下识别正确率不低于85％。
	非特定人分布式语音识别，无需训练，一般噪声和词表环境下，多候选情况下，识别准确率或正确拒绝率不低于97％；车载环境下识别正确率不低于92％。
	分布式语音识别和嵌入式语音识别智能切换。
	对带有口音的语音输入自动进行口音自适应，对于混合口音等，识别率无显著降低。
	支持多语种混合语音识别，包括中英文混合短语命令。
	车载自适应抗噪声模块，能进行噪声及回声消除。
	标准程序语言及底层汇编语言联合编写，效率高，方便移植，适应不同的平台。
	识别速度实时，响应时间小于2秒。
	无线蓝牙自动对接响应实时。
	开放音频输入及多媒体接口，可以和汽车电子中不同模板按照不同协议加载。

技术的应用平台
车载系统
WindowsCE/Android系统平台
可实现2000条的词条识别，最多可达4000条
应用包括：语音发送短信、语音拨号、语音播放媒体、语音打开应用软件等