LD3320嵌入式语音识别系统使用

1 概述

语音交互体系是比较人性化的人机操作界面，它需求语音辨认体系的支撑。LD3320便是这样一款语音辨认芯片。介绍了该芯片的作业原理及运用，给出了LD3320与微处理器的硬件接口电路及软件程序。跟着高级MCU的不断出现，以MCU为中心的嵌入式语音交互体系会有非常好的运用远景。

2 特定人语音辨认技能及原理

特定人语音辨认(ASR,Auto Speech RecognitiON)技能是依据要害词语列表的辨认技能，它是对很多的语音数据(相当于对数千人收集的数万小时的有用声响数据)经语言学家语音模型剖析，树立数学模型，并经过重复练习提取基元语音的细节特征，以及提取各基元间的特征差异，得到在核算概率最优化意义上的各个基元语音特征，最终才由资深工程师将算法以及语音模型转化成硬件芯片并运用在嵌入式体系中。

ASR技能每次辨认的进程便是把用户说出的语音内容，经过频谱转化为语音特征，再将这个转化后的语音特征和要害词语列表中的条目逐个进行匹配，最优匹配的一条即作为辨认成果。比方ASR技能在语音操控的手机运用中，这个要害词语列表的内容便是电话本中的人名、手机的菜单指令或手机存储卡中的歌曲姓名。不管这个列表的条目内容是什么，只需求用户设置相关的寄存器，就能够把相应的待辨认条目内容以字符方法传递给辨认引擎。

由此可见，语音辨认芯片完结的作业便是：把MIC(麦克风)输入的声响进行频谱剖析后提取语音特征，再和要害词语列表中的要害词语进行比照匹配，最终找出得分最高的要害词语作为辨认成果输出。

一般依据ASR技能的语音辨认芯片能在两种状况下给出辨认成果：

①外部送入预订时刻的语音数据(比方5 s的语音数据)，芯片对这些语音数据运算剖析后，给出辨认成果。

②外部送入语音数据流，语音辨认芯片经过端点检测(VAD,Voice Activity Detection)技能检测出用户中止说话，把用户开端说话到中止说话之间的语音数据进行运算剖析后，给出辨认成果。

关于第一种状况，能够理解为设定了一个守时录音(如5 s的语音数据)，芯片在5 s后会中止把声响送入辨认引擎，而且依据已送入引擎的语音数据核算出辨认成果。

关于第二种状况，需求了解VAD的作业原理：VAD技能是在一段语音数据流中，判别出哪个时刻点是人声响的开端，哪个时刻点是人声响的完毕。判别的依据是，在布景声响的根底上有了语音发音，则视为声响的开端。然后，检测到一段持续时刻的布景音(比方600 ms)，则视为人声说话完毕。经过VAD判别出人声说话的区域后，语音辨认芯片会把这期间的声响数据进行辨认处理，核算出辨认成果。

除了以上两种状况外，语音辨认算法无法主动地判别出是否辨认出了一个成果。这是因为，在核算进程中的任何时刻，语音辨认器都会对已送人辨认芯片的声响数据进行剖析，并依据匹配程度为辨认列表中的要害词语进行打分，最匹配的打分最高。可是，因为辨认算法不知道用户后边是否还持续说话，所以无法主动地判别现已辨认出的成果。

3 语音辨认芯片LD3320的作业原理

3.1 语音辨认体系原理结构

LD3320语音辨认芯片选用的便是ASR技能，图1便是由LD3320和单片机(或嵌入式体系)组成的语音辨认体系原理框图。图中给出了LD3320的内部原理结构，本文中选用的MCU是STC10L08XE单片机。

图1 语音辨认体系原理框图

语音辨认芯片LD3320是%&&&&&%Route公司的产品，它选用ASR技能，供给了一种脱离按键、键盘、鼠标、触摸屏等GUI操作方法且依据语音的用户界面VUI(Voice User Interface)，使得用户对该体系的操作更简略、快速和天然。

用户只需求把辨认的要害词语以字符串的方法传送进芯片，即能够在下次辨认中当即收效。比方，用户在51等主控MCU的编程中，简略地经过设置芯片的寄存器，把比方你好这样的辨认要害词语的内容动态地传入芯片中，芯片就能够辨认所设定的要害词语了。每个要害词语能够是单字、词组、短句或许任何的中文发音的组合。依据LD3320的语音辨认体系能够跟着运用流程，在运行时动态地更改要害词语列表的内容，这样能够用一个体系支撑多种不同的场景，一起也不需求用户作任何的录音练习。

3.2 LD3320的用户运用形式

LD3320有两种用户运用形式，即触发辨认形式和循环辨认形式.用户能够经过编程，设置两种不同的用户运用形式。

触发辨认形式：体系的主控MCU在接纳到外界一个触发后(比方用户按动某个按键)，发动LD3320芯片的一个守时辨认进程(比方5 s)，要求用户在这个守时进程中说出要辨认的语音要害词语。这个进程完毕后，需求用户再次触发才干再次发动一个辨认进程。

循环辨认形式：体系的主控MCU重复发动辨认进程。假如没有人说话就没有辨认成果，则每次辨认进程的守时届时后再发动一个辨认进程;假如有辨认成果，则依据辨认作相应处理后(比方播映某个声响作为答复)再发动一个辨认进程。

4 语音辨认体系软硬件规划

4.1 硬件体系规划

由图l可知，由LD3320组成的语音辨认体系硬件有单片机(或嵌入式体系)及LD33202.图2和图3分别是由单片机STC10L08XE构成的主控芯片和由LD3320A构成的语音辨认主体系。

图2 STC10L08XE构成的主控芯片

图3 LD3320A构成的语音辨认主体系

4.2 软件体系规划

语音辨认的操作次序是：先进行语音辨认的初始化，然后写入辨认列表，体系即开端进行语音辨认，并准备好中止响应函数，翻开中止答应位。这儿假如不必中止方法，也能够经过查询方法作业。在开端辨认后，读取寄存器B2H的值，假如为21H就表明有辨认成果发生。

扫一扫打开手机网站

微信扫一扫关注我们

LD3320嵌入式语音识别系统使用

联系我们

微信扫一扫关注我们

为您推荐

小漫电子到货 Slkor(萨科微)肖特基二级管SS34 1000只

储能系统：如何轻松安全地管理电池包

聊聊逆变器：进军绿色能源市场，你绕不开的技术门槛！

做3D感测系统设计难？试试3D 霍尔效应传感器！

用于模型飞机灯的智能开关

利用机电继电器解决现代接口问题

联系我们

微信扫一扫关注我们