语音交互(第一篇) | 您所在的位置:网站首页 › 音乐识别是什么东西 › 语音交互(第一篇) |
嵌入式之路,贵在日常点滴 ---阿杰在线送代码 目录 一、 LD3320模块介绍(类似于耳朵) 1、简介 2、 有三个工作模式 3、板上管脚资源 二、MP3模块(类似于嘴巴) 1、简介 2、板上管脚资源 3、 MP3模块播放的指令和格式 三、LD3320和MP3之间的对话 四、功能实现 一、 LD3320模块介绍(类似于耳朵) 1、简介LD3320是一颗基于非特定人语音识别(SI-ASR:Speaker-Independent Automatic Speech Recognition)技术的语音识别芯片,或者说是语音声控芯片。 非特定人语音识别是什么。 通俗点讲就是不用针对指定发音人的识别技术,这种语音识别技术不分年龄、性别,只要发音人说的是相同的语言就可以识别。再说得简单点,就是说只要是拼音可以拼出的发音,都是可以输入芯片进行识别的。 这个语音识别模块它不是智能的,不是说我们问它什么它就可以回答什么,它不像我们手机上的语音助手比如小爱或者Siri那样,能跟我们对答如流。这个模块能识别的内容,是需要我们提前设定好的,我们把要识别的关键词语列好,然后把这些关键词语以字符的形式传送到 LD3320 内部,这样才可以对用户说出的关键词语进行识别,而且在同一时刻,它最多是在50条关键词语中进行识别。 2、 有三个工作模式1、普通模式:不同的工作模式可以通过程序编程来实现 2、口令模式:模块工作时,我们先要说出一个一级口令,比如“芝麻开门”,模块在识别到正确的一级口令后才进行下一级的识别 3、按键触发模式:模块工作时,我们在进行语音识别之前,需要先按一下按键,接下来才能进行下一步的识别 (不同的工作模式可以通过程序编程来实现) 这三个模式我觉得口令模式比较实用,本实验,我用的就是口令模式。 3、板上管脚资源如上图中这个语音识别模块的图片,红色框框中的引脚就是我们可以用的IO,竖着那一排由下而上标着P10~P17有八个,横着那一排从左往右是P34、P33,P23~P27,P41,也有8个,这样我们可以用的IO口就有16个啦,这16个IO口可以用来控制继电器,LED,或者接单片机的IO口。 上图中,最左边由下而上标着5V,GND,TX,RX的四个引脚就是用来给模块下载程序的地方,串口就在这里了。我们通过串口给其它模块或者单片机发数据也是从这里接。 二、MP3模块(类似于嘴巴) 1、简介
这个小东西能用来放音乐,放广播,它不仅支持通过按键来选曲、调音量,还可以通过单片机来操作,这也就是说,我们可以通过编程,通过串口来发指令,指定它什么时候放哪首歌曲,放多大的音量,中途插不插播广告等,根本不用我们动手,程序上就解决了。 2、板上管脚资源 |
CopyRight 2018-2019 实验室设备网 版权所有 |