语音交互(第一篇) 您所在的位置:网站首页 音乐识别是什么东西 语音交互(第一篇)

语音交互(第一篇)

2024-07-14 16:26| 来源: 网络整理| 查看: 265

嵌入式之路,贵在日常点滴

                                                                ---阿杰在线送代码

目录

一、 LD3320模块介绍(类似于耳朵)

1、简介

2、 有三个工作模式

3、板上管脚资源

二、MP3模块(类似于嘴巴)

1、简介

2、板上管脚资源 

3、 MP3模块播放的指令和格式

三、LD3320和MP3之间的对话 

四、功能实现 

一、 LD3320模块介绍(类似于耳朵) 1、简介

LD3320是一颗基于非特定人语音识别(SI-ASR:Speaker-Independent Automatic Speech Recognition)技术的语音识别芯片,或者说是语音声控芯片。 

非特定人语音识别是什么。

通俗点讲就是不用针对指定发音人的识别技术,这种语音识别技术不分年龄、性别,只要发音人说的是相同的语言就可以识别。再说得简单点,就是说只要是拼音可以拼出的发音,都是可以输入芯片进行识别的。

这个语音识别模块它不是智能的,不是说我们问它什么它就可以回答什么,它不像我们手机上的语音助手比如小爱或者Siri那样,能跟我们对答如流。这个模块能识别的内容,是需要我们提前设定好的,我们把要识别的关键词语列好,然后把这些关键词语以字符的形式传送到 LD3320 内部,这样才可以对用户说出的关键词语进行识别,而且在同一时刻,它最多是在50条关键词语中进行识别。

2、 有三个工作模式

1、普通模式:不同的工作模式可以通过程序编程来实现

2、口令模式:模块工作时,我们先要说出一个一级口令,比如“芝麻开门”,模块在识别到正确的一级口令后才进行下一级的识别

3、按键触发模式:模块工作时,我们在进行语音识别之前,需要先按一下按键,接下来才能进行下一步的识别

(不同的工作模式可以通过程序编程来实现)

这三个模式我觉得口令模式比较实用,本实验,我用的就是口令模式。

3、板上管脚资源

如上图中这个语音识别模块的图片,红色框框中的引脚就是我们可以用的IO,竖着那一排由下而上标着P10~P17有八个,横着那一排从左往右是P34、P33,P23~P27,P41,也有8个,这样我们可以用的IO口就有16个啦,这16个IO口可以用来控制继电器,LED,或者接单片机的IO口。 

上图中,最左边由下而上标着5V,GND,TX,RX的四个引脚就是用来给模块下载程序的地方,串口就在这里了。我们通过串口给其它模块或者单片机发数据也是从这里接。 

二、MP3模块(类似于嘴巴) 1、简介

模块型号名称是MP3-TF-16P,别看它体积不大,功能可是很强大的。简单来说,它就是一个音乐播放器,可以用来播放U盘、TF卡、NOR FLASH里的MP3、WAV、WMA格式的音频文件,同时它也可以作为电脑的声卡,用来播放电脑的声音。它也可以作为读卡器,通过USB连接电脑后就可以更新TF卡里的内容,用来更新文件。 

这个小东西能用来放音乐,放广播,它不仅支持通过按键来选曲、调音量,还可以通过单片机来操作,这也就是说,我们可以通过编程,通过串口来发指令,指定它什么时候放哪首歌曲,放多大的音量,中途插不插播广告等,根本不用我们动手,程序上就解决了。 

2、板上管脚资源 



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有