语音助手 您所在的位置:网站首页 中控bs模块 语音助手

语音助手

2023-10-10 14:55| 来源: 网络整理| 查看: 265

        这一章我们一起来看一下语音助手的整体架构和设计。

        一般来讲,一个比较完善的语音助手可以分为:中控部分 + BOT部分,对于一个BOT而言,其实质是一个可以独立运行的服务,包含自己的中控,其内部自成一个小周天,而中控的存在则是处理一些对于各个BOT而言公共的处理,以及各个BOT的分发、排序等功能。如下图:

        其中蓝色部分,即为各个BOT,针对系统类型不同,BOT内部的设计也各不相同,比较典型的三个BOT:闲聊BOT、任务BOT、问答BOT,至于各个BOT内部的设计,我们后面章节再详细说。这里我们主要讲解中控系统的设计。图中剩余部分,则包含了:QU、运营干预层、对话管理以及后处理策略层。下面简单讲述下各个模块的作用:

一、QU:

        QU为基本语义理解,这里对输入的query做一些公共的基础语义理解,包含实体识别、文本分类、语义角色标注、语义检索、文本改写等,中控和BOT则会根据语义理解的结果进行处理,比如其中语义角色标注、文本分类、语义检索、实体识别可以用于对话管理中BOT的分发和排序、文本改写则用于对输入的query进行纠错,提高下游识别效果。

二、运营干预层:

        运营干预层,顾名思义,主要是用于运营干预,适用于两种情况:

        1. 某些话术,不想使用其本身的语义,而是想要赋予其特殊的语义来实现特定的效果,例如:“谁是世界上最美的人”,这本是一个疑问句,应该搜索对应的问答结果,但是运营有时会希望其能够打开前置照相机,作为一个小彩蛋,此时就需要这里对query进行干预。

        2、某些话术,其结果我们发现并非按照预期执行,此时我们可以在这里对结果进行干预,或者对query进行改写,来实现结果的纠正。

        当然,除了运营可以使用外,这一层中我们能做的还有很多,对于一些线上问题,可以在这里通过干预快速处理,避免对更多的用户产生影响,比如可以做BOT分发的干预,返回结果的干预等等。

三、DM层:

        对话管理,这里的对话管理主要包含两个功能:BOT的分发和排序,多轮对话。其会利用当前query语义理解的结果、历史上下文、环境上下文来共同决定Action(执行动作)和下一个状态,如下图:

        关于中控的分发和排序,多轮会话,这些会在后面的章节中详细讲解。

四、垂类BOT层:

        垂类bot层,包含了各个独立的BOT,分别处理各自领域的内容,比如闲聊BOT主要处理闲聊类型的对话,陪用户聊天,问答BOT主要处理知识检索类型的对话,帮助用户搜索知识,闹钟BOT主要处理闹钟相关的语义,音乐BOT主要处理音乐相关的语义等等。不同类型BOT的内部详细设计,我们后面再讲,这里就不展开了。

 五、后处理策略层:

        后处理策略层中包含:客户端交互,推荐服务,对话策略等。

        客户端交互,即为把最终得到的技能结果,进行封装,得到客户端可以执行的结构体。

        推荐服务,则负责根据知识图谱、用户画像、产品策略等对当前的用户话术进行一些推荐,比如用户query:“周杰伦是谁”,可以进行关联推荐:“周杰伦行程”,“周杰伦妻子是谁”,“播放周杰伦的歌”等等,也可以根据用户使用习惯和当前地点、时间进行一些个性化推荐,比如:当前晚上10点,可以推荐“定个明天早上8点的闹钟”。推荐服务也是一个单独的内容,后面的章节中我们会单独拿出来讲。

        对话策略,这里主要是进行一些特殊的后处理,比如某些场景下,需要关闭某些技能等。 

 

        

 

 

 

 



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有