首页 > 乐器声学 专利正文
基于NLP自然语言处理的跨屏语音互动实现方法与流程

时间:2022-02-18 阅读: 作者:专利查询

基于NLP自然语言处理的跨屏语音互动实现方法与流程
基于nlp自然语言处理的跨屏语音互动实现方法
技术领域
1.本发明涉及自然语言处理技术领域,具体为基于nlp自然语言处理的跨屏语音互动实现方法。


背景技术:

2.iptv即交互式网络电视,集互联网、多媒体、通讯等多种技术于一体,用户通过电视机顶盒来观看iptv已经非常普遍。iptv电视节目数据量非常大,千万条级别的媒资数据轻易就能达到。日常生活中,能满足用户对绝大部分电视节目的检索、收看。
3.目前iptv的节目检索交互,主要通过使用遥控器。用户可以使用遥控器按键进行分类筛选或者打字搜索指定内容。另外用户还可以使用语音遥控器来完成检索。虽然运营商已经对海量电视节目做了分类管理、栏目编排,但是用户在使用遥控器,找特定节目时还是很耗时间,往往要找到多次按键、多次筛选。部分用户选择了语音遥控器,希望能通过语音交互来更快捷的操作电视机,但实际情况是语音遥控器存在一定的成本,普及率较低且无短期记忆、上下文情景对话处理的能力。


技术实现要素:

4.为了克服现有技术方案的不足,本发明提供基于nlp自然语言处理的跨屏语音互动实现方法,能有效的解决背景技术提出的问题。
5.本发明解决其技术问题所采用的技术方案是:
6.基于nlp自然语言处理的跨屏语音互动实现方法,包括以下步骤:
7.步骤s1,使用图数据库构建一个自定义词库、标签体系;
8.步骤s2,对平台管理的电视节目进行关键词标签标注,存储电视节目信息、关键词标签信息及两者的关联信息,提供对外查询接口,能根据传入关键词信息,实现电视节目的检索;
9.步骤s3,申请微信小程序账号;
10.步骤s4,开发微信小程序,添加登录页面、集成微信小程序登录认证接口;添加语音遥控器页面、集成微信小程序录音权限认证、录音使用接口;集成语音翻译接口;
11.步骤s5,将微信小程序发版,生成二维码,将二维码添加到电视机或机顶盒的客户端应用中;
12.步骤s6,扫描二维码打开微信小程序,通知客户端与服务端建立轮询请求连接,机顶盒开始向服务端发出轮询请求;
13.步骤s7,在微信小程序里使用收集录音功能,收录音频文件后向服务端发起请求;
14.步骤s8,服务端对音频进行翻译,然后对翻译后的文字进行分词处理,分完词后使用自定义词库、标签体系进行关键字标签提取;
15.步骤s9,关键字标签提取完毕后进行上下文逻辑处理,形成动作指令返送给电视机或机顶盒的客户端;
16.步骤s10,客户端接收到服务端的动作指令后执行对应的动作,如换台、播放、光标移动等。
17.优选的,步骤s1中,所述图数据库选用arangodb,所述自定义词库将定义常用的一些关键词即标签词,以及标签词与其他标签词之间可能存在的关系,其中所述标签词与其他标签词之间存在的关系包括从属、互斥与相似,所述自定义词库还定义维度词的抽象概念。
18.优选的,步骤s4中,所述语音翻译接口包括微信自带的翻译接口。
19.优选的,步骤s5中,电视机大屏端开机后在指定页面将看到小程序二维码,移动端小屏通过扫二维码打开小程序并使用手机语音来控制电视机大屏端。
20.优选的,步骤s8中,服务端对翻译后的文字使用开源的jieba分词中文nlp自然语言处理进行分词处理。
21.优选的,步骤s9中,所述上下文逻辑处理用于在分析当前用户意图时,结合上一次用户说的话做推断。
22.与现有技术相比,本发明的有益效果是:
23.本发明让用户可通过使用手机等移动端设备代替语音遥控器进行语音交互,实现对电视机大屏的操控,利用移动端如智能手机替代语音遥控器,即减少了用户成本又可以提高用户操作的便利性;移动端设备即小屏端,如智能手机打开对应的微信小程序进行语音录入,服务器上的应用程序对采集的语音进行识别翻译、意图提取、上下文处理,即结合上一次对话内容进行本次会话处理、结果响应并通知机顶盒,电视机大屏端做出相应的展示。
附图说明
24.图1为本发明基于nlp自然语言处理的跨屏语音互动实现方法流程图。
具体实施方式
25.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
26.如图1所示,
27.本实施例公开了基于nlp自然语言处理的跨屏语音互动实现方法,其特征在于,包括以下步骤:
28.步骤s1,使用图数据库构建一个自定义词库、标签体系;
29.其中,所述图数据库选用arangodb,所述自定义词库将定义常用的一些关键词即标签词,以及标签词与其他标签词之间可能存在的关系,其中所述标签词与其他标签词之间存在的关系包括从属、互斥与相似,所述自定义词库还定义维度词的抽象概念;
30.例如:新建两个维度词如“类型”、“年龄段”;
31.新建一个标签词“少儿”维度是年龄段,再新建一个标签词“恐怖”维度是类型,添加标签词关系“少儿”“恐怖”互斥。此时服务器上的应用在处理上下文逻辑,即结合上一次
对话内容进行本次会话处理,上文说了“恐怖”,下文说了“少儿”时仅会保留“少儿”标签;
32.步骤s2,对平台管理的电视节目进行关键词标签标注,存储电视节目信息、关键词标签信息及两者的关联信息,提供对外查询接口,能根据传入关键词信息,实现电视节目的检索;
33.例如:新建电视节目《澳门风云3》;演职人员列表:刘德华,王晶,刘伟强,描述:经典港片;年代:80年代;
34.将该电视节目转成json对象传参,接口输出标签组:澳门、刘德华、王晶、经典、港片、80年代;
35.将上述标签与电视节目的对应关系保存下来,后续搜索如搜索刘德华将匹配到该条数据;
36.步骤s3,申请微信小程序账号;
37.步骤s4,开发微信小程序,添加登录页面、集成微信小程序登录认证接口;添加语音遥控器页面、集成微信小程序录音权限认证、录音使用接口;集成语音翻译接口;
38.步骤s5,将微信小程序发版,生成二维码,将二维码添加到电视机或机顶盒的客户端应用中;
39.步骤s6,扫描二维码打开微信小程序,通知客户端与服务端建立轮询请求连接,机顶盒开始向服务端发出轮询请求;
40.步骤s7,在微信小程序里使用收集录音功能,收录音频文件后向服务端发起请求;
41.步骤s8,服务端对音频进行翻译,然后对翻译后的文字进行分词处理,分完词后使用自定义词库、标签体系进行关键字标签提取;
42.步骤s9,关键字标签提取完毕后进行上下文逻辑处理,形成动作指令返送给电视机或机顶盒的客户端;
43.例如:用户先说了一句“有没有80年代的电影”,接着又说了一句“刘德华主演的”,上下文逻辑处理结果应为满足“80年代”、“刘德华”、“电影”三个关键词的结果集;
44.在上下文逻辑处理完毕后会得到新的一组标签关键词,意图此时已较为明朗,如基础搜索、预设动作,可根据业务场景分别进行后续操作,基础搜索,例如需要搜索“80年代电影”相关的节目,直接查询带有“80年代”、“电影”标签的电视节目数据用于电视机大屏展示,预设动作,如“声音调小一点”,直接通知电视机大屏端声音调小;
45.步骤s10,客户端接收到服务端的动作指令后执行对应的动作,如换台、播放、光标移动等。
46.对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。