1.本发明涉及计算机技术领域,具体而言,涉及一种情绪数据的识别方法、装置、存储介质及电子设备。
背景技术:2.随着自然语言处理技术的进步,在游戏业内,例如:在角色扮演类游戏(rpg)中,为了增强互动性和玩家的代入感,非玩家角色(npc)在说话时,伴有表情的变化;绝大部分rpg游戏都需要游戏制作方在写好游戏剧本后,重新观察每个npc的文本内容,并对文本内容进行情绪标记,完成标记后制作相应的表情。
3.但是,现有的情绪标记技术都过分关注于文本本身的信息,忽略了剧本写作者在写每段剧本时为每个角色预设的先验情绪信息;不符合游戏制作者的心理预期,重新观察每个npc的文本内容也会降低游戏开发效率。
4.针对上述的问题,目前尚未提出有效的解决方案。
技术实现要素:5.本发明实施例提供了一种情绪数据的识别方法、装置、存储介质及电子设备,以至少解决现有技术中情绪数据的识别方法需要重新观察每个非玩家角色的文本内容,导致游戏开发效率低的技术问题。
6.根据本发明实施例的一个方面,提供了一种情绪数据的识别方法,包括:获取游戏剧本中的对话数据,以及与上述对话数据对应的先验情绪特征,其中,上述先验情绪特征基于上述对话数据所处的游戏场景预先设定;确定上述对话数据的句子编码向量,其中,上述句子编码向量用于表征上述对话数据对应的语义特征信息;识别上述先验情绪特征与上述句子编码向量,得到上述对话数据的情绪识别结果。
7.根据本发明实施例的另一方面,还提供了一种情绪数据的识别装置,包括:获取模块,用于获取游戏剧本中的对话数据,以及与上述对话数据对应的先验情绪特征,其中,上述先验情绪特征基于上述对话数据所处的游戏场景预先设定;确定模块,用于确定上述对话数据的句子编码向量,其中,上述句子编码向量用于表征上述对话数据对应的语义特征信息;识别模块,用于识别上述先验情绪特征与上述句子编码向量,得到上述对话数据的情绪识别结果。
8.根据本发明实施例的另一方面,还提供了一种处理器,上述处理器用于运行程序,其中,上述程序被设置为运行时执行任意一项上述的情绪数据的识别方法。
9.根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,上述计算机可读存储介质包括存储的程序,其中,在上述程序运行时控制上述计算机可读存储介质所在设备执行任意一项上述的情绪数据的识别方法。
10.根据本发明实施例的另一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为运行上述计算机程序以执行任意一项
上述的情绪数据的识别方法。
11.在本发明实施例中,通过获取游戏剧本中的对话数据,以及与上述对话数据对应的先验情绪特征,其中,上述先验情绪特征基于上述对话数据所处的游戏场景预先设定;确定上述对话数据的句子编码向量,其中,上述句子编码向量用于表征上述对话数据对应的语义特征信息;识别上述先验情绪特征与上述句子编码向量,得到上述对话数据的情绪识别结果,达到了符合游戏制作者的心理预期的目的,从而实现了提高游戏开发效率的技术效果,进而解决了现有技术中情绪数据的识别方法需要重新观察每个非玩家角色的文本内容,导致游戏开发效率低的技术问题。
附图说明
12.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
13.图1是根据本发明实施例的一种情绪数据的识别方法的流程图;
14.图2是根据本发明实施例的一种可选的情绪识别方法流程图;
15.图3是根据本发明实施例的一种可选的情绪识别模型的流程示意图;
16.图4是根据本发明实施例的一种情绪数据的识别装置的结构示意图。
具体实施方式
17.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
18.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
19.根据本发明实施例,提供了一种情绪数据的识别的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
20.该方法实施例的技术方案可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,该移动终端可以是智能手机(如android手机、ios手机等)、平板电脑、掌上电脑以及移动互联网设备(mobile internet devices,简称为mid)、pad等终端设备。移动终端可以包括一个或多个处理器(处理器可以包括但不限于中央处理器(cpu)、图形处理器(gpu)、数字信号处理(dsp)芯片、微处理器(mcu)、可编程逻辑器件
(fpga)、神经网络处理器(npu)、张量处理器(tpu)、人工智能(ai)类型处理器等的处理装置)和用于存储数据的存储器。可选地,上述移动终端还可以包括用于通信功能的传输设备、输入输出设备以及显示设备。本领域普通技术人员可以理解,上述结构描述仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比上述结构描述更多或者更少的组件,或者具有与上述结构描述不同的配置。
21.存储器可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的情绪数据的识别方法对应的计算机程序,处理器通过运行存储在存储器内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的情绪数据的识别方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
22.传输设备用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输设备包括一个网络适配器(network interface controller,简称为nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备可以为射频(radio frequency,简称为rf)模块,其用于通过无线方式与互联网进行通讯。该方法实施例的技术方案可以应用于各种通信系统,例如:全球移动通讯(global system of mobile communication,简称为gsm)系统、码分多址(code division multiple access,简称为cdma)系统、宽带码分多址(wideband code division multiple access,简称为wcdma)系统、通用分组无线业务(general packet radio service,简称为gprs)、长期演进(long term evolution,简称为lte)系统、lte频分双工(frequency division duplex,简称为fdd)系统、lte时分双工(time division duplex,简称为tdd)、通用移动通信系统(universal mobile telecommunication system,简称为umts)、全球互联微波接入(worldwide interoperability for microwave access,简称为wimax)通信系统或5g系统等。可选地,多个移动终端之间可以进行设备到设备(device to device,简称为d2d)通信。可选地,5g系统或5g网络又被称为新无线(new radio,简称为nr)系统或nr网络。
23.显示设备可以例如触摸屏式的液晶显示器(lcd)和触摸显示器(也被称为“触摸屏”或“触摸显示屏”)。该液晶显示器可使得用户能够与移动终端的用户界面进行交互。在一些实施例中,上述移动终端具有图形用户界面(gui),用户可以通过触摸触敏表面上的手指接触和/或手势来与gui进行人机交互,此处的人机交互功能可选的包括如下交互:创建网页、绘图、文字处理、制作电子文档、游戏、视频会议、即时通信、收发电子邮件、通话界面、播放数字视频、播放数字音乐和/或网络浏览等、用于执行上述人机交互功能的可执行指令被配置/存储在一个或多个处理器可执行的计算机程序产品或可读计算机可读存储介质中。
24.在本公开其中一种实施例中的情绪数据的识别方法可以运行于终端设备或者是服务器。其中,终端设备可以为本地终端设备,服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。当情绪数据的识别方法运行于服务器时,该方法则可以基于云交互系统来实现与执行,其中,云交互系统包括服务器和客户端设备。
25.在一可选的实施方式中,云交互系统下可以运行各种云应用,例如:云游戏。以云游戏为例,云游戏是指以云计算为基础的游戏方式。在云游戏的运行模式下,游戏程序的运行主体和游戏画面呈现主体是分离的,情绪数据的识别方法的储存与运行是在云游戏服务器上完成的,客户端设备的作用用于数据的接收、发送以及游戏画面的呈现,举例而言,客户端设备可以是靠近用户侧的具有数据传输功能的显示设备,如,移动终端、电视机、计算机、掌上电脑等;但是进行信息处理的终端设备为云端的云游戏服务器。在进行游戏时,玩家操作客户端设备向云游戏服务器发送操作指令,云游戏服务器根据操作指令运行游戏,将游戏画面等数据进行编码压缩,通过网络返回客户端设备,最后,通过客户端设备进行解码并输出游戏画面。
26.在一可选的实施方式中,终端设备可以为本地终端设备。以游戏为例,本地终端设备存储有游戏程序并用于呈现游戏画面。本地终端设备用于通过图形用户界面与玩家进行交互,即,常规的通过电子设备下载安装游戏程序并运行。该本地终端设备将图形用户界面提供给玩家的方式可以包括多种,例如,可以渲染显示在终端的显示屏上,或者,通过全息投影提供给玩家。举例而言,本地终端设备可以包括显示屏和处理器,该显示屏用于呈现图形用户界面,该图形用户界面包括游戏画面,该处理器用于运行该游戏、生成图形用户界面以及控制图形用户界面在显示屏上的显示。
27.本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
28.在一种可能的实施方式中,本发明实施例提供了一种情绪数据的识别方法,通过终端设备提供图形用户界面,其中,终端设备可以是前述提到的本地终端设备,也可以是前述提到的云交互系统中的客户端设备。
29.图1是根据本发明实施例的一种情绪数据的识别方法的流程图,如图1所示,该方法包括如下步骤:
30.步骤s102,获取游戏剧本中的对话数据,以及与上述对话数据对应的先验情绪特征,其中,上述先验情绪特征基于上述对话数据所处的游戏场景预先设定;
31.步骤s104,确定上述对话数据的句子编码向量,其中,上述句子编码向量用于表征上述对话数据对应的语义特征信息;
32.步骤s106,识别上述先验情绪特征与上述句子编码向量,得到上述对话数据的情绪识别结果。
33.在本公开实施例中,可以采用终端设备或者是服务器获取游戏剧本中的对话数据,上述对话数据中包括与上述对话数据对应的先验情绪特征;将获取到的对话数据中的句子作为输入,采用句子编码模块对上述句子进行编码处理,输出上述句子编码向量;并识别上述先验情绪特征与上述句子编码向量,得到上述对话数据的情绪识别结果。
34.需要说明的是,上述终端设备与上述服务器可以用于运行上述情绪数据的识别方法;上述获取游戏剧本中的对话数据可以同时获取多个对话数据,得到对话数据集;上述先验情绪特征基于上述对话数据所处的游戏场景预先设定;上述句子编码向量用于表征上述对话数据对应的语义特征信息,让模型理解当前的句子的意思。
35.作为一种可选的实施例,游戏剧本写作者会为每段剧本中的每个角色根据上述游戏场景预设先验情绪特征,上述先验情绪特征暗含了作者想要传达给玩家的信息;但是,现
有的文本情绪识别技术,主要包括单句建模和对话建模两种方式。单句建模只关注当前的句子的文本信息,由情感分析技术迁移而来,通过设计一个编码器抽取句子的特征,再利用一个全连接层映射进行分类输出。对话建模通过把当前句子的上下文也纳入建模,即考虑整段对话;通过给对话中的句子进行时序编码,为所有句子进行特征提取,并进行分类,或是将对话中的句子展开拼接成一个长句子,拼接完成后进行编码、分类。然而,无论是单句建模还是多句建模,都是只关注于文本本身信息,而忽略了先验情绪特征的影响。
36.通过本公开实施例的技术方案,可以让游戏制作者自由调节每个游戏角色的预设情绪,为剧本对话中每个游戏角色都返回更符合游戏制作者理想中的情绪。上述终端设备或服务器可以预先设定上述对话数据,以及与上述对话数据对应的先验情绪特征;根据游戏制作者给予的预设先验情绪信息,上述终端设备与上述服务器经过处理后从剧本对话文本中返回合理的情绪,使其更符合游戏制作者的心理预期。采用本方案,通过人工智能技术,可以自动地为剧本中每句话标记情绪,大大加快游戏开发的效率,节省时间成本。同时,制作者可以有更多的时间关注到剧本的撰写和表情的建模上,提高游戏的质量,吸引更多的玩家。
37.在一种可选的实施例中,上述方法还包括:
38.步骤s202,获取预训练语料,其中,上述预训练语料是基于上述游戏剧本的剧本类型获取到的语料;
39.步骤s204,采用上述预训练语料对初始识别模型进行训练,得到语言模型,其中,上述初始识别模型为使用全词掩盖识别处理的掩码语言模型。
40.在本公开实施例中,如图2所示的情绪识别方法流程图,基于上述游戏剧本的剧本类型获取上述预训练语料;采用上述预训练语料对初始识别模型进行训练,得到语言模型。
41.需要说明的是,仍如图2所示,在训练阶段,首先采用预训练语料先训练一个语言模型,然后采用带有标签数据的游戏对话数据集进行语言模型的训练。上述预训练语料可以通过与游戏风格类似的大规模领域语料上获取,例如:上述游戏剧本为武侠类的风格,那么可以从自己的剧本以及其他武侠类小说、游戏中获取上述预训练语料,且上述预训练语料的形式不仅仅局限于对话,可以使上述语言模型获得更多领域知识,上述语言模型的训练过程中,可以通过情绪标签信息得到先验的情绪分布特征;上述初始识别模型为使用全词掩盖识别处理的掩码语言模型(whole word masking masked language model,wwm mlm)。
42.作为一种可选的实施例,通过大规模从游戏风格相似的其他游戏中获取上述预训练语料,能够使训练出的语言模型具有更好的识别、训练效果。
43.在一种可选的实施例中,上述确定上述对话数据的句子编码向量,包括:
44.步骤s302,采用上述语言模型对上述对话数据进行句子编码处理,得到上述句子编码向量。
45.在本公开实施例中,如图3所示的情绪识别模型的流程示意图,采用编码器对上述对话数据进行句子编码处理,得到上述句子编码向量。
46.需要说明的是,上述编码器接受上述对话数据作为输入,并输出该对话数据编码后的句子编码向量。在本公开实施例中,采用上述语言模型作为编码器;该模型通过在游戏风格相似的大规模语料上进行预训练,得到训练参数,并使用上述参数进行初始化处理,能
够直接从对话数据中获取到有用的信息,让模型不至于完全只关注到先验情绪分布部分。
47.在一种可选的实施例中,上述识别上述先验情绪特征与上述句子编码向量,得到上述对话数据的情绪识别结果包括:
48.步骤s402,将上述先验情绪特征与上述句子编码向量进行拼接处理,得到待识别数据;
49.步骤s404,将上述待识别数据输入至情绪识别模型,并接收上述情绪识别模型输出的上述情绪识别结果,其中,上述情绪识别模型用于对上述待识别数据进行情绪识别,确定上述情绪识别结果,上述情绪识别模型是采用预先获取的标签数据集训练上述语言模型得到的。
50.在本公开实施例中,仍如图3所示,将上述先验情绪特征与上述句子编码向量进行拼接处理,得到待识别数据;将上述待识别数据输入至情绪识别模型,并接收上述情绪识别模型输出的上述情绪识别结果。
51.需要说明的是,上述情绪识别模型用于对上述待识别数据进行情绪识别,确定上述情绪识别结果,上述情绪识别模型是采用预先获取的标签数据集训练上述语言模型得到的;上述标签数据集是有情绪标注的对话数据集,可以用于对上述语言模型进行训练,即,上述标签数据集也是一个训练集。
52.在本公开实施例中,上述情绪识别模型也可以作为情绪预测模块,上述情绪识别模型是一个多层感知机(multi-layer perceptron,mlp),将上述句子编码向量和上述先验情绪特征的拼接处理结果作为输入,经识别处理后输出最终情绪识别结果。
53.在本公开实施例中,上述先验情绪特征的构造是本公开的核心所在。正常情况下,每个上述对话数据都只会有一个情绪,并且已有的上述对话数据集中不存在创作者预设的先验情绪特征。因此,可以通过统计的方法来获得这段对话中每个角色的情绪分布,以近似模拟作者预设的先验情绪分布;此外,还需要对获得的每个角色的情绪分布进行平滑化处理;首先对所有获得的情绪进行均匀化分布,再加上统计的情绪分布,采用四舍五入的方式保留两位小数,从而抑制模型过拟合的风险,提高模型的泛化能力;得到平滑先验情绪分布后,拼接到该说话人说的每一句话的句子编码向量上,并让模型不断缩减预测的情绪与真实情绪之间的差异,以此来训练模型。
54.在本公开实施例中,仍如图2所示,在预测阶段,由于没办法通过统计的方法获得情绪分布,同时也为了减少人工操作,预测阶段的先验情绪特征分布设置为独热向量,可以由创作者自行决定该角色在这段对话中的最主要情绪。在预测时采取独热分布,因此从上述对话数据中获取情绪信息的上述语言模型非常重要。在上述预测阶段中,接受输入的新的对话数据集(此时的对话数据集是没有情绪标签的),以及游戏制作者预先设定的先验情绪(此时不需要进行平滑化处理),用上述语言模型预测得到该句对话数据的对应情绪。如图3所示,在预测阶段,制作者只需要简单地根据当前场景预先设定一个说话人的先验情绪是喜,那么上述语言模型会根据不同的句子以及先验情绪自动判断该说话人不同的对话数据的对应情绪。
55.在一种可选的实施例中,上述方法还包括:
56.步骤s502,获取标签数据集,其中,上述标签数据集包括:多组标签数据,上述多组标签数据中的每组数据包括:样本游戏剧本中的样本对话数据和样本游戏角色、以及对同
一游戏角色相关的不同上述样本对话数据进行语言分析处理,得到的每个上述游戏角色的情绪分布特征;
57.步骤s504,采用上述标签数据集训练上述语言模型,得到上述情绪识别模型。
58.在本公开实施例中,获取有情绪标注的对话数据集,即上述标签数据集;并采用上述标签数据集训练上述语言模型,得到上述情绪识别模型。
59.需要说明的是,上述标签数据集包括:多组标签数据,上述多组标签数据中的每组数据包括:样本游戏剧本中的样本对话数据和样本游戏角色、以及对同一游戏角色相关的不同上述样本对话数据进行语言分析处理,得到的每个上述游戏角色的情绪分布特征;上述标签数据集是有情绪标注的对话数据集,可以用于对上述语言模型进行训练,即,上述标签数据集也是一个训练集。
60.在一种可选的实施例中,上述采用上述标签数据集训练上述语言模型,得到情绪识别模型包括:
61.步骤s602,对上述标签数据集中的每个上述游戏角色的情绪分布特征进行平滑化处理,得到平滑处理后情绪分布特征;
62.步骤s604,确定上述样本对话数据的样本编码向量,其中,上述样本编码向量用于表征上述样本对话数据对应的语义特征信息;
63.步骤s606,将上述平滑处理后情绪分布特征与上述样本编码向量进行拼接处理,得到样本拼接结果;
64.步骤s608,采用上述样本拼接结果训练上述语言模型,得到上述情绪识别模型。
65.在本公开实施例中,需要对获得的每个角色的情绪分布特征进行平滑化处理;首先对所有获得的情绪进行均匀化分布,再加上统计的情绪分布,采用四舍五入的方式保留两位小数,从而抑制模型过拟合的风险,提高模型的泛化能力;得到平滑处理后的情绪分布特征,拼接到该说话人说的每一句话的上述句子编码向量上,得到样本拼接结果;采用上述样本拼接结果训练上述语言模型,并让模型不断缩减预测的情绪与真实情绪之间的差异,以此来训练模型,最终得到上述情绪识别模型。
66.需要说明的是,上述样本编码向量用于表征上述样本对话数据对应的语义特征信息。
67.通过本公开实施例,能够根据游戏制作者给予的预先设定的先验情绪特征,从剧本对话文本中返回合理的情绪,使其更符合游戏制作者的心理预期。同时,能大幅提高游戏开发效率,节省时间,能让游戏制作者更加关注于剧本的撰写和表情的建模上,提高游戏质量,吸引更多的玩家。
68.此外,仍需要说明的是,本实施例的可选或优选实施方式可以参见方法实施例中的相关描述,此处不再赘述。
69.根据本发明实施例,还提供了一种用于实施上述情绪数据的识别方法的装置实施例,图4是根据本发明实施例的一种情绪数据的识别装置的结构示意图,如图4所示,上述情绪数据的识别装置,包括:获取模块40、确定模块42和识别模块44,其中:
70.获取模块40,用于获取游戏剧本中的对话数据,以及与上述对话数据对应的先验情绪特征,其中,上述先验情绪特征基于上述对话数据所处的游戏场景预先设定;
71.确定模块42,用于确定上述对话数据的句子编码向量,其中,上述句子编码向量用
于表征上述对话数据对应的语义特征信息;
72.识别模块44,用于识别上述先验情绪特征与上述句子编码向量,得到上述对话数据的情绪识别结果。
73.需要说明的是,上述各个模块是可以通过软件或硬件来实现的,例如,对于后者,可以通过以下方式实现:上述各个模块可以位于同一处理器中;或者,上述各个模块以任意组合的方式位于不同的处理器中。
74.此处需要说明的是,上述获取模块40、确定模块42和识别模块44对应于方法实施例中的步骤s102至步骤s106,上述模块与对应的步骤所实现的实例和应用场景相同,但不限于上述方法实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在计算机终端中。
75.需要说明的是,本实施例的可选或优选实施方式可以参见方法实施例中的相关描述,此处不再赘述。
76.上述的情绪数据的识别装置还可以包括处理器和存储器,上述情绪数据的识别等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
77.处理器中包含内核,由内核去存储器中调取相应的程序单元,上述内核可以设置一个或以上。存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram),存储器包括至少一个存储芯片。
78.根据本技术实施例,还提供了一种计算机可读存储介质实施例。可选地,在本实施例中,上述计算机可读存储介质包括存储的程序,其中,在上述程序运行时控制上述计算机可读存储介质所在设备执行上述任意一种情绪数据的识别方法。
79.可选地,在本实施例中,上述计算机可读存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中,上述计算机可读存储介质包括存储的程序。
80.可选地,在程序运行时控制计算机可读存储介质所在设备执行以下功能:获取游戏剧本中的对话数据,以及与上述对话数据对应的先验情绪特征,其中,上述先验情绪特征基于上述对话数据所处的游戏场景预先设定;确定上述对话数据的句子编码向量,其中,上述句子编码向量用于表征上述对话数据对应的语义特征信息;识别上述先验情绪特征与上述句子编码向量,得到上述对话数据的情绪识别结果。
81.可选地,在程序运行时控制计算机可读存储介质所在设备执行以下功能:获取预训练语料,其中,上述预训练语料是基于上述游戏剧本的剧本类型获取到的语料;采用上述预训练语料对初始识别模型进行训练,得到语言模型,其中,上述初始识别模型为使用全词掩盖识别处理的掩码语言模型。
82.可选地,在程序运行时控制计算机可读存储介质所在设备执行以下功能:采用上述语言模型对上述对话数据进行句子编码处理,得到上述句子编码向量。
83.可选地,在程序运行时控制计算机可读存储介质所在设备执行以下功能:将上述先验情绪特征与上述句子编码向量进行拼接处理,得到待识别数据;将上述待识别数据输入至情绪识别模型,并接收上述情绪识别模型输出的上述情绪识别结果,其中,上述情绪识
别模型用于对上述待识别数据进行情绪识别,确定上述情绪识别结果,上述情绪识别模型是采用预先获取的标签数据集训练上述语言模型得到的。
84.可选地,在程序运行时控制计算机可读存储介质所在设备执行以下功能:获取标签数据集,其中,上述标签数据集包括:多组标签数据,上述多组标签数据中的每组数据包括:样本游戏剧本中的样本对话数据和样本游戏角色、以及对同一游戏角色相关的不同上述样本对话数据进行语言分析处理,得到的每个上述游戏角色的情绪分布特征;采用上述标签数据集训练上述语言模型,得到上述情绪识别模型。
85.可选地,在程序运行时控制计算机可读存储介质所在设备执行以下功能:对上述标签数据集中的每个上述游戏角色的情绪分布特征进行平滑化处理,得到平滑处理后情绪分布特征;确定上述样本对话数据的样本编码向量,其中,上述样本编码向量用于表征上述样本对话数据对应的语义特征信息;将上述平滑处理后情绪分布特征与上述样本编码向量进行拼接处理,得到样本拼接结果;采用上述样本拼接结果训练上述语言模型,得到上述情绪识别模型。
86.根据本技术实施例,还提供了一种处理器实施例。可选地,在本实施例中,上述处理器用于运行程序,其中,上述程序运行时执行上述任意一种情绪数据的识别方法。
87.本技术实施例提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为运行上述计算机程序以执行任意一项上述的情绪数据的识别方法。
88.本技术还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取游戏剧本中的对话数据,以及与上述对话数据对应的先验情绪特征,其中,上述先验情绪特征基于上述对话数据所处的游戏场景预先设定;确定上述对话数据的句子编码向量,其中,上述句子编码向量用于表征上述对话数据对应的语义特征信息;识别上述先验情绪特征与上述句子编码向量,得到上述对话数据的情绪识别结果。
89.本技术还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取预训练语料,其中,上述预训练语料是基于上述游戏剧本的剧本类型获取到的语料;采用上述预训练语料对初始识别模型进行训练,得到语言模型,其中,上述初始识别模型为使用全词掩盖识别处理的掩码语言模型。
90.本技术还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:采用上述语言模型对上述对话数据进行句子编码处理,得到上述句子编码向量。
91.本技术还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:将上述先验情绪特征与上述句子编码向量进行拼接处理,得到待识别数据;将上述待识别数据输入至情绪识别模型,并接收上述情绪识别模型输出的上述情绪识别结果,其中,上述情绪识别模型用于对上述待识别数据进行情绪识别,确定上述情绪识别结果,上述情绪识别模型是采用预先获取的标签数据集训练上述语言模型得到的。
92.本技术还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取标签数据集,其中,上述标签数据集包括:多组标签数据,
上述多组标签数据中的每组数据包括:样本游戏剧本中的样本对话数据和样本游戏角色、以及对同一游戏角色相关的不同上述样本对话数据进行语言分析处理,得到的每个上述游戏角色的情绪分布特征;采用上述标签数据集训练上述语言模型,得到上述情绪识别模型。
93.本技术还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:对上述标签数据集中的每个上述游戏角色的情绪分布特征进行平滑化处理,得到平滑处理后情绪分布特征;确定上述样本对话数据的样本编码向量,其中,上述样本编码向量用于表征上述样本对话数据对应的语义特征信息;将上述平滑处理后情绪分布特征与上述样本编码向量进行拼接处理,得到样本拼接结果;采用上述样本拼接结果训练上述语言模型,得到上述情绪识别模型。
94.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
95.在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
96.在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
97.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
98.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
99.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
100.以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。