一种数据分析方法、装置、计算机设备以及存储介质与流程

1.本公开涉及数据处理的技术领域，具体而言，涉及一种数据分析方法、装置、计算机设备以及存储介质。

背景技术：

2.随着科学技术的不断更迭发展，作为一种更加便捷的社交休闲方式，网络游戏逐渐走入人们的生活，但是随着网络游戏的类型和数量的增多，如今游戏市场的竞争也愈发激烈。就网络游戏的游戏开发人员而言，如何提高游戏玩家的游戏体验，从而更好的留住游戏玩家是亟待解决的问题。
3.然而，在现有的技术方案中，通常都是根据游戏运行数据，对单个玩家的流失概率进行预测。由于不同游戏玩家的游戏偏好都是不相同的，因此，在确定了流失可能的玩家之后根据游戏玩家的游戏偏好数据划分玩家类型更有助于游戏开发人员在游戏运营中对玩家进行精细化的干预以及策略调整。

技术实现要素：

4.本公开实施例至少提供一种数据分析方法、装置、计算机设备以及存储介质。
5.第一方面，本公开实施例提供了一种数据分析方法，包括：获取多个游戏玩家的游戏行为数据；基于所述游戏行为数据确定每个所述游戏玩家的流失数据，其中，所述流失数据包含：每个所述游戏玩家的流失概率和该游戏玩家的玩家类型；基于所述流失数据中的流失概率和玩家类型，确定每种玩家类型的玩家留存数据；所述玩家留存数据用于表征该玩家类型的游戏玩家的在未来时刻的留存估计结果。
6.一种可选的实施方式中，所述基于所述游戏行为数据确定每个所述游戏玩家的流失数据，包括：将所述游戏行为数据输入至预测模型进行数据预测处理，得到每个所述游戏玩家的流失概率；以及将所述游戏行为数据输入至聚类模型进行数据聚类处理，得到每个所述游戏玩家的玩家类型。
7.一种可选的实施方式中，所述基于所述流失数据中的流失概率和玩家类型，确定每种玩家类型的玩家留存数据，包括：在所述多个游戏玩家中确定流失概率大于第一阈值的目标游戏玩家；对所述目标游戏玩家及其所对应的玩家类型进行统计分析，分析得到每种玩家类型的游戏玩家的玩家留存数据。
8.一种可选的实施方式中，所述方法还包括：在确定出所述目标游戏玩家之后，对所述目标游戏玩家进行统计分析，得到目标统计结果，其中，所述目标统计结果包含以下至少之一：每个玩家类型中所包含的目标游戏玩家的数量、所述目标游戏玩家的游戏等级分布信息。
9.一种可选的实施方式中，所述将所述游戏行为数据输入至聚类模型进行数据聚类处理，得到每个所述游戏玩家的玩家类型，包括：获取所述游戏行为数据的采集时段目标游戏的游戏玩法，其中，所述目标游戏为所述多个游戏玩家所属的游戏；根据所述游戏玩法对
所述游戏行为数据进行特征提取，得到第一行为特征；通过所述聚类模型对所述第一行为特征进行特征聚类处理，得到每个所述游戏玩家的玩家类型。
10.一种可选的实施方式中，所述方法还包括：获取多个游戏玩家的历史行为数据，并根据所述历史行为数据确定训练样本，其中，所述训练样本中包含用于表征该历史行为数据所对应的游戏玩家的实际留存信息；根据所述训练样本分别对待训练的预测模型和待训练的聚类模型进行训练，训练之后得到所述预测模型和所述聚类模型。
11.一种可选的实施方式中，所述游戏行为数据包括以下至少之一：每个游戏玩家的角色信息、每个游戏玩家的消费行为信息、每个游戏玩家对游戏的操作行为信息。
12.一种可选的实施方式中，所述方法还包括：根据所述玩家留存数据，确定未来留存的可能性小于第二阈值的目标玩家类型；确定所述目标玩家类型所对应的游戏玩家的玩家特征信息；根据所述玩家特征信息确定与所述目标玩家类型相匹配的游戏数据；并向所属于所述目标玩家类型的游戏玩家推送所述游戏数据。
13.一种可选的实施方式中，所述通过所述聚类模型对所述第一行为特征进行特征聚类处理，得到每个所述游戏玩家的玩家类型，包括：基于所述游戏行为数据确定每个所述游戏玩家针对每个游戏玩法的投入度数据；基于所述投入度数据对所述多个游戏玩家进行聚类分组，得到聚类分组结果，并根据所述聚类分组结果确定每个所述游戏玩家的玩家类型。
14.第二方面，本公开实施例还提供一种数据分析装置，包括：获取模块，用于获取多个游戏玩家的游戏行为数据；第一确定模块，用于基于所述游戏行为数据确定每个所述游戏玩家的流失数据，其中，所述流失数据包含：每个所述游戏玩家的流失概率和该游戏玩家的玩家类型；第二确定模块，用于基于所述流失数据中的流失概率和玩家类型，确定每种玩家类型的玩家留存数据；所述玩家留存数据用于表征该玩家类型的游戏玩家的在未来时刻的留存估计结果。
15.第三方面，本公开实施例还提供一种计算机设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当计算机设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行上述第一方面，或第一方面中任一种可能的实施方式中的步骤。
16.第四方面，本公开实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述第一方面，或第一方面中任一种可能的实施方式中的步骤。
17.本公开实施例提供的数据分析方法、装置、计算机设备以及存储介质，通过对多个游戏玩家的游戏行为数据进行分析，得到每个游戏玩家的流失概率和玩家类型，可以通过流失概率和玩家类型实现对游戏玩家的流失情况进行分析，从而得到每种玩家类型的游戏玩家的未来留存的可能性，进而实现对游戏内游戏玩家的流失情况进行精细化分类分析，并根据该精细化分类分析的结果对游戏玩家执行相应的干预操作。
18.为使本公开的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。
附图说明
19.为了更清楚地说明本公开实施例的技术方案，下面将对实施例中所需要使用的附
图作简单地介绍，此处的附图被并入说明书中并构成本说明书中的一部分，这些附图示出了符合本公开的实施例，并与说明书一起用于说明本公开的技术方案。应当理解，以下附图仅示出了本公开的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。
20.图1示出了本公开实施例所提供的一种数据分析方法的流程图；
21.图2示出了本公开实施例所提供的数据分析方法中，流失数据表格的示意图；
22.图3示出了本公开实施例所提供的数据分析方法中，另一种流失数据表格的示意图；
23.图4示出了本公开实施例所提供的数据分析方法中，游戏玩家画像的示意图；
24.图5示出了本公开实施例所提供的数据分析方法中，待训练的预测模型的训练过程的流程图；
25.图6示出了本公开实施例所提供的数据分析方法中，待训练的聚类模型的训练过程的流程图；
26.图7示出了本公开实施例所提供的数据分析方法中，确定每种玩家类型的玩家留存数据的方法的流程图；
27.图8示出了本公开实施例所提供的一种数据分析装置的示意图；
28.图9示出了本公开实施例所提供的一种计算机设备的示意图。
具体实施方式
29.为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围，而是仅仅表示本公开的选定实施例。基于本公开的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本公开保护的范围。
30.应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。
31.本文中术语“和/或”，仅仅是描述一种关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。另外，本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合，例如，包括a、b、c中的至少一种，可以表示包括从a、b和c构成的集合中选择的任意一个或多个元素。
32.经研究发现，在现有的技术方案中，通常都是根据游戏运行数据，对玩家的流失概率进行预测，游戏开发人员往往需要结合对游戏理解对游戏运营进行调整，因此，无助于游戏开发人员对游戏运营进行精细化的干预以及策略调整。
33.基于上述研究，本公开提供了一种数据分析方法、装置、计算机设备以及存储介质，通过对多个游戏玩家的游戏行为数据进行分析，得到每个游戏玩家的流失概率和玩家类型，可以通过流失概率和玩家类型实现对游戏玩家的流失情况进行分析，从而得到每种玩家类型的游戏玩家的玩家留存数据，进而实现对游戏内游戏玩家的流失情况进行精细化
分类分析，并根据该精细化分类分析的结果对游戏玩家执行相应的干预操作。
34.为便于对本实施例进行理解，首先对本公开实施例所公开的一种数据分析方法进行详细介绍，本公开实施例所提供的数据分析方法的执行主体一般为具有一定计算能力的计算机设备。在一些可能的实现方式中，该数据分析方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
35.参见图1所示，为本公开实施例提供的一种数据分析方法的流程图，所述方法包括步骤s101～s105，其中：
36.s101：获取多个游戏玩家的游戏行为数据。
37.在本公开实施例中，可以在游戏日志中获取多个游戏玩家的游戏行为数据。这里，游戏行为数据可以包括以下至少之一：每个游戏玩家的角色信息、每个游戏玩家的消费行为信息、每个游戏玩家对游戏的操作行为信息。
38.在获取多个游戏玩家的游戏行为数据时，可以确定数据获取标准，之后，按照该数据获取标准在游戏日志中获取多个游戏玩家的游戏行为数据。
39.这里，数据获取标准可以包含以下至少之一：游戏玩家的年龄、游戏玩家的性别、目标游戏的游戏职业。
40.例如，在获取上述游戏行为数据时，可以确定用于获取游戏行为数据的预设时间，并在游戏日志中获取该预设时间内操作目标游戏的全部游戏玩家的游戏行为数据；或者，也可以确定需要获取游戏行为数据的预设游戏玩家的年龄，筛选出符合预设游戏玩家的年龄的游戏玩家，并在游戏日志中获取对应的游戏玩家的游戏行为数据，从而帮助游戏开发人员更好的掌握游戏节奏以及控制玩家流失趋势。
41.s103：基于所述游戏行为数据确定每个所述游戏玩家的流失数据，其中，所述流失数据包含：每个所述游戏玩家的流失概率和该游戏玩家的玩家类型。
42.这里，上述流失数据可以存储在流失数据表格中，在该流失数据表格中包含上述所描述的流失概率和/或玩家类型。
43.如图2所示即为一种可选的流失数据表格，如图2所示，该流失数据表格包含：角色id，流失概率和玩家类型。其中，该角色id为每个游戏玩家所对应游戏角色的身份信息。具体地：
44.字段“角色id”一栏下对应的内容为每个上述游戏玩家在目标游戏中的角色id，例如，该角色id可以为该游戏玩家的角色名，或者id号(通常为若干位字符)，图2所示为游戏玩家的id号。
45.字段“流失概率”一栏下对应的内容为相对应角色id所对应的游戏玩家的流失概率，例如，该游戏玩家的流失概率为0.85，则说明在当前游戏版本中，该游戏玩家的流失概率为0.85。
46.字段“玩家类型”一栏下对应的内容为该角色id对应游戏玩家的玩家类型，即该游戏玩家对目标游戏中的不同类型的游戏玩法的偏好，例如，该游戏玩家的偏好为竞技类玩法，则该游戏玩家的玩家类型为pvp(player vs player，即玩家对战)，其中，该玩家类型为游戏开发人员根据目标游戏的游戏玩法进行设置的，该玩家类型用于指示游戏玩家在目标游戏中所进行的游戏行为的偏好。
47.这里，针对每个游戏玩家，玩家类型可以对应设置一个或多个类型信息，本公开对
此不作具体限定。
48.s105：基于所述流失数据中的流失概率和玩家类型，确定每种玩家类型的玩家留存数据；所述玩家留存数据用于表征该玩家类型的游戏玩家的在未来时刻的留存估计结果。
49.在本公开实施例中，可以结合上述流失数据中的每个游戏玩家的玩家类型以及流失概率，确定上述目标游戏中所属于每种玩家类型的游戏玩家的玩家留存数据。
50.在确定上述目标游戏中玩家类型为pvp型的游戏玩家的玩家留存数据时，可以按照预设周期计算该pvp型的游戏玩家的玩家留存数据。
51.具体实施时，可以按照预设周期获取目标日期范围内的游戏行为数据，进而根据该目标日期游戏范围内的游戏行为数据，确定游戏玩家的玩家留存数据。其中，预设周期和目标日期范围可以为预先设定的数值，例如，预设周期可以设定为一天，目标日期范围可以设定为一周，此时，可以每隔一天对包含当前天之前七天内的游戏行为数据确定游戏玩家的玩家留存数据。预设周期除了为上述一天，目标日期范围除了为上述一周之外，还可以根据实际需要设定为其他数值，本公开对此不作具体限定，以能够实现为准。
52.例如，预设周期可以设置为一天，即每隔一天获取包含当前天之前七天内的游戏行为数据，进而根据该游戏行为数据计算pvp型的游戏玩家在下一周的留存的可能性(即，留存估计结果)。在计算出pvp型的游戏玩家在下一周的流失概率为0.61时，就可以确定pvp型的玩家在下一周的玩家留存数据为0.39，即pvp型的游戏玩家在下一周留存的可能性为0.39。
53.通过上述描述可知，在本公开实施例中，通过对多个游戏玩家的游戏行为数据进行分析，得到每个游戏玩家的流失概率和玩家类型，可以通过流失概率和玩家类型实现对游戏玩家的流失情况进行分析，从而得到每种玩家类型的游戏玩家的玩家留存数据，进而实现对游戏内游戏玩家的流失情况进行精细化分类分析，并根据该精细化分类分析的结果对游戏玩家执行相应的干预操作。
54.在本公开实施例中，获取多个游戏玩家的游戏行为数据时，所述游戏行为数据包括以下至少之一：每个游戏玩家的角色信息、每个游戏玩家的消费行为信息、每个游戏玩家对游戏的操作行为信息。
55.这里，每个游戏玩家的角色信息可以包含该游戏玩家的角色id、该游戏玩家的角色等级，该游戏玩家的游戏职业等基础信息。
56.每个游戏玩家的消费行为信息可以包含该游戏玩家在目标游戏内的消费金额以及消费类型等。其中，该消费类型可以为游戏币消费或者目标游戏所允许支付的任一法定货币，例如，上述游戏币可以为游戏玩家在目标游戏中通过游戏玩法获得的虚拟货币，上述法定货币可以为人民币等。
57.每个游戏玩家对游戏的操作行为信息可以包含上述游戏玩家所进行的多种类型的操作行为的具体信息，例如，该游戏玩家在一定时长内的登陆次数，该游戏玩家所进行的不同类型的游戏玩法次数等。
58.应理解的是，上述游戏行为数据只涉及游戏内玩家的行为数据，不包括游戏玩家的玩家信息，例如该游戏玩家的性别、年龄、操作系统等。
59.通过上述描述可知，在本公开实施例中，可以获取游戏玩家的多种游戏行为数据，
通过多种类型的游戏行为数据可以提高对游戏玩家的流失数据预测的准确性。
60.在本公开实施例中，s103，基于所述游戏行为数据确定每个所述游戏玩家的流失数据，具体包括以下步骤：
61.步骤s1031：
62.将所述游戏行为数据输入至预测模型进行数据预测处理，得到每个所述游戏玩家的流失概率。
63.需要说明的是，在将上述游戏行为数据输入至预测模型进行数据预测处理前，可以先对该游戏行为数据进行预处理，得到用于预测游戏玩家的流失概率的相关行为特征，其中，该预处理可以为数据清洗处理和特征提取处理。
64.在本公开实施例中，上述预测模型可以为基于历史数据预先训练好的用于进行游戏玩家流失概率预测的分类模型，例如，迭代决策树模型(xgboost)，该预测模型通过相关特征节点对输入的和玩家留存相关的相关特征进行处理。除了迭代决策树模型之外，该预测模型还可以为其他能够替代该迭代决策树模型的模型，本公开对此不作具体限定。
65.步骤s1032：
66.将所述游戏行为数据输入至聚类模型进行数据聚类处理，得到每个所述游戏玩家的玩家类型。
67.在本公开实施例中，通过聚类模型对游戏行为数据进行数据聚类处理，通过该聚类处理，可以得到游戏玩家的玩家类型。
68.具体的，在对游戏行为数据进行数据聚类处理时，可以根据游戏玩家对于不同游戏玩法的投入度数据来确定该游戏玩家的玩家类型。
69.在一种可选的实施方式中，该投入度数据可以表征游戏玩家对于不同类型的游戏玩法的参与深度(如参与时长、参与次数等)。例如，若根据该投入度数据确定该游戏玩家对于pvp型的游戏玩法的玩法时长或次数最多时，那么就可以确定该游戏玩家为pvp型玩家。
70.在一个可选的实施方式中，上述步骤s1032：将所述游戏行为数据输入至聚类模型进行数据聚类处理，得到每个所述游戏玩家的玩家类型，具体包括如下过程：
71.(1)获取所述游戏行为数据的采集时段目标游戏的游戏玩法，其中，所述目标游戏为所述多个游戏玩家所属的游戏。
72.(2)根据所述游戏玩法确定玩法所对应的游戏行为数据，进行特征提取，得到第一行为特征。
73.(3)通过所述聚类模型对所述第一行为特征进行特征降维处理，得到每个所述游戏玩家的游戏玩法投入度指标。
74.在本公开实施例中，为更好的监测玩家在玩法偏好上的变动情况，需要在实施开始前确定好大致的玩法类型(如：pvp玩法、pve玩法)，以及各玩法方向所对应的具体玩法内容。
75.在确定出游戏玩法类型和对应的游戏玩法具体内容之后，对上述游戏行为数据进行特征提取，得到第一行为特征。之后，对该第一行为特征进行降维处理，最后得到和确定好的玩法类型数量一致的特征维度指标。
76.在对第一行为特征进行降维处理之后，就可以根据降维后各个特征维度指标与第一行为特征对应的权重，计算得到每个玩法在各个降维后特征维度指标所对应的游戏玩法
类型上的玩法投入度数据。具体聚类降维过程描述如下：
77.针对每个游戏玩法，可能对应多个子玩法，例如，针对游戏玩法pvp，其所包含的多个子玩法可以为“排位”、“匹配”、“好友切磋”以及“擂台”等子玩法。此时，针对每个子玩法，可以根据游戏行为数据确定游戏玩家针对每个子玩法的投入数据，例如，针对每个子玩法的游戏场次、货币投入等数据。在确定出游戏玩家针对每个子玩法的投入数据之后，就可以对多个子玩法的投入数据进行数据拟合，从而得到游戏玩家针对多个子玩法所对应的游戏玩法的投入度数据。
78.在基于第一行为特征计算得到游戏玩家针对每个游戏玩法的投入度数据之后，可以获取游戏玩家针对每个游戏玩法的层次划分阈值。之后，可以根据该层次划分阈值，划分每个游戏玩家针对每个游戏玩法的投入层次或者偏好层次，例如，投入层次或者层次等级可以为：低层次、中层次、高层次。在确定出每个游戏玩家针对每个游戏玩法的投入层次或者偏好层次之后，就可以根据上述划分结果确定每个游戏玩家的玩家类型。
79.这里，可以根据投入度层次满足要求的游戏玩法确定该游戏玩家的玩家类型。例如，可以将投入度层次最高的游戏玩法确定该游戏玩家的玩家类型。
80.通过上述描述可知，可以分别通过预测模型以及聚类模型输出得到游戏玩家的流失概率以及玩家类型，从而有助于游戏开发人员了解玩家类型和流失概率的之间的联系，并对游戏运营进行精细化的干预以及策略调整。
81.在本公开实施例中，步骤s105，所述基于所述流失数据中的流失概率和玩家类型，确定每种玩家类型的玩家留存数据，具体包括如下过程：
82.(1)在所述多个游戏玩家中确定流失概率大于第一阈值的目标游戏玩家。
83.(2)对所述目标游戏玩家及其所对应的玩家类型进行统计分析，分析得到每种玩家类型的游戏玩家的玩家留存数据。
84.在本公开实施例中，可以设置用于筛选流失概率较高的目标游戏玩家的第一阈值，例如，可以设置该第一阈值为0.65。除了0.65之外，还可以设置第一阈值为其他数值，本公开对此不作具体限定。在本公开实施例中，可以通过图3所示的展示窗口展示该流失数据表格中的数据，例如，可以在上述展示窗口中底部设置流失玩家看板展示栏，该流失玩家看板展示栏用于展示上述第一阈值。除此之外，还可以在展示窗口中对流失概率大于等于该第一阈值的目标游戏玩家进行标记。例如，该第一阈值为0.65，如图3所示，则可以对大于0.65的流失概率所对应的游戏玩家的角色id进行字体加粗，或者对该大于0.65的流失概率所对应的游戏玩家的角色id添加红色高亮背景等，该红色高亮背景在图3中未示出。
85.在筛选出流失概率大于上述第一阈值的目标游戏玩家之后，就可以结合该目标游戏玩家所对应的玩家类型，对每种玩家类型进行统计分析，从而得到玩家留存数据。
86.通过上述描述可知，在本公开实施例中，可以通过第一阈值筛选出流失概率较大的目标游戏玩家，并分析得到每种玩家类型的游戏玩家的玩家留存数据，从而提高了游戏开发人员对玩家流失留存情况的分析，并结合玩家类型所对应的玩法偏好情况进行精细化干预。
87.在本公开实施例中，在对所述目标游戏玩家及其所对应的玩家类型进行统计分析，分析得到每种玩家类型的游戏玩家的玩家留存数据时，具体包括如下过程：
88.在确定出所述目标游戏玩家之后，对所述目标游戏玩家进行统计分析，得到目标
统计结果，其中，所述目标统计结果包含以下至少之一：每个玩家类型中所包含的目标游戏玩家的数量、所述目标游戏玩家的游戏等级。
89.具体实施时，在确定出上述目标游戏玩家后，可以确定全部目标游戏玩家的玩家类型，从而得到至少一个玩家类型。针对至少一个玩家类型中的每个玩家类型，可以确定目标游戏玩家中所属于每个玩家类型的玩家数量，从而根据该玩家数量确定目标统计结果。
90.具体实施时，在确定出上述目标游戏玩家后，还可以通过获取每个目标游戏玩家的玩家属性确定对应目标游戏玩家的游戏等级。
91.在本公开实施例中，在按照上述方式得到目标统计结果之后，还可以基于该目标统计结果为目标游戏玩家确定相应的游戏数据，并向该目标游戏玩家推送相应的游戏数据。
92.在一个可选的实施方式中，可以基于目标游戏玩家的游戏等级确定该目标游戏玩家所属的等级区间，之后，基于该等级区间和该目标游戏玩家的玩家类型，确定与该目标游戏玩家相匹配的游戏数据。例如，该游戏数据可以为所属于该玩家类型且符合该等级区间的游戏数据。
93.在另一个可选的实施方式中，可以根据每个玩家类型中所包含的目标游戏玩家的数量，估算每个玩家类型下游戏玩家的流失情况；之后，就可以根据不同的流失情况为不同玩家类型的目标游戏玩家推送相匹配的游戏数据。
94.通过上述描述可知，在本公开实施例中，可以通过每个玩家类型中的目标游戏玩家的数量，确定该玩家类型中的玩家留存数据，从而提高了游戏开发人员进行游戏数据分析时的分析效率，比提高了分析结果的准确性。
95.在本公开实施例中，在通过预测模型以及聚类模型对玩家行为数据进行处理前，首先需要对待训练的预测模型以及待训练的聚类模型进行训练，从而得到预测模型以及聚类模型，具体训练过程如下：
96.(1)获取多个游戏玩家的历史行为数据，并根据所述历史行为数据确定训练样本，其中，所述训练样本中包含用于表征该历史行为数据所对应的游戏玩家的实际留存信息。
97.(2)根据所述训练样本分别对待训练的预测模型和待训练的聚类模型进行训练，训练之后得到所述预测模型和所述聚类模型。
98.在本公开实施例中，在对上述待训练的预测模型进行训练时，首先确定多个游戏玩家作为样本玩家，并获取样本玩家的历史行为数据以及当前的实际留存信息作为训练样本。需要说明的是，该训练样本应包含实际留存信息为留存的游戏玩家作为负样本，实际留存信息为流失的游戏玩家作为正样本。
99.这里，待训练的预测模型的数量可以为多个，且待训练的聚类模型的数量也可以为多个。具体实施时，可以将训练样本分别输入至每个待训练的预测模型和每个待训练的聚类模型中进行处理，从而得到每个待训练的预测模型和每个待训练的聚类模型的训练结果。之后，就可以多个训练结果中最优训练结果所对应的预测模型作为最终的预测模型，并将最优训练结果所对应的聚类模型作为最终的预测模型。
100.在本公开实施例中，如图5所示，对待训练的预测模型的训练过程可以描述如下：
101.s51：将训练样本输入到该待训练的预测模型中，得到预测结果；
102.s52：将该预测结果和当前的实际留存信息进行对比，得到预测差异值；其中，该预
测差异值用于表征该待训练的预测模型的预测精度；
103.s53：判断该预测差异值是否满足预测差异值要求，若满足，则执行s54，若不满足，则执行s55。
104.s54：得到预测模型。
105.s55：调整待训练的预测模型的模型参数，并重复执行上述步骤。
106.在本公开实施例中，在对上述待训练的聚类模型进行训练时，首先确定多个游戏玩家作为样本玩家，并获取样本玩家的历史行为数据以及当前的玩家类型信息作为训练样本。
107.在本公开实施例中，如图6所示，对待训练的聚类模型的训练过程可以描述如下：
108.s61：将训练样本输入到该待训练的聚类模型中，得到预测聚类结果；
109.s62：将该预测聚类结果和当前游戏玩家的实际玩家类型进行对比；
110.s63：判断预测聚类结果是否和当前游戏玩家的实际玩家类型信息相匹配，若匹配，则执行s64，若不匹配，则执行s65。
111.s64：得到聚类模型。
112.s65：调整待训练的聚类模型的模型参数，并重复执行上述步骤。
113.通过上述描述可知，在本公开实施例中，可以通过对待训练的预测模型以及待训练的聚类模型进行训练的方式，得到预测模型以及聚类模型，从而提高预测模型的预测精度以及聚类模型的聚类准确性。
114.在本公开实施例中，还可以通过第二阈值对目标玩家类型进行筛选，并向目标玩家类型的游戏玩家推送游戏数据，具体过程如下：
115.(1)根据所述玩家留存数据，确定未来留存的可能性小于第二阈值的目标玩家类型。
116.(2)确定所述目标玩家类型所对应的游戏玩家的玩家特征信息。
117.(3)根据所述玩家特征信息确定与所述目标玩家类型相匹配的游戏数据；并向所属于所述目标玩家类型的游戏玩家推送所述游戏数据。
118.在本公开实施例中，首先可以设置用于筛选未来留存的可能性较小的目标玩家类型的第二阈值。其中，该第二阈值可以对不同玩家类型的玩家留存数据进行筛选。
119.例如，该第二阈值可以为固定值，如0.65。那么，当该游戏玩家的流失概率为0.35时，该游戏玩家的未来留存的可能性为0.65，因此，就可以将未来留存的可能性小于0.65的玩家类型确定为目标玩家类型。或者，该第二阈值可以为范围值，如0.65-0.85，则判断未来留存的可能性在0.65-0.85之间的玩家类型为目标玩家类型。
120.在本公开实施例中，提供了一种确定每种玩家类型的玩家留存数据的方法，如图7所示，该方法包括如下几个阶段：
121.第一：模型训练阶段。
122.获取多个游戏玩家的历史行为数据，并根据所述历史行为数据确定训练样本，其中，所述训练样本中包含用于表征该历史行为数据所对应的游戏玩家的实际留存信息。根据所述训练样本分别对待训练的预测模型和待训练的聚类模型进行训练，训练之后得到所述预测模型和所述聚类模型。
123.第二：数据分析结果。
124.获取多个游戏玩家的游戏行为数据，然后，将多个游戏玩家的游戏行为数据输入到预测模型以及聚类模型中，得到每个游戏玩家的流失概率和该游戏玩家的玩家类型，具体的流失概率以及玩家类型的预测过程如上所述，此处不再赘述。最后，对上述每个游戏玩家的流失概率和该游戏玩家的玩家类型进行分析，从而得到每种玩家类型的玩家留存数据。具体分析过程如上所处，此处不再详细赘述。
125.通过上述描述可知，在本公开实施例中，可以通过第二阈值对目标玩家类型进行筛选，并向目标玩家类型的游戏玩家推送游戏数据的方式，便于游戏开发人员对玩家流失原因进行把握并及时调整游戏运行策略，且提高了游戏玩家的游戏体验。
126.本领域技术人员可以理解，在具体实施方式的上述方法中，各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定，各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
127.基于同一发明构思，本公开实施例中还提供了与数据分析方法对应的数据分析装置，由于本公开实施例中的装置解决问题的原理与本公开实施例上述数据分析方法相似，因此装置的实施可以参见方法的实施，重复之处不再赘述。
128.参照图8所示，为本公开实施例提供的一种数据分析装置的示意图，所述装置包括：获取模块81、第一确定模块82、第二确定模块83；其中，
129.获取模块81，用于获取多个游戏玩家的游戏行为数据；
130.第一确定模块82，用于基于所述游戏行为数据确定每个所述游戏玩家的流失数据，其中，所述流失数据包含：每个所述游戏玩家的流失概率和该游戏玩家的玩家类型；
131.第二确定模块83，用于基于所述流失数据中的流失概率和玩家类型，确定每种玩家类型的玩家留存数据；所述玩家留存数据用于表征该玩家类型的游戏玩家的在未来时刻的留存估计结果。
132.本公开实施例通过对多个游戏玩家的游戏行为数据进行分析，得到每个游戏玩家的流失概率和玩家类型，可以通过流失概率和玩家类型实现对游戏玩家的流失情况进行分析，从而得到每种玩家类型的游戏玩家的玩家留存数据，进而实现对游戏内游戏玩家的流失情况进行精细化分类分析，并根据该精细化分类分析的结果对游戏玩家执行相应的干预操作。。
133.一种可能的实施方式中，第一确定模块82，还用于：将所述游戏行为数据输入至预测模型进行数据预测处理，得到每个所述游戏玩家的流失概率；以及将所述游戏行为数据输入至聚类模型进行数据聚类处理，得到每个所述游戏玩家的玩家类型。
134.一种可能的实施方式中，第二确定模块83，还用于：在所述多个游戏玩家中确定流失概率大于第一阈值的目标游戏玩家；对所述目标游戏玩家及其所对应的玩家类型进行统计分析，分析得到每种玩家类型的游戏玩家的玩家留存数据。
135.一种可能的实施方式中，第二确定模块83，还用于：在确定出所述目标游戏玩家之后，对所述目标游戏玩家进行统计分析，得到目标统计结果，其中，所述目标统计结果包含以下至少之一：每个玩家类型中所包含的目标游戏玩家的数量、所述目标游戏玩家的游戏等级分布信息。
136.一种可能的实施方式中，第一确定模块82，还用于：获取所述游戏行为数据的采集时段目标游戏的游戏玩法，其中，所述目标游戏为所述多个游戏玩家所属的游戏；根据所述
游戏玩法对所述游戏行为数据进行特征提取，得到第一行为特征；通过所述聚类模型对所述第一行为特征进行特征聚类处理，得到每个所述游戏玩家的玩家类型。
137.一种可能的实施方式中，第一确定模块82，还用于：获取多个游戏玩家的历史行为数据，并根据所述历史行为数据确定训练样本，其中，所述训练样本中包含用于表征该历史行为数据所对应的游戏玩家的实际留存信息；根据所述训练样本分别对待训练的预测模型和待训练的聚类模型进行训练，训练之后得到所述预测模型和所述聚类模型。
138.一种可能的实施方式中，所述游戏行为数据包括以下至少之一：每个游戏玩家的角色信息、每个游戏玩家的消费行为信息、每个游戏玩家对游戏的操作行为信息。
139.一种可能的实施方式中，该装置还用于：根据所述玩家留存数据，确定未来留存的可能性小于第二阈值的目标玩家类型；确定所述目标玩家类型所对应的游戏玩家的玩家特征信息；根据所述玩家特征信息确定与所述目标玩家类型相匹配的游戏数据；并向所属于所述目标玩家类型的游戏玩家推送所述游戏数据。
140.一种可能的实施方式中，第一确定模块82，还用于：基于所述游戏行为数据确定每个所述游戏玩家针对每个游戏玩法的投入度数据；基于所述投入度数据对所述多个游戏玩家进行聚类分组，得到聚类分组结果，并根据所述聚类分组结果确定每个所述游戏玩家的玩家类型。
141.关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明，这里不再详述。
142.对应于图1中的数据分析方法，本公开实施例还提供了一种计算机设备900，如图9所示，为本公开实施例提供的计算机设备900结构示意图，包括：
143.处理器91、存储器92、和总线93；存储器92用于存储执行指令，包括内存921和外部存储器922；这里的内存921也称内存储器，用于暂时存放处理器91中的运算数据，以及与硬盘等外部存储器922交换的数据，处理器91通过内存921与外部存储器922进行数据交换，当所述计算机设备900运行时，所述处理器91与所述存储器92之间通过总线93通信，使得所述处理器91执行以下指令：
144.获取多个游戏玩家的游戏行为数据；基于所述游戏行为数据确定每个所述游戏玩家的流失数据，其中，所述流失数据包含：每个所述游戏玩家的流失概率和该游戏玩家的玩家类型；基于所述流失数据中的流失概率和玩家类型，确定每种玩家类型的玩家留存数据；所述玩家留存数据用于表征该玩家类型的游戏玩家的在未来时刻的留存估计结果。
145.本公开实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述方法实施例中所述的数据分析方法的步骤。其中，该存储介质可以是易失性或非易失的计算机可读取存储介质。
146.本公开实施例还提供一种计算机程序产品，该计算机程序产品承载有程序代码，所述程序代码包括的指令可用于执行上述方法实施例中所述的数据分析方法的步骤，具体可参见上述方法实施例，在此不再赘述。
147.其中，上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中，所述计算机程序产品具体体现为计算机存储介质，在另一个可选实施例中，计算机程序产品具体体现为软件产品，例如软件开发包(software development kit，sdk)等等。
148.所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。在本公开所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
149.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
150.另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。
151.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(read-only memory，rom)、随机存取存储器(random access memory，ram)、磁碟或者光盘等各种可以存储程序代码的介质。
152.最后应说明的是：以上所述实施例，仅为本公开的具体实施方式，用以说明本公开的技术方案，而非对其限制，本公开的保护范围并不局限于此，尽管参照前述实施例对本公开进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应所述以权利要求的保护范围为准。