首页 > 乐器声学 专利正文
语音下单方法、装置、电子设备和计算机可读介质与流程

时间:2022-02-24 阅读: 作者:专利查询

语音下单方法、装置、电子设备和计算机可读介质与流程

1.本技术涉及计算机技术领域,具体而言,涉及一种语音下单方法、装置、电子设备和计算机可读介质。


背景技术:

2.现有的中小型便利店往往通过自有渠道在供应商处进行线下商品采购,由于中小型便利店的特点,其无法大批量采购货物,从而无法与供应商进行有效的议价,同时又由于供应商批发对采购数量的要求,使得中小型便利店每次采购需要保证一定规模,从而导致库存问题。
3.而从供应商的角度而言,中小型便利店这种分散购买方式导致供应商仓储成本提高,从而使供应价格居高不下。
4.在相关技术中,如图1所示,通过互联网平台的方式,将多个店铺的订单进行汇集,然后再向供应商进行统一的采购和物流取货,然后再由承运车辆按照采购订单配送至对应的店铺,以降低诸如便利店等店铺的仓储成本,提高采购的灵活度。
5.这样的采购方式决定了店铺用户需要频繁下单,而店铺用户往往是店铺的经营者,其往往没有专门时间去手动下单,并且他们大多数还是以个人经验决定下单数目,这就造成下单不精确从而不能使拼单效益最大化的问题。


技术实现要素:

6.本技术的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本技术的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
7.本技术的一些实施例提出了语音下单方法、装置、电子设备和计算机可读介质,来解决以上背景技术部分提到的技术问题。
8.作为本技术的第一方面,本技术的一些实施例提供了一种语音下单方法,包括:响应于用户的语音信息,生成对应所述语音信息的文本字段;将所述文本字段输入至一个商品sku识别模型以使所述商品sku识别模型输出对应的商品sku编码及置信度;判断所述置信度是否大于置信阈值,如果大于所述置信阈值,则根据所述商品sku编码生成下单建议数据,如果小于所述置信阈值,则生成用于反馈至用户的确认请求数据;响应于用户对所述下单建议数据的反馈,将所述商品sku编码和商品数量添加到采购订单中。
9.作为本技术的第二方面,本技术的一些实施例提供了一种语音下单装置,包括:语音识别模块,用于响应于用户的语音信息,生成对应所述语音信息的文本字段;sku识别模块,用于将所述文本字段输入至一个商品sku识别模型以使所述商品sku识别模型输出对应的商品sku编码及置信度;下单建议模块,用于判断所述置信度是否大于置信阈值,如果大于所述置信阈值,则根据所述商品sku编码生成下单建议数据,如果小于所述置信阈值,则生成用于反馈至用户的确认请求数据;订单生成模块,用于响应于用户对所述下单建议数
据的反馈,将所述商品sku编码和商品数量添加到采购订单中。
10.作为本技术的第三方面,本技术的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。
11.作为本技术的第四方面,本技术的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。
12.本技术的有益效果在于:通过人工智能方式实现语音下单的识别和下单数目的智能建议。
附图说明
13.构成本技术的一部分的附图用来提供对本技术的进一步理解,使得本技术的其它特征、目的和优点变得更明显。本技术的示意性实施例附图及其说明用于解释本技术,并不构成对本技术的不当限定。
14.另外,贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
15.在附图中:图1是相关技术中店铺进行“拼单”采购的模式示意图;图2是根据本技术一种实施例的语音下单方法的流程图;图3是根据本技术一种实施例的语音下单方法中商品sku识别模型训练方法的流程图;图4是根据本技术第一种实施例的建议采购数据获取的流程图;图5是根据本技术第二种实施例的建议采购数据获取的流程图;图6是根据本技术第三种实施例的建议采购数据获取的流程图;图7是根据本技术第四种实施例的建议采购数据获取的流程图;图8是根据本技术一种实施例的语音下单装置的结构图;图9是根据本技术一种实施例的电子设备的结构示意图。
具体实施方式
16.下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现, 而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
17.另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
18.需要注意,本公开中提及的
“ꢀ
第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
19.需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域
技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
20.本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的, 而并不是用于对这些消息或信息的范围进行限制。
21.下面将参考附图并结合实施例来详细说明本公开。
22.参照图2所示,本技术的语音下单方法包括如下步骤:s1:响应于用户的语音信息,生成对应语音信息的文本字段。
23.s2:将文本字段输入至一个商品sku识别模型以使商品sku识别模型输出对应的商品sku编码及置信度。
24.s3:判断置信度是否大于置信阈值,如果大于置信阈值,则根据商品sku编码生成下单建议数据,如果小于置信阈值,则生成用于反馈至用户的确认请求数据。
25.s4:响应于用户对下单建议数据的反馈,将商品sku编码和商品数量添加到采购订单中。
26.作为具体的方案,语音下单方法中的用户是指店铺用户,即在拼单电商平台上购买货物的用户。店铺用户可以用智能手机作为用户终端发起语音下单。智能手机的交互界面用于实现服务器与用户信息交互。
27.如图3所示,作为具体方案,步骤s2具体包括如下步骤:s21:采集历史数据中存在对应关系的商品sku编码与文本字段的组合。
28.s22:将一组商品sku编码与文本字段作为训练数据,其中,文本字段作为输入数据,所述sku编码作为输出数据。
29.s23:采用多组所述训练数据训练所述商品sku识别模型至模型收敛。
30.这里所指的历史数据可以包含整体系统所有的已经完成语音下单的数据中,确定了对应关系的文本字段和商品sku编码。
31.比如语音转换完成的文字字段为“下单冰红茶和康师傅红烧牛肉面”,最终确定下单的商品sku编码为sku001和sku003。
32.作为优选方案,将“下单冰红茶和康师傅红烧牛肉面”划分成单独产品字段“冰红茶”和“康师傅红烧牛肉面”,然后建立单独的“冰红茶
”‑
sku001和单独的“康师傅红烧牛肉面
”‑
sku003的对应关系。然后将它们作为一组对应的训练数据。
33.同样的,在步骤s2中,也将文本字段进行拆分,然后分别输入到商品sku识别模型,采用这样的方案需额外的机器学习模型进行文本字段的拆分。
34.作为另一外的技术方案,直接将未拆分的文本字段作为输入,从而使商品sku识别模型直接对文本字段进行学习,从而直接输出对应的商品sku编码。作为优选方案,商品sku识别模型被构建为一个卷积神经网络模型。
35.在某些无法确定的情况下,比如置信度较低,则向用户进行反馈,生成确认请求数据,确认请求数据可以是语音数据或是图像数据,为了提高交互效率,优选图像数据,比如电商平台的产品图片。用户可以通过直接点击确认sku。
36.在确认用户需要购买的商品后,还需要确认采购商品的数据。本技术采用主动建议结合用户反馈的方式实现。
37.如图4所示,作为可选方案,步骤s3中生成下单建议数据的第一个实施例方法包括如下步骤:
查询用户上一次含有所述商品sku编码的采购订单;根据上一次历史采购订单中该商品sku编码的数目生成所述下单建议数据中对应该商品sku编码的建议采购数目。
38.采用这样的方案,可以提供比较快的响应速度,该方法适于单次采购量较少的用户。
39.如图5所示,作为可选方案,步骤s3中生成下单建议数据的第二个实施例方法包括如下步骤:查询用户上一次含有所述商品sku编码的历史采购订单;根据上一次采购订单中该商品sku编码的数目和上一次采购订单与当前日期的末单间隔天数,生成所述下单建议数据中对应该商品sku编码的建议采购数目。
40.如图6所示,作为更具体的方案,该方法还具体包括如下步骤:采集该用户所有历史采购订单数据。
41.计算该用户所有历史采购订单数据中该商品sku编码的总采购数量s。
42.查询该用户所有历史采购订单数据的时间跨度数据d。
43.根据所述总采购量s和时间跨度数据d计算日均采购数量n,计算公式为n=s/d。
44.根据所述日均采购数量n和末单间隔天数d计算所述建议采购数据数目k,计算公式为k=n
×
d。
45.通过这样计算公式可以根据较为准确的数据进行建议采购数据的确定,该方法适用于中型的店铺,其采购批次较大,且销量较为稳定。
46.作为一种优选方案,如果该用户没有该产品的历史采购订单数据,则可以按照店铺分组(店铺聚类运算中一类)中距离最近的店铺的历史数据进行计算。
47.具体店铺分组方法包括如下步骤:获取店铺的历史订单数据。
48.根据店铺的历史订单数据计算店铺的平均订单价值。这里所指的历史订单为店铺的采购订单。
49.使平均订单价值作为第三维度建立三维坐标系。其他两个维度为根据地理位置建立二维坐标系,店铺在二维坐标系中的坐标值结合第三维度的平均订单价值构成这个三维坐标系。比如,假设三维坐标系坐标轴为x、y、z,其中店铺在x、y轴的坐标分为店铺在平面地图上位置坐标,z轴坐标为该店铺的平均订单值。其中,平均订单价值为店铺在观测周期所有采购订单的订单价值的平均值。
50.获取店铺在以上三维坐标系中的坐标值。位置坐标可以通过地图和定位数据获取,订单平均价值通过计算历史数据获得。作为优选方案,观测周期为季度或年度。这样较长的时间周期可以比较稳定的反应店铺的特性。
51.以店铺在三维坐标系中的坐标值进行k

means聚类运算。
52.根据k

means聚类运算结果划分店铺分组。
53.通过以上方案可以将相类似的店铺聚类到一起从而使它们的数据能为彼此所用。
54.作为更简捷方法,作为优选方案,可以在相同店铺分组中按照距离最短方式找到可参考的店铺。
55.如图7所示,作为可选方案,步骤s3中生成下单建议数据的第一个实施例方法包括如下步骤:
查询用户上一次含有所述商品sku编码的采购订单。
56.将该用户上一次采购订单中的所述商品sku编码对应的采购数目和上一次采购订单与当前日期的末单间隔天数作为输入数据输入至对应该商品sku编码的采购数据预测模型以使所述采购数目预测模型输出预测采购数目作为所述建议采购数目。
57.该方法好处在于采用人工智能方式能做出更柔性化的选择。
58.图7所示的方法包括:训练采购数据预测模型。具体而言,可以采用该用户历史数据进行模型训练,采购数据预测模型本质是一个未来数据预测数据。除了上次的相关数据外,还可以输入诸如商品销量等数据作为输入数据。
59.作为优选方案,鉴于单个店铺的历史数据有限,不足以训练采购数据预测模型,可以将以上店铺分组同组店铺相同商品sku编码的历史采购数据均作为采购数据预测模型,从而获得最终收敛的模型,而不必人为生成训练数据。
60.如图8所示,本技术一种实施例的语音下单装置,包括:语音识别模块,用于响应于用户的语音信息,生成对应语音信息的文本字段;sku识别模块,用于将文本字段输入至一个商品sku识别模型以使商品sku识别模型输出对应的商品sku编码及置信度;下单建议模块,用于判断置信度是否大于置信阈值,如果大于置信阈值,则根据商品sku编码生成下单建议数据,如果小于置信阈值,则生成用于反馈至用户的确认请求数据;订单生成模块,用于响应于用户对下单建议数据的反馈,将商品sku编码和商品数量添加到采购订单中。
61.如图9所示,电子设备800可以包括处理装置(例如中央处理器、图形处理器等)801,其可以根据存储在只读存储器(rom)802中的程序或者从存储装置808加载到随机访问存储器(ram)803中的程序而执行各种适当的动作和处理。在ram803中,还存储有电子设备800操作所需的各种程序和数据。处理装置801、rom802以及ram803通过总线804彼此相连。输入/输出(i/o)接口805也连接至总线804。
62.通常,以下装置可以连接至i/o接口805:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置806:包括例如液晶显示器(lcd)、扬声器、振动器等的输出装置807;包括例如磁带、硬盘等的存储装置808:以及通信装置809。通信装置809可以允许电子设备800与其他设备进行无线或有线通信以交换数据。虽然图8示出了具有各种装置的电子设备800,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图8中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
63.特别地,根据本公开的一些实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的一些实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的一些实施例中,该计算机程序可以通过通信装置809从网络上被下载和安装,或者从存储装置808被安装,或者从rom802被安装。在该计算机程序被处理装置801执行时,执行本公开的一些实施例的方法中限定的上述功能。
64.需要说明的是,本公开的一些实施例上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线
的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd

rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
65.在本公开的一些实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的一些实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等等,或者上述的任意合适的组合。
66.在一些实施方式中,客户端、服务器可以利用诸如http(hypertexttransferprotocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“lan”),广域网(“wan”),网际网(例如,互联网)以及端对端网络(例如,adhoc端对端网络),以及任何当前已知或未来研发的网络。
67.上述计算机可读介质可以是上述电子设备中所包含的:也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:响应于用户的语音信息,生成对应语音信息的文本字段;将文本字段输入至一个商品sku识别模型以使商品sku识别模型输出对应的商品sku编码及置信度;判断置信度是否大于置信阈值,如果大于置信阈值,则根据商品sku编码生成下单建议数据,如果小于置信阈值,则生成用于反馈至用户的确认请求数据;响应于用户对下单建议数据的反馈,将商品sku编码和商品数量添加到采购订单中。
68.可以以一种或多种程序设计语言或其组合来编写用于执行本公开的一些实施例的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言―诸如java、smalltalk、c++,还包括常规的过程式程序设计语言:诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
69.附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。
70.也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。
71.例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相
反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
72.本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、片上系统(soc)、复杂可编程逻辑设备(cpld)等等。
73.以上描述仅为本公开的一些较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。