首页 > 乐器声学 专利正文
音频识别方法、装置、电子设备和存储介质与流程

时间:2022-02-06 阅读: 作者:专利查询

音频识别方法、装置、电子设备和存储介质与流程

1.本公开涉及数据处理技术领域,尤其涉及一种音频识别方法、装置、电子设备和存储介质。


背景技术:

2.目前,音乐的数字化传播正成为流行的趋势,使用者习惯于从网络检索丰富多彩的各种音乐内容。当前,在检索查询音乐的需求时,使用者可以基于歌曲名或者歌手等作为检索条件,来获取到音乐。实际应用中,使用者经常会听到一段旋律或者一段歌曲,例如观看短视频、手机铃声等,但是无法知道歌曲名或歌手等信息,导致无法查询到对应的歌曲,降低使用体验。


技术实现要素:

3.本公开提供一种音频识别方法、装置、电子设备和存储介质,以解决相关技术的不足。
4.根据本公开实施例的第一方面,提供一种音频识别方法,所述方法包括:
5.获取查询内容;所述查询内容包括表征待识别音频的片段信息;
6.从预设库中选取与所述查询内容对应的预设数量的候选音频;所述候选音频包括与所述片段信息相匹配的候选音频片段;
7.将所述候选音频片段输入已训练的检测模型中,得到包含所述片段信息的目标片段信息和所述目标片段信息所在的目标音频。
8.在一些实施例中,从预设库中选取与所述查询内容对应的预设数量的候选音频,包括:
9.确定所述片段信息的语素与所述预设库中每个音频的文本信息的相似度;
10.根据所述相似度从大到小对所述预设库中的音频进行排序,得到排序结果;
11.基于所述排序结果确定排序位置靠前的预设数量个音频为所述候选音频,每个所述候选音频包括与所述片段信息的语素相匹配的至少一个音频片段;
12.从每个所述候选音频的至少一个音频片段中获取包含连续匹配语素最长的音频片段,得到每个所述候选音频与所述片段信息相匹配的候选音频片段。
13.在一些实施例中,将所述候选音频片段输入已训练的检测模型中,得到包含所述片段信息的目标片段信息和所述目标片段信息所在的目标音频,包括:
14.根据所述片段信息和所述候选音频片段获取每个所述候选音频对应的待检测向量;
15.将每个所述候选音频对应的待检测向量输入到所述检测模型,得到所述检测模型输出的检测结果数据;
16.根据所述检测结果数据获取包含所述片段信息的目标片段信息和所述目标片段信息所在的目标音频。
17.在一些实施例中,根据所述片段信息和所述候选音频片段获取每个所述候选音频对应的待检测向量,包括:
18.将所述片段信息分别与每个候选音频的候选音频片段进行拼接,得到每个候选音频对应的待检测向量;
19.其中,每个所述待检测向量至少包括第一标识符和第二标识符,所述第一标识符用于标识待检测向量的起始位置,所述第二标识符用于标识所述待检测向量的拼接位置和结束位置。
20.在一些实施例中,所述检测结果数据包括表示所述候选音频片段中每个语素分别位于起始位置和结束位置对应的第一概率数据和第二概率数据;
21.根据所述检测结果数据获取包含所述片段信息的目标片段信息和所述目标片段信息所在的目标音频,包括:
22.在所述起始位置小于所述结束位置的情况下,基于所述第一概率数据和所述第二概率数据的乘积从所述候选音频片段中确定出目标音频片段;
23.将所述目标音频片段作为从所述查询内容中识别出的目标片段信息以及将所述目标片段信息所在音频作为目标音频。
24.在一些实施例中,基于所述第一概率数据和所述第二概率数据的乘积从所述候选音频片段中确定出目标音频片段,包括:当所述第一概率数据和所述第二概率数据的乘积最大时确定起始位置的起始语素和结束位置的结束语素;
25.确定所述起始语素和所述结束语素之间的全部语素构成所述目标音频片段。
26.在一些实施例中,所述待识别音频为歌曲,所述片段信息是指所述歌曲中的部分歌词。
27.根据本公开实施例的第二方面,提供一种音频识别装置,所述装置包括:
28.查询内容获取模块,被配置为执行获取查询内容;所述查询内容包括表征待识别音频的片段信息;
29.候选音频获取模块,被配置为执行从预设库中选取与所述查询内容对应的预设数量的候选音频;所述候选音频包括与所述片段信息相匹配的候选音频片段;
30.目标音频获取模块,被配置为执行将所述候选音频片段输入已训练的检测模型中,得到包含所述片段信息的目标片段信息和所述目标片段信息所在的目标音频。
31.在一些实施例中,所述候选音频获取模块包括:
32.相似度确定子模块,被配置为执行确定所述片段信息的语素与所述预设库中每个音频的文本信息的相似度;
33.排序结果获取子模块,被配置为执行根据所述相似度从大到小对所述预设库中的音频进行排序,得到排序结果;
34.音频片段获取子模块,被配置为执行基于所述排序结果确定排序位置靠前的预设数量个音频为所述候选音频,每个所述候选音频包括与所述片段信息的语素相匹配的至少一个音频片段;
35.候选片段获取子模块,被配置为执行从每个所述候选音频的至少一个音频片段中获取包含连续匹配语素最长的音频片段,得到每个所述候选音频与所述片段信息相匹配的候选音频片段。
36.在一些实施例中,所述目标音频获取模块包括:
37.待测向量获取子模块,被配置为执行根据所述片段信息和所述候选音频片段获取每个所述候选音频对应的待检测向量;
38.检测结果获取子模块,被配置为执行将每个所述候选音频对应的待检测向量输入到所述检测模型,得到所述检测模型输出的检测结果数据;
39.目标音频获取子模块,被配置为执行根据所述检测结果数据获取包含所述片段信息的目标片段信息和所述目标片段信息所在的目标音频。
40.在一些实施例中,所述待测向量获取子模块包括:
41.待测向量获取单元,被配置为执行将所述片段信息分别与每个候选音频的候选音频片段进行拼接,得到每个候选音频对应的待检测向量;
42.其中,每个所述待检测向量至少包括第一标识符和第二标识符,所述第一标识符用于标识待检测向量的起始位置,所述第二标识符用于标识所述待检测向量的拼接位置和结束位置。
43.在一些实施例中,所述检测结果数据包括表示所述候选音频片段中每个语素分别位于起始位置和结束位置对应的第一概率数据和第二概率数据;
44.所述目标音频获取子模块包括:
45.目标片段获取单元,被配置为执行在所述起始位置小于所述结束位置的情况下,基于所述第一概率数据和所述第二概率数据的乘积从所述候选音频片段中确定出目标音频片段;
46.目标音频获取单元,被配置为执行将所述目标音频片段作为从所述查询内容中识别出的目标片段信息以及将所述目标片段信息所在音频作为目标音频。
47.在一些实施例中,所述目标片段获取单元包括:
48.语素确定子单元,被配置为执行当所述第一概率数据和所述第二概率数据的乘积最大时确定起始位置的起始语素和结束位置的结束语素;
49.片段确定子单元,被配置确定所述起始语素和所述结束语素之间的全部语素构成所述目标音频片段。
50.在一些实施例中,所述待识别音频为歌曲,所述片段信息是指所述歌曲中的部分歌词。
51.根据本公开实施例的第三方面,提供一种电子设备,包括:
52.处理器;
53.用于存储所述处理器可执行的计算机程序的存储器;
54.其中,所述处理器被配置为执行所述存储器中的计算机程序,以实现如上述的方法。
55.根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述存储介质中的可执行的计算机程序由处理器执行时,能够实现如上述的方法。
56.本公开的实施例提供的技术方案可以包括以下有益效果:
57.由上述实施例可知,本公开实施例提供的方案中可以获取查询内容;所述查询内容包括表征待识别音频的片段信息;然后,从预设库中选取与所述查询内容对应的预设数量的候选音频;所述候选音频包括与所述片段信息相匹配的候选音频片段;之后,将所述候
选音频片段输入已训练的检测模型中,得到包含所述片段信息的目标片段信息和所述目标片段信息所在的目标音频。这样,本实施例中可以利用部分片段信息即可从预设库中识别出相匹配的目标音频片段和目标音频,有利于提升识别效率,提高使用体验。
58.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
59.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
60.图1是根据一示例性实施例示出的一种音频识别方法的流程图。
61.图2是根据一示例性实施例示出的获取候选音乐片段的流程图。
62.图3是根据一示例性实施例示出的一种获取检测结果数据的流程图。
63.图4是根据一示例性实施例示出的一种音频识别方法的流程图。
64.图5是根据一示例性实施例示出的获取目标音乐片段的流程图。
65.图6是根据一示例性实施例示出的一种音频识别装置的框图。
66.图7是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
67.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性所描述的实施例并不代表与本公开相一致的所有实施例。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置例子。需要说明的是,在不冲突的情况下,下述的实施例及实施方式中的特征可以相互组合。
68.目前,音乐的数字化传播正成为流行的趋势,使用者习惯于从网络检索丰富多彩的各种音乐内容。当前,在检索查询音乐的需求时,使用者可以基于歌曲名或者歌手等作为检索条件,来获取到音乐。实际应用中,使用者经常会听到一段旋律或者一段歌曲,例如观看短视频、手机铃声等,但是无法知道歌曲名或歌手等信息,导致无法查询到对应的歌曲,降低使用体验。
69.为解决上述技术问题,本公开实施例提供了一种音频识别方法,可以应用于电子设备,该电子设备可以包括但不限于平板电脑、智能手机、个人计算机、智能电视、台式计算机、大屏幕等移动终端设备或固定终端设备,还可以应用于服务器或者服务器集群。
70.图1是根据一示例性实施例示出的一种音频识别方法的流程图,参见图1,一种音频识别方法,包括步骤11~步骤13。
71.在步骤11中,获取查询内容;所述查询内容包括表征待识别音频的片段信息。
72.本实施例中,电子设备上可以安装有应用程序,如自带音乐程序,或者第三方音乐程序(比如qq音乐、酷我音乐等),或者其他具有播放音乐功能的应用程序等。用户可以通过上述应用程序收听音频或者观看视频。当有查询音频的需求时,可以在电子设备内输入查询内容。上述查询内容可以包括但不限于文字、语音和图片等。在一示例中,在音乐搜索过程中,最为常用的查询方式是文字或者语音。
73.例如,电子设备或者应用程序内可以设有搜索框,用户可以在搜索框内输入查询内容。实际应用中,上述查询内容可以包括以下至少一项:音乐名称、歌手、作曲者或者待识别音频的片段信息等,上述片段信息可以是待识别音频中的部分语素,该语素可以是一个字、词、多个词形成的短词或者长句。考虑到用户听到部分音频片段而希望检索音频的原始片段或者音频名称等使用场景,上述查询内容还可以包括目标音频中的部分音频片段,例如部分音频片段对应的文字或语义。可理解的是,上述目标音频是指包含查询内容中部分音频片段的原始音频片段所属于的音频,即需要检索到的音频。
74.随着互联网科技的不断发展以及用户对搜索便利性的需求逐渐变大,语音搜索的应用越来越多。例如,通过语音输入“窗外的麻雀在电线杆上多嘴是哪首歌”或“播放窗外的麻雀在电线杆上多嘴”等语句进行搜索。又如,还可通过图片进行搜索,在接收到音频片段时可以截图并将上述截图输入搜索框内进行音频检索,或者通过上传歌手的专辑封面等进行音频搜索。
75.在步骤12中,从预设库中选取与所述查询内容对应的预设数量的候选音频;所述候选音频包括与所述片段信息相匹配的候选音频片段。
76.本实施例中,预设库可以预先存储在电子设备内或者云端内,并且,预设库内包括若干个音频,每个音频可以为一首音乐的全部或者一部分;每个音频可以建立一条索引,该索引可以包括音频辅助性标签信息,该辅助性标签信息可以包括但不限于音频的文本信息、音频名称、专辑、年份、类型、词曲作者、歌手等辅助性标签信息。上述索引可以采用人工方式或者计算机等自动化方式建立。因此,本实施例中预设库可以包括若干个音频的索引,从而可以减少对存储空间的占用,提高读写效率。
77.本实施例中,电子设备可以从预设库中选取与所述查询内容对应的预设数量的候选音频,参见图2,包括步骤21~步骤24。
78.在步骤21中,电子设备可以确定查询内容中片段信息的语素与预设库中每个音频的文本信息的相似度。例如,电子设备可以将查询内容中音频片段进行切分获得多个语素。然后,电子设备可以获取每个语素与每个音频索引中的文本信息的相似度。在步骤21中获取片段信息和文本信息的相似度可以采用bm25算法来计算,若是bm25算法的计算过程可以参考相关技术,在此不再赘述。
79.在步骤22中,电子设备可以根据所述相似度从大到小对所述预设库中的候选音频进行排序,得到排序结果。
80.考虑到预设库中索引数量级较大(如千万条以上),对全部索引进行排序所用时间较长;再结合本公开中仅使用预设数量个候选音频,因此,本示例中可以采用锦标赛排序算法。例如,对25个音频排序,获得排序相似度较大的3个音频而剩余音频则不作排序,包括:
81.第一步:25个音频分成5组,即a1~a5,b1~b5,c1~c5,d1~d5,e1~e5。每个小组排序,获得每个小组的相似度最大的音频。假设各小组内排序与各个音频的序号相同,即a组内相似度从大到小依次为a1、a2、a3、a4和a5。第二步:将5个组中相似度最大的音频(a1、b1、c1、d1和e1)进行第6次排序,获得25个音频中相似度最大的音频a1。第三步:剩下的所有组中的音频,只有a2、a3、b1、b2、c1有机会参与到排序,这5个音频a2、a3、b1、b2、c1进行第7次排序,获得相似度排名第二和排名第三的音频,上述第一名、第二名和第三名获得从大到小的排序而其他音频的排序均小于第三名且没有排名。
82.需要说明的是,本实施例中通过采用锦标赛排序算法可以获得预设库中音频进行排序,即从预设库中选择出预设数量(如n个)个相似度较大的候选音频,其他音频的排序可以均设置为一个预设标识(如0),以表示该音频排序位于n名以后,可以降低电子设备所处理的数据量,提升电子设备的检索速度。
83.在步骤23中,电子设备可以基于所述排序结果确定排序位置靠前的预设数量个音频为候选音频,即从相似度最大的音频开始选择出预设数量个音频,每个音频包括与所述查询内容中片段信息的语素相匹配的至少一个音频片段。若采用锦标赛排序算法,则电子设备可以直接获取有排序标识的音频作为候选音频。
84.需要说明的是,在获取相似度的过程中,是以查询内容中每个语素与每个音频的文本信息来计算相似度,那么预设库中的部分音频可以被查询内容中的至少一个词语匹配到,即每首候选音频包括与查询内容中片段信息的语素相匹配的至少一个音频片段。
85.在步骤24中,电子设备可以从每个候选音频的至少一个音频片段中获取包含连续匹配语素最长的音频片段,得到每个候选音频与所述查询内容中片段信息相匹配的候选音频片段。或者说,步骤24中,电子设备可以从预设数量个候选音频中每一首候选音频中选取一个最长的音频片段,最终得到n个音频片段。
86.在步骤13中,将所述候选音频片段输入已训练的检测模型中,得到包含所述片段信息的目标片段信息和所述目标片段信息所在的目标音频。
87.本实施例中,电子设备内可以存储已训练的检测模型,该检测模型可以是bert模型。电子设备可以利用上述检测模型来获取目标音频和目标片段信息,参见图3,包括步骤31~步骤33。在步骤31中,电子设备可以根据查询内容的片段信息和每个候选音频片段获取每个候选音频对应的待检测向量。本步骤中,电子设备可以拼接片段信息和每个候选音频片段得到待检测向量,每个所述待检测向量至少包括第一标识符和第二标识符,所述第一标识符用于标识待检测向量的起始位置,所述第二标识符用于标识所述待检测向量的拼接位置和结束位置。例如“[cls]查询内容[seg]候选音频片段歌词[seg]”表示一个待检测向量,其中[cls]表示待检测向量的第一标识符,[seg]表示待检测向量的第二标识符。
[0088]
在步骤32中,电子设备可以将每个候选音频对应的待检测向量输入到检测模型,得到检测模型输出的检测结果数据。电子设备可以调用检测模型,并将待检测向量依次输入到检测模型,并获取检测模型输出的检测结果数据。
[0089]
在步骤33中,电子设备可以根据所述检测结果数据获取包含所述片段信息的目标片段信息和所述目标片段信息所在的目标音频。
[0090]
本步骤中,上述检测结果数据包括表征待检测向量中候选音频片段的每个语素分别位于起始位置作为起始语素的第一概率数据、表征待检测向量中候选音频片段的每个语素位于结束位置作为结束语素的第二概率数据和表征查询内容是否有相匹配音频片段的第三概率数据。
[0091]
本实施例中,电子设备可以对比起始位置和结束位置,在起始位置小于结束位置的情况下,电子设备可以基于第一概率数据和第二概率数据的乘积从候选音频片段中确定出目标音频片段。例如,电子设备可以获取每个待检测向量的第一概率数据和第二概率数据的乘积;并且,将乘积最大的候选音频片段作为目标音频片段,并将目标音频片段作为从查询内容中识别出的目标片段信息。可理解的是,在确定出目标音频片段之后,电子设备还
可以确定目标音频片段对应的辅助性标签信息,并根据上述辅助性标签信息确定目标音频。
[0092]
在一实施例中,电子设备在获得上述目标音频或者目标音频片段之后可以将目标音频的文本信息或者目标音频片段反馈给用户,方便用户阅读上述检索结果。当用户希望收听该目标音频时,电子设备可以通过应用程序从服务器获取到对应的音频数据并缓存到本地播放。
[0093]
至此,本公开实施例提供的方案中可以获取查询内容;所述查询内容包括表征待识别音频的片段信息;然后,从预设库中选取与所述查询内容对应的预设数量的候选音频;所述候选音频包括与所述片段信息相匹配的候选音频片段;之后,将所述候选音频片段输入已训练的检测模型中,得到包含所述片段信息的目标片段信息和所述目标片段信息所在的目标音频。这样,本实施例中可以利用部分片段信息即可从预设库中识别出相匹配的目标音频片段和目标音频,有利于提升识别效率,提高使用体验。
[0094]
以检索音乐为例,下面结合图4和图5描述本公开提供的一种音频识别方法的工作原理:
[0095]
本实施例中,电子设备可以将查询内容中片段信息的识别任务分解成三部分,分别是:检索器、切片器、阅读器,具体如下:
[0096]
检索器(retriever):获取每首音乐的索引,其中索引包含音乐辅助性标签信息。然后,基于索引,利用bm25算法分别计算查询内容与每首音乐的全文的相似度,得到n首候选音乐;并且,召回与查询内容相关性最高(即相似度较大)的n首候选音乐的音乐辅助性标签信息。
[0097]
切片器(slicer):将索引召回的相关性最高的n首候选音乐的音乐全文,分别进行截断和补齐使各音乐片段形成一个完整的音乐片段,然后裁剪出每首候选音乐的连续匹配词语最长的音乐片段,n首候选音乐得到n个候选音乐片段。这n个候选音乐片段分别与查询内容进行拼接,作为之后“阅读器”模型的输入。拼接方式,采用图4中“[cls]查询内容[seg]候选音乐片段[seg]”的方式,得到待检测向量。
[0098]
阅读器(reader):采用bert模型,将切片器得到的待检测向量依次输入到bert模型。该bert模型的输出包含两部分,即是否包含符合要求的音乐片段(has answer score)以及具体的音乐片段(lyric span)。参见图6,has answer score部分,将bert模型的[cls]位置的向量表示经过额外的全连接层和二分类softmax,得到有无答案的第三概率数据(ha score),根据第三概率数据和预设的概率阈值(可以取值0.85~0.95,可设置)判断是否有符合要求的音乐片段。lyric span部分,即图7中start/end span部分,将候选音乐片段向量经过全连接层和softmax计算后得到每个片段单元(token)作为答案时起始词语和终止词语的概率pstart(即第一概率数据)和pend(即第二概率数据)。然后,获取pstart*pend最大且起始词语的位置start小于终止词语的位置end的组合,将此时起始位置start和终止位置end之间文字作为目标音乐片段。
[0099]
在上述实施例提供的一种音频识别方法的基础上,本公开实施例还提供了一种音频识别装置,参见图6,所述装置包括:
[0100]
查询内容获取模块61,被配置为执行获取查询内容;所述查询内容包括表征待识别音频的片段信息;
[0101]
候选音乐选取模块62,被配置为执行从预设库中选取与所述查询内容对应的预设数量的候选音频;所述候选音频包括与所述片段信息相匹配的候选音频片段;
[0102]
目标音频获取模块63,被配置为执行将所述候选音频片段输入已训练的检测模型中,得到包含所述片段信息的目标片段信息和所述目标片段信息所在的目标音频。
[0103]
在一实施例中,所述候选音频获取模块包括:
[0104]
相似度确定子模块,被配置为执行确定所述片段信息的语素与所述预设库中每个音频的文本信息的相似度;
[0105]
排序结果获取子模块,被配置为执行根据所述相似度从大到小对所述预设库中的音频进行排序,得到排序结果;
[0106]
音频片段获取子模块,被配置为执行基于所述排序结果确定排序位置靠前的预设数量个音频为所述候选音频,每个所述候选音频包括与所述片段信息的语素相匹配的至少一个音频片段;
[0107]
候选片段获取子模块,被配置为执行从每个所述候选音频的至少一个音频片段中获取包含连续匹配语素最长的音频片段,得到每个所述候选音频与所述片段信息相匹配的候选音频片段。
[0108]
在一实施例中,所述目标音频获取模块包括:
[0109]
待测向量获取子模块,被配置为执行根据所述片段信息和所述候选音频片段获取每个所述候选音频对应的待检测向量;
[0110]
检测结果获取子模块,被配置为执行将每个所述候选音频对应的待检测向量输入到所述检测模型,得到所述检测模型输出的检测结果数据;
[0111]
目标音频获取子模块,被配置为执行根据所述检测结果数据获取包含所述片段信息的目标片段信息和所述目标片段信息所在的目标音频。
[0112]
在一实施例中,所述待测向量获取子模块包括:
[0113]
待测向量获取单元,被配置为执行将所述片段信息分别与每个候选音频的候选音频片段进行拼接,得到每个候选音频对应的待检测向量;
[0114]
其中,每个所述待检测向量至少包括第一标识符和第二标识符,所述第一标识符用于标识待检测向量的起始位置,所述第二标识符用于标识所述待检测向量的拼接位置和结束位置。
[0115]
在一实施例中,所述检测结果数据包括表示所述候选音频片段中每个语素分别位于起始位置和结束位置对应的第一概率数据和第二概率数据;
[0116]
所述目标音频获取子模块包括:
[0117]
目标片段获取单元,被配置为执行在所述起始位置小于所述结束位置的情况下,基于所述第一概率数据和所述第二概率数据的乘积从所述候选音频片段中确定出目标音频片段;
[0118]
目标音频获取单元,被配置为执行将所述目标音频片段作为从所述查询内容中识别出的目标片段信息以及将所述目标片段信息所在音频作为目标音频。
[0119]
在一实施例中,所述目标片段获取单元包括:
[0120]
语素确定子单元,被配置为执行当所述第一概率数据和所述第二概率数据的乘积最大时确定起始位置的起始语素和结束位置的结束语素;
[0121]
片段确定子单元,被配置确定所述起始语素和所述结束语素之间的全部语素构成所述目标音频片段。
[0122]
在一实施例中,所述待识别音频为歌曲,所述片段信息是指所述歌曲中的部分歌词。
[0123]
需要说明的是,本实施例中示出的装置和设备与方法实施例的内容相匹配,可以参考上述方法实施例的内容,在此不再赘述。
[0124]
图7是根据一示例性实施例示出的一种电子设备的框图。例如,电子设备700可以是智能手机,计算机,数字广播终端,平板设备,医疗设备,健身设备,个人数字助理等。可理解的是,上述电子设备可以作为第一设备或者第二设备使用。
[0125]
参照图7,电子设备700可以包括以下一个或多个组件:处理组件702,存储器704,电源组件706,多媒体组件708,音频组件710,输入/输出(i/o)的接口712,传感器组件714,通信组件716,图像采集组件718。
[0126]
处理组件702通常控制电子设备700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器720来执行计算机程序。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理组件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
[0127]
存储器704被配置为存储各种类型的数据以支持在电子设备700的操作。这些数据的示例包括用于在电子设备700上操作的任何应用程序或方法的计算机程序,联系人数据,电话簿数据,消息,图片,视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
[0128]
电源组件706为电子设备700的各种组件提供电力。电源组件706可以包括电源管理系统,一个或多个电源,及其他与为电子设备700生成、管理和分配电力相关联的组件。电源组件706可以包括电源芯片,控制器可以电源芯片通信,从而控制电源芯片导通或者断开开关器件,使电池向主板电路供电或者不供电。
[0129]
多媒体组件708包括在电子设备700和目标对象之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示屏(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自目标对象的输入信息。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。
[0130]
音频组件710被配置为输出和/或输入音频文件信息。例如,音频组件710包括一个麦克风(mic),当电子设备700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频文件信息。所接收的音频文件信息可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中,音频组件710还包括一个扬声器,用于输出音频文件信息。
[0131]
i/o接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。
[0132]
传感器组件714包括一个或多个传感器,用于为电子设备700提供各个方面的状态评估。例如,传感器组件714可以检测到电子设备700的打开/关闭状态,组件的相对定位,例如组件为电子设备700的显示屏和小键盘,传感器组件714还可以检测电子设备700或一个组件的位置改变,目标对象与电子设备700接触的存在或不存在,电子设备700方位或加速/减速和电子设备700的温度变化。本示例中,传感器组件714可以包括磁力传感器、陀螺仪和磁场传感器,其中磁场传感器包括以下至少一种:霍尔传感器、薄膜磁致电阻传感器、磁性液体加速度传感器。
[0133]
通信组件716被配置为便于电子设备700和其他设备之间有线或无线方式的通信。电子设备700可以接入基于通信标准的无线网络,如wifi,2g、3g、4g、5g,或它们的组合。在一个示例性实施例中,通信组件716经由广播信道接收来自外部广播管理系统的广播信息或广播相关信息。在一个示例性实施例中,通信组件716还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。
[0134]
在示例性实施例中,电子设备700可以被一个或多个应用专用集成电路(asic)、数字信息处理器(dsp)、数字信息处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现。
[0135]
在示例性实施例中,还提供了一种包括可执行的计算机程序的非临时性可读存储介质,例如包括指令的存储器704,上述可执行的计算机程序可由处理器执行。其中,可读存储介质可以是rom、随机存取存储器(ram)、cd

rom、磁带、软盘和光数据存储设备等。
[0136]
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本公开旨在涵盖任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
[0137]
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。