1.本发明属于语音识别领域,尤其涉及一种可定制的中英混合语音识别端到端系统。
背景技术:2.现有的中英混合语音识别主要有两种技术路线1.管道式方法,将声学模型,发音模型,语言模型分开进行训练建模,然后通过有向无环图的方式将三种模型整合至统一解码图,识别过程即为解码图的搜索过程2.端到端方法,将声学模型,发音模型,语言模型进行统一建模优化,无需构建解码图,实现简洁训练与解码。
3.现有技术缺点:(1)管道式方法由于声学模型,发音模型,语言模型分开进行训练建模,会产生误差的累积问题,声学模型的误差会传导至后续的发音模型和语言模型,导致性能的降低;另一方面由于统计语言模型的复杂性,构建的解码图体积巨大,不适用于手机,智能音响等端侧应用;(2)现有端到端模型需要大量的训练数据进行训练,但是中英混合数据获取极其困难,无法满足端到端模型的有效训练。根据特定领域的中英混合数据训练的端到端模型无法有效解决其他领域的英文识别问题。
技术实现要素:4.为解决上述技术问题,本发明提出一种可定制的中英混合语音识别端到端系统的技术方案,以解决上述技术问题。
5.本发明第一方面公开了一种可定制的中英混合语音识别端到端系统;所述系统包括:声学编码器、英文词表编码器和解码器;所述声学编码器:提取语音波形的声学特征,得到声学特征序列,然后对所述声学特征序列进行卷积和重新编码操作,得到降采样和重新编码的特征序列,再将所述降采样和重新编码的特征序列输入基于多头自注意力机制的声学编码器的多头自注意力模块,得到声学特征的高维表示的序列;所述英文词表编码器:将英文词分割为更小粒度的英文子词,得到英文单词或者英文词组的英文子词序列,然后将所述英文子词序列重新编码后输入到基于多头自注意力机制的编码模块,得到英文词表的最终表示的序列;所述解码器:将标注目标文本进行重新编码,得到目标文本编码表示的序列,再将所述声学特征的高维表示的序列、英文词表最终表示的序列和目标文本编码表示的序列分别输入基于多头注意力的解码器的多头注意力的模块,得到声学特征的上下文向量表示的序列和英文词表的上下文向量表示的序列,然后将所述声学特征的上下文向量表示的序列和英文词表的上下文向量表示的序列进行拼接融合后输入全连接层,得到最终的解码表
示。
6.根据本技术第一方面的系统,所述对所述声学特征序列进行卷积和重新编码操作,得到降采样和重新编码的特征序列的具体方法包括:使用多个2维卷积核对所述声学特征序列进行卷积操作,通过设置卷积操作的步长来控制降采样的比例;卷积操作之后连接激活函数,进行非线性变换;叠加多层卷积操作,然后使用全连接映射层将声学特征映射为高维向量,随后将向量序列加入位置编码信息,位置编码使用绝对位置表示,实现声学特征序列的降采样和重新编码。
7.根据本技术第一方面的系统,所述基于多头自注意力机制的声学编码器的多头自注意力模块由多个结构相同的模块堆叠而成,每个结构相同的模块之间进行残差连接;每个结构相同的模块包含两个子部分,具体结构包括:第一子部分是多头自注意力层,后面接第二子部分的全连接映射层,每个子部分进行层归一化操作,两个子部分中间进行残差连接。
8.根据本技术第一方面的系统,所述将所述英文单词或者英文词组重新编码后输入到基于多头自注意力机制的编码模块,得到英文词表的最终表示的序列的具体方法包括:将所述英文单词或者英文词组重新编码后输入到基于多头自注意力机制的英文词表编码器的多头自注意力模块,转换为英文词表高维特征序列,再将所述英文词表高维特征序列输入长短期记忆神经网络,得到英文词表的最终表示的序列。
9.根据本技术第一方面的系统,所述基于多头自注意力机制的英文词表编码器的多头自注意力模块由多个结构相同的模块堆叠而成,每个结构相同的模块之间进行残差连接;每个结构相同的模块包含两个子部分,具体结构包括:第一子部分是多头自注意力层,后面接第二子部分的全连接映射层,每个子部分进行层归一化操作,两个子部分中间进行残差连接。
10.根据本技术第一方面的系统,所述再将所述声学特征的高维表示的序列、英文词表最终表示的序列和目标文本编码表示的序列分别输入基于多头注意力的解码器的多头注意力的模块,得到声学特征的上下文向量表示的序列和英文词表的上下文向量表示的序列的具体方法包括:将目标文本编码表示的序列输入目标文本的多头自注意力模块,得到目标序列的高维表示;将所述目标序列的高维表示作为声学特征的多头自注意力模块和英文词表的多头自注意力模块的查询向量,声学特征的高维表示作为声学特征的多头自注意力模块的键和值,所述英文词表最终表示作为英文词表的多头自注意力模块的键和值,使用查询向量进行逐元素计算余弦距离,根据距离的大小得到声学特征的多头自注意力模块和英文词表的多头自注意力模块中每一个键的注意力分数;使用键的注意力分数对声学特征的多头自注意力模块和英文词表的多头自注意力模块中的值序列进行加权平均,得到声学特征的上下文向量表示的序列和英文词表的上下文向量表示的序列。
11.根据本技术第一方面的系统,所述目标文本的多头自注意力模块由多个结构相同的模块堆叠而成,每个结构相同的模块之间进行残差连接;每个结构相同的模块包含两个子部分,具体结构包括:第一子部分是多头自注意力层,后面接第二子部分的全连接映射层,每个子部分进行层归一化操作,两个子部分中间进行残差连接。
12.根据本技术第一方面的系统,所述将标注目标文本进行重新编码,得到目标文本编码表示的序列的具体方法包括:对所述标注目标文本进行词嵌入映射,得到对应的目标词向量表示构成的高维的目标词向量序列,在所述目标词向量序列中增加位置编码信息和时间先后顺序信息,得到目标文件编码表示的序列;所述将所述英文单词或者英文词组重新编码的具体方法包括:对所述英文单词或者英文词组进行词嵌入映射,得到对应的英文单词或者英文词组向量表示构成的高维的所述英文单词或者英文词组向量序列,在所述英文单词或者英文词组向量序列中增加位置编码信息和时间先后顺序信息。
13.本发明第二方面提供了一种电子设备,所述设备包括存储器和处理器,所述存储器上存储有计算机程序,该计算机程序被所述处理器执行时,执行如本发明第一方面所述的一种可定制的中英混合语音识别端到端系统中的方法。
14.本发明第三方面提供了一种存储介质,该存储介质存储的计算机程序,能够被一个或多个处理器执行,能够用来实现如本发明第一方面所述的一种可定制的中英混合语音识别端到端系统中的方法。
15.综上,本发明提出的方案能够实现针对不同领域的英文专有名词进行定制化模型,实现中英混合表达中英文的精准识别,同时减少模型对训练数据的依赖。原理上是通过将需要定制化的英文词组提前进行编码,作为模型的查询列表,根据解码器查询的结果对识别过程进行指导,实现对定制词的精准识别。针对不同领域的英文专有词可以提前进行词表的定制。通过模型定制,可以有效提升中英混合识别系统的识别准确率。
附图说明
16.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
17.图1为根据本发明实施例的一种可定制的中英混合语音识别端到端系统的结构图;图2为根据本发明实施例的一种可定制的中英混合语音识别端到端系统的具体结构图;图3为根据本发明实施例的一种电子设备的结构图。
具体实施方式
18.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
19.实施例1:本发明第一方面公开了一种可定制的中英混合语音识别端到端系统,图1为根据
本发明实施例的一种可定制的中英混合语音识别端到端系统的结构图,具体如图1所示,所述系统100包括:声学编码器101、英文词表编码器102和解码器103所述声学编码器101:提取语音波形的声学特征,得到声学特征序列,然后对所述声学特征序列进行卷积和重新编码操作,得到降采样和重新编码的特征序列,再将所述降采样和重新编码的特征序列输入基于多头自注意力机制的声学编码器的多头自注意力模块,得到声学特征的高维表示的序列;在一些实施例中,提取语音波形的声学特征的具体方法包括:进行语音波形分帧处理,将连续的语音波形点分割成固定长度的短时音频帧,便于后续的特征提取;对上述的短时音频帧提取fbank(filter-bank)声学特征;在一些实施例中,所述对所述声学特征序列进行卷积和重新编码操作,得到降采样和重新编码的特征序列的具体方法包括:使用多个2维卷积核对所述声学特征序列进行卷积操作,通过设置卷积操作的步长来控制降采样的比例;卷积操作之后连接激活函数,进行非线性变换;叠加多层卷积操作,然后使用全连接映射层将声学特征映射为高维向量,随后将向量序列加入位置编码信息,位置编码使用绝对位置表示,实现声学特征序列的降采样和重新编码;在一些实施例中,所述基于多头自注意力机制的声学编码器的多头自注意力模块由多个结构相同的模块堆叠而成,每个结构相同的模块之间进行残差连接;每个结构相同的模块包含两个子部分,具体结构包括:第一子部分是多头自注意力层,后面接第二子部分的全连接映射层,每个子部分进行层归一化操作,两个子部分中间进行残差连接;所述英文词表编码器102:将英文词分割为更小粒度的英文子词,得到英文单词或者英文词组的英文子词序列,然后将所述英文子词序列重新编码后输入到基于多头自注意力机制的编码模块,得到英文词表的最终表示的序列;在一些实施例中,所述将所述英文单词或者英文词组重新编码的具体方法包括:对所述英文单词或者英文词组进行词嵌入映射,得到对应的英文单词或者英文词组向量表示构成的高维的所述英文单词或者英文词组向量序列,在所述英文单词或者英文词组向量序列中增加位置编码信息和时间先后顺序信息;在一些实施例中,所述将所述英文单词或者英文词组重新编码后输入到基于多头自注意力机制的编码模块,得到英文词表的最终表示的序列的具体方法包括:将所述英文单词或者英文词组重新编码后输入到基于多头自注意力机制的英文词表编码器的多头自注意力模块,转换为英文词表高维特征序列,为了将英文词表高维特征序列转化为单一的向量表示,方便后续解码器对其进行注意力的计算,再将所述英文词表高维特征序列输入长短期记忆神经网络,得到英文词表的最终表示的序列;在一些实施例中,所述基于多头自注意力机制的英文词表编码器的多头自注意力模块由多个结构相同的模块堆叠而成,每个结构相同的模块之间进行残差连接;每个结构相同的模块包含两个子部分,具体结构包括:第一子部分是多头自注意力层,后面接第二子部分的全连接映射层,每个子部分进行层归一化操作,两个子部分中间进行残差连接;多头注意力机制扩展了传统的注意机制,使之具有多个头部,使得每个头部在参与编码器输出时具有不同的角色;具体地说,多头注意力独立地计算h次注意力,然后将它
们的输出连接到另一个线性投影中;注意力公式如下:其中,q、k、v分别表示输入的查询、键和值的集合,公式如下:所述解码器103:将标注目标文本进行重新编码,得到目标文本编码表示的序列,再将所述声学特征的高维表示的序列、英文词表最终表示的序列和目标文本编码表示的序列分别输入基于多头注意力的解码器的多头注意力的模块,得到声学特征的上下文向量表示的序列和英文词表的上下文向量表示的序列,然后将所述声学特征的上下文向量表示的序列和英文词表的上下文向量表示的序列进行拼接融合后输入全连接层,得到最终的解码表示;在一些实施例中,所述将标注目标文本进行重新编码,得到目标文本编码表示的序列的具体方法包括:对所述标注目标文本进行词嵌入映射,得到对应的目标词向量表示构成的高维的目标词向量序列,在所述目标词向量序列中增加位置编码信息和时间先后顺序信息,得到目标文件编码表示的序列;在一些实施例中,所述再将所述声学特征的高维表示的序列、英文词表最终表示的序列和目标文本编码表示的序列分别输入基于多头注意力的解码器的多头注意力的模块,得到声学特征的上下文向量表示的序列和英文词表的上下文向量表示的序列的具体方法包括:如图2所示,将目标文本编码表示的序列输入目标文本的多头自注意力模块,得到目标序列的高维表示;将所述目标序列的高维表示作为声学特征的多头自注意力模块和英文词表的多头自注意力模块的查询向量,声学特征的高维表示作为声学特征的多头自注意力模块的键和值,所述英文词表最终表示作为英文词表的多头自注意力模块的键和值,使用查询向量进行逐元素计算余弦距离,根据距离的大小得到声学特征的多头自注意力模块和英文词表的多头自注意力模块中每一个键的注意力分数;使用键的注意力分数对声学特征的多头自注意力模块和英文词表的多头自注意力模块中的值序列进行加权平均,得到声学特征的上下文向量表示的序列和英文词表的上下文向量表示的序列;在一些实施例中,所述目标文本的多头自注意力模块由多个结构相同的模块堆叠而成,每个结构相同的模块之间进行残差连接;每个结构相同的模块包含两个子部分,具体结构包括:第一子部分是多头自注意力层,后面接第二子部分的全连接映射层,每个子部分进行层归一化操作,两个子部分中间进行残差连接;在一些实施例中,所述系统100还包括: softmax函数104;将所述最终的解码表示输入到softmax函数104得到概率最大的目标。
20.综上,本发明各个方面的技术方案与现有技术相比具有如下优点:能够实现针对不同领域的英文专有名词进行定制化模型,实现中英混合表达中英文的精准识别,同时减少模型对训练数据的依赖。原理上是通过将需要定制化的英文词组提前进行编码,作为模型的查询列表,根据解码器查询的结果对识别过程进行指导,实现对
定制词的精准识别。针对不同领域的英文专有词可以提前进行词表的定制。
21.实施例2:如图1所示,所述系统100包括:声学编码器101、英文词表编码器102和解码器103所述声学编码器101:提取语音波形的声学特征,得到声学特征序列,然后对所述声学特征序列进行卷积和重新编码操作,得到降采样和重新编码的特征序列,再将所述降采样和重新编码的特征序列输入基于多头自注意力机制的声学编码器的多头自注意力模块,得到声学特征的高维表示的序列;在一些实施例中,提取语音波形的声学特征的具体方法包括:每25毫秒为一帧,帧与帧之间存在10毫秒的重叠,分帧以后提取80维的fbank特征,作为声学特征;在一些实施例中,所述对所述声学特征序列进行卷积和重新编码操作,得到降采样和重新编码的特征序列的具体方法包括:使用卷积核为3x3,步长为2,卷积操作后面有激活函数relu,用来进行非线性变换,每次卷积操作将声学特征降采样为原来的一半,使用2层的卷积层,声学特征降采样为初始采样率的四分之一;然后使用全连接映射层将声学特征映射为256维向量,随后将向量序列加入位置编码信息,位置编码使用绝对位置表示,实现声学特征序列的降采样和重新编码;在一些实施例中,所述基于多头自注意力机制的声学编码器的多头自注意力模块由12个结构相同的模块堆叠而成,每个结构相同的模块之间进行残差连接;每个结构相同的模块包含两个子部分,具体结构包括:第一子部分是多头自注意力层,后面接第二子部分的全连接映射层,头数设置为4,全连接层的维度为1024,激活函数使用glu,每个子部分进行层归一化操作,两个子部分中间进行残差连接,对自注意力层和全连接层使用dropout操作,参数为0.1;多头注意力机制扩展了传统的注意机制,使之具有多个头部,使得每个头部在参与编码器输出时具有不同的角色。具体地说,多头注意力独立地计算多次注意力,然后将它们的输出连接到另一个线性投影中;通过声学编码器,原始声学特征被转换为高维特征表示;所述英文词表编码器102:将英文词分割为更小粒度的英文子词,得到英文单词或者英文词组的英文子词序列,然后将所述英文子词序列重新编码后输入到基于多头自注意力机制的编码模块,得到英文词表的最终表示的序列;在一些实施例中,所述将所述英文单词或者英文词组重新编码的具体方法包括:对所述英文单词或者英文词组进行词嵌入映射,得到对应的英文单词或者英文词组向量表示构成的256维的所述英文单词或者英文词组向量序列,在所述英文单词或者英文词组向量序列中增加位置编码信息和时间先后顺序信息;在一些实施例中,所述将所述英文单词或者英文词组重新编码后输入到基于多头自注意力机制的编码模块,得到英文词表的最终表示的序列的具体方法包括:将所述英文单词或者英文词组重新编码后输入到基于多头自注意力机制的英文词表编码器的多头自注意力模块,转换为英文词表高维特征序列,为了将英文词表高维特征序列转化为单一的向量表示,方便后续解码器对其进行注意力的计算,再将所述英文词
表高维特征序列输入长短期记忆神经网络,得到英文词表的最终表示的序列;在一些实施例中,所述基于多头自注意力机制的英文词表编码器的多头自注意力模块由6个结构相同的模块堆叠而成,每个结构相同的模块之间进行残差连接;每个结构相同的模块包含两个子部分,具体结构包括:第一子部分是多头自注意力层,后面接第二子部分的全连接映射层,头数设置为4,全连接层的维度为1024,激活函数使用glu,每个子部分进行层归一化操作,两个子部分中间进行残差连接,对自注意力层和全连接层使用dropout操作,参数为0.1;多头注意力机制扩展了传统的注意机制,使之具有多个头部,使得每个头部在参与编码器输出时具有不同的角色;具体地说,多头注意力独立地计算h次注意力,然后将它们的输出连接到另一个线性投影中;所述解码器103:将标注目标文本进行重新编码,得到目标文本编码表示的序列,再将所述声学特征的高维表示的序列、英文词表最终表示的序列和目标文本编码表示的序列分别输入基于多头注意力的解码器的多头注意力的模块,得到声学特征的上下文向量表示的序列和英文词表的上下文向量表示的序列,然后将所述声学特征的上下文向量表示的序列和英文词表的上下文向量表示的序列进行拼接融合后输入全连接层,得到最终的解码表示;在一些实施例中,所述将标注目标文本进行重新编码,得到目标文本编码表示的序列的具体方法包括:对所述标注目标文本进行词嵌入映射,得到对应的目标词向量表示构成的256维的目标词向量序列,在所述目标词向量序列中增加位置编码信息和时间先后顺序信息,得到目标文件编码表示的序列;在一些实施例中,所述再将所述声学特征的高维表示的序列、英文词表最终表示的序列和目标文本编码表示的序列分别输入基于多头注意力的解码器的多头注意力的模块,得到声学特征的上下文向量表示的序列和英文词表的上下文向量表示的序列的具体方法包括:如图2所示,将目标文本编码表示的序列输入目标文本的多头自注意力模块,得到目标序列的高维表示;将所述目标序列的高维表示作为声学特征的多头自注意力模块和英文词表的多头自注意力模块的查询向量,声学特征的高维表示作为声学特征的多头自注意力模块的键和值,所述英文词表最终表示作为英文词表的多头自注意力模块的键和值,使用查询向量进行逐元素计算余弦距离,根据距离的大小得到声学特征的多头自注意力模块和英文词表的多头自注意力模块中每一个键的注意力分数;使用键的注意力分数对声学特征的多头自注意力模块和英文词表的多头自注意力模块中的值序列进行加权平均,得到声学特征的上下文向量表示的序列和英文词表的上下文向量表示的序列;在一些实施例中,所述目标文本的多头自注意力模块由6个结构相同的模块堆叠而成,每个结构相同的模块之间进行残差连接;每个结构相同的模块包含两个子部分,具体结构包括:第一子部分是多头自注意力层,后面接第二子部分的全连接映射层,头数设置为4,全连接层的维度为1024,激活函数使用glu,每个子部分进行层归一化操作,两个子部分中间进行残差连接,对自注意力层和全连接层使用dropout操作,参数为0.1;
在一些实施例中,所述系统100还包括: softmax函数104;将所述最终的解码表示输入到softmax函数104得到概率最大的目标。
22.实施例3:本发明公开了一种电子设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时,实现本发明公开第一方面中任一项的一种可定制的中英混合语音识别端到端方法中的步骤。
23.图3为根据本发明实施例的一种电子设备的结构图,如图3所示,电子设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过wifi、运营商网络、近场通信(nfc)或其他技术实现。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该电子设备的输入装置可以是显示屏上覆盖的触摸层,也可以是电子设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
24.本领域技术人员可以理解,图3中示出的结构,仅仅是与本公开的技术方案相关的部分的结构图,并不构成对本技术方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
25.实施例4:本发明公开了一种计算机可读存储介质。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,实现本发明公开第一方面中任一项的一种可定制的中英混合语音识别端到端方法中的步骤中的步骤。
26.请注意,以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。以上实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。
27.本说明书中描述的主题及功能操作的实施例可以在以下中实现:数字电子电路、有形体现的计算机软件或固件、包括本说明书中公开的结构及其结构性等同物的计算机硬件、或者它们中的一个或多个的组合。本说明书中描述的主题的实施例可以实现为一个或多个计算机程序,即编码在有形非暂时性程序载体上以被数据处理装置执行或控制数据处理装置的操作的计算机程序指令中的一个或多个模块。可替代地或附加地,程序指令可以被编码在人工生成的传播信号上,例如机器生成的电、光或电磁信号,该信号被生成以将信息编码并传输到合适的接收机装置以由数据处理装置执行。计算机存储介质可以是机器可读存储设备、机器可读存储基板、随机或串行存取存储器设备、或它们中的一个或多个的组合。
28.本说明书中描述的处理及逻辑流程可以由执行一个或多个计算机程序的一个或
多个可编程计算机执行,以通过根据输入数据进行操作并生成输出来执行相应的功能。所述处理及逻辑流程还可以由专用逻辑电路—例如fpga(现场可编程门阵列)或asic(专用集成电路)来执行,并且装置也可以实现为专用逻辑电路。
29.适合用于执行计算机程序的计算机包括,例如通用和/或专用微处理器,或任何其他类型的中央处理单元。通常,中央处理单元将从只读存储器和/或随机存取存储器接收指令和数据。计算机的基本组件包括用于实施或执行指令的中央处理单元以及用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个大容量存储设备,例如磁盘、磁光盘或光盘等,或者计算机将可操作地与此大容量存储设备耦接以从其接收数据或向其传送数据,抑或两种情况兼而有之。然而,计算机不是必须具有这样的设备。此外,计算机可以嵌入在另一设备中,例如移动电话、个人数字助理(pda)、移动音频或视频播放器、游戏操纵台、全球定位系统(gps)接收机、或例如通用串行总线(usb)闪存驱动器的便携式存储设备,仅举几例。
30.适合于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、媒介和存储器设备,例如包括半导体存储器设备(例如eprom、eeprom和闪存设备)、磁盘(例如内部硬盘或可移动盘)、磁光盘以及cd rom和dvd-rom盘。处理器和存储器可由专用逻辑电路补充或并入专用逻辑电路中。
31.虽然本说明书包含许多具体实施细节,但是这些不应被解释为限制任何发明的范围或所要求保护的范围,而是主要用于描述特定发明的具体实施例的特征。本说明书内在多个实施例中描述的某些特征也可以在单个实施例中被组合实施。另一方面,在单个实施例中描述的各种特征也可以在多个实施例中分开实施或以任何合适的子组合来实施。此外,虽然特征可以如上所述在某些组合中起作用并且甚至最初如此要求保护,但是来自所要求保护的组合中的一个或多个特征在一些情况下可以从该组合中去除,并且所要求保护的组合可以指向子组合或子组合的变型。
32.类似地,虽然在附图中以特定顺序描绘了操作,但是这不应被理解为要求这些操作以所示的特定顺序执行或顺次执行、或者要求所有例示的操作被执行,以实现期望的结果。在某些情况下,多任务和并行处理可能是有利的。此外,上述实施例中的各种系统模块和组件的分离不应被理解为在所有实施例中均需要这样的分离,并且应当理解,所描述的程序组件和系统通常可以一起集成在单个软件产品中,或者封装成多个软件产品。
33.由此,主题的特定实施例已被描述。其他实施例在所附权利要求书的范围以内。在某些情况下,权利要求书中记载的动作可以以不同的顺序执行并且仍实现期望的结果。此外,附图中描绘的处理并非必需所示的特定顺序或顺次顺序,以实现期望的结果。在某些实现中,多任务和并行处理可能是有利的。
34.以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。