政策资讯

图像识别深度信念网络结构的构建方法

专利类型:
发明
申请号/专利号:
CN201710106384.9
申请人(专利权人):
马苗
行业类别:
G06K9/62
技术成熟度:
公布时间:
2017-07-28
证书状态:
授权
交易价格:
30000元以上
我要咨询

摘要详情

技术摘要

权利要求书

技术附图

交易流程

委托经理人

一种图像识别深度信念网络结构的构建方法,由图像预处理、确定图像识别深度信念网络结构、调整图像识别深度信念网络参数、对测试样本图像进行识别步骤组成。采用了受限玻尔兹曼机原理,将图像输入到受限玻尔兹曼机网络中,得到重构误差,确定一个隐含层节点数,增加隐含层层数,将训练样本图像分批输入到含有1~3层隐含层的网络结构中迭代至指定迭代次数,得到识别率,选择识别率最高时所对应的隐含层节点数,确定网络层数和各隐含层节点数,构建成图像识别深度信念网络结构。本发明与现有技术相比,具有方法简单、鲁棒性好等优点,图像识别率达98.62%,能有效地防止网络的过拟合现象,可用于手势、手写数字、门牌号码等图像识别。

1.一种图像识别深度信念网络结构的构建方法,其特征在于由下述步骤组成:

(1)图像预处理

从图像数据集中选取50400~60000张训练样本图像和6000~20000张测试样本图像进行灰度化和大小归一化至32×32或28×28;

(2)确定图像识别深度信念网络结构

1)确定第一个受限玻尔兹曼机隐含层节点数M

设定受限玻尔兹曼机隐含层节点数为M,将训练样本图像分100批输入到受限玻尔兹曼机网络中,迭代至网络收敛,得到训练样本图像的重构误差,重构误差用(1)式确定:

argmin

θ

,

θ

1

n

m

Σ

i

=

1

n

|

|

v

i

-

v

^

i

|

|

2

-

-

-

(

1

)

]]>

式中m为输入图像的像素点个数,n为每一批数据的图像个数,vi为每一批输入的图像矩阵,为经过隐含层(hn)后重构出的图像矩阵为输出层(pf),θ为权值与偏置的集合,不断调整M的大小,根据不同M得到的重构误差和迭代所需时间,选择重构误差最小,所用时间最短的节点数M为第一个受限玻尔兹曼机隐含层(hn)节点数,构建成在输入层(vm)与输出层(pf)之间含有一个隐含层(hn)的网络结构;

2)确定网络层数和各隐含层节点数

在确定第一个隐含层(hn)节点数的基础上,在输入层(vm)与输出层(pf)之间增加1~3层隐含层(hn),将训练样本图像分100批输入到含有1~3层隐含层(hn)的网络结构中迭代至指定迭代次数50~200次,得到识别率,选择使当前层中识别率达到最高所对应的隐含层(hn)节点数,确定网络层数和各隐含层(hn)节点数,构建成图像识别深度信念网络结构;

(3)调整图像识别深度信念网络参数

改变网络初始化方式:将训练样本图像输入到由步骤(1)所确定的输入层(vm)与输出层(pf)之间含有一个隐含层(hn)的网络中,迭代至网络收敛,得到输入层(vm)与隐含层(hn)之间的连接权重,用该连接权重去初始化图像识别深度信念网络结构中输入层(vm)与第一个隐含层(hn)之间的连接权重;

确定图像识别深度信念网络学习率α:通过全局学习算法对图像识别深度信念网络的学习率进行调整,0.1≤α<1,间隔为0.1,选择迭代次数为50~200、识别率最高时所对应的α的值;

在网络损失函数中加入正则项约束并调整正则项系数,在损失函数

J

(

θ

)

=

1

m

n

Σ

i

=

1

m

(

1

2

|

|

v

i

-

v

^

i

|

|

2

)

-

-

-

(

2

)

]]>

中加入正则项约束,得到图像识别深度信念网络的损失函数为(3)式,式中λ为正则项系数,根据图像识别深度信念网络识别率按照1×10-10~1、间隔10倍进行调整λ的值,选择识别率最高时所对应的λ值,

J

(

θ

)

=

1

m

n

Σ

i

=

1

m

(

1

2

|

|

v

i

-

v

^

i

|

|

2

)

+

λ

2

|

|

W

i

j

|

|

2

-

-

-

(

3

)

]]>

式中m为输入图像像素点的个数,n为每一批数据的个数,vi为输入的图像矩阵,为经过一层隐含层(hn)后重构出的图像矩阵,Wij为各层间连接权值,θ为{W,b},b为图像识别深度信念网络的偏置,得到图像识别深度信念网络结构及参数;

(4)对测试样本图像进行识别

将测试样本图像6000~20000张输入到上述构建成的图像识别深度信念网络中,得到各测试样本图像的识别结果,判断所构建的网络为图像识别深度信念网络结构。

2.根据权利要求1所述的图像识别深度信念网络结构的构建方法,其特征在于所述的步骤(2)中的迭代至网络收敛为:在连续50次训练样本图像的重构误差的变化范围小于0.001时为收敛。

3.根据权利要求1所述的图像识别深度信念网络结构的构建方法,其特征在于所述的步骤(3)中,在网络损失函数中加入正则项约束并调整正则项系数,在损失函数

J

(

θ

)

=

1

m

n

Σ

i

=

1

m

(

1

2

|

|

v

i

-

v

^

i

|

|

2

)

-

-

-

(

2

)

]]>

中加入正则项约束,得到图像识别深度信念网络的损失函数为(3)式,

J

(

θ

)

=

1

m

n

Σ

i

=

1

m

(

1

2

|

|

v

i

-

v

^

i

|


|

2

)

+

λ

2

|

|

W

i

j

|

|

2

-

-

-

(

3

)

]]>

式中λ为正则项系数,根据图像识别深度信念网络识别率按照1×10-5进行调整λ的值,得到图像识别深度信念网络结构及参数。


请联系平台。

我要咨询

商标号:
联系人:
联系电话:
商标名称:
报价:
需求描述:
提交
服务
客服
电话:18504815395
邮箱:965848622@qq.com
地址:呼和浩特市赛罕区昭乌达路70号内蒙古科技大厦906
微信
招聘
返回顶部