一种改进的SSD双网络的考场考生位置快速检测方法,由图像预处理、构建动态阈值SSD网络、构建上采样SSD网络、训练改进的SSD双网络和对测试样本图像进行测试步骤组成。在SSD网络结构的基础上,根据考场考生数据集的特点,构建动态调整交并比阈值方法,增加SSD网络中小目标的正样本量,在SSD网络中加入上采样层,增强小目标图像特征,结合并行双网络结构的思想,提高图像目标检测率。与现有技术相比,具有鲁棒性好、准确率高等优点,适用于考试场景下检测考生及监考教师。
1.一种改进的SSD双网络的考场考生位置快速检测方法,其特征在于由下述步骤组成:
(1)图像预处理
从图像数据集中选取600~800张训练样本图像和80~280张测试样本图像,用双线性插值法将选取的图像按像素大小归一化至250×250~500×500;
(2)构建动态阈值SSD网络
(a)将SSD网络结构作为动态阈值SSD网络的初始结构
输入层是600~800张大小为250×250~500×500的训练样本图像,输入层后连接VGG16的卷积(1),卷积(1)后首尾按序连接卷积(2)~卷积(5),卷积(5)后首尾按序连接全卷积层(6)、全卷积层(7),全卷积层(7)后首尾按序连接卷积(8)~卷积(11),卷积(4)、全卷积层(7)、卷积(8)、卷积(9)、卷积(10)和卷积(11)后均与输出层连接;
(b)构建预选框匹配方法
在初始结构中,选择卷积(4)中的卷积层(4-3)、全卷积层(7)、卷积(8)中的卷积层(8-2)、卷积(9)中的卷积层(9-2)、卷积(10)中的卷积层(10-2)、卷积(11)中的卷积层(11)共6个卷积层,在6个卷积层上取不同尺度的预选框与真实标签框进行匹配,划分预选框正负样本集,匹配方法为SSD网络中的预选框与真实标签框的面积交并比大于交并比阈值IOU,记为正样本,否则为负样本;
确定交并比阈值IOU的方法为:根据真实标签框的面积与输入图像像素大小的比值决定交并比的阈值IOU,动态调整阈值IOU划分正负样本,真实标签框面积与输入图像像素大小比≤0.01,交并比阈值IOU为0.4,否则,交并比阈值IOU为0.5,按下式确定真实标签框的面积SGTb和交并比阈值IOU:
SGTb=(ymax-ymin)×(xmax-xmin)
其中xmax、xmin、ymax、ymin分别为真实标签框的横坐标与纵坐标的最大值与最小值;Sinput为输入图像的面积,根据该匹配方法将训练的网络构成动态阈值SSD网络;
(3)构建上采样SSD网络
(a)构建上采样SSD网络结构
输入层是600~800张大小为250×250~500×500的训练样本图像,输入层后连接VGG16的卷积(1),卷积(1)后首尾按序连接卷积(2)、卷积(3),卷积(3)后首尾按序连接卷积(4)的卷积层(4-1)、卷积层(4-2),卷积层(4-2)后连接大小为76×76的上采样层(4-4),上采样层(4-4)后连接卷积核个数为512、卷积核大小为3×3的预测层(4-5),卷积层(4-2)后连接卷积层(4-3),卷积层(4-3)后连接卷积(5),卷积(5)后首尾按顺序连接全卷积层(6)、全卷积层(7),全卷积层(7)后首尾按序连接卷积(8)~卷积(11),卷积层(4-5)、全卷积层(7)、卷积(8)、卷积(9)、卷积(10)和卷积(11)后均与输出层连接,构成上采样SSD网络结构;
(b)构建上采样SSD网络的预选框匹配方法
在上采样SSD网络结构中,选择卷积(4)中的预测层(4-5)、全卷积层(7)、卷积(8)中的卷积层(8-2)、卷积(9)中的卷积层(9-2)、卷积(10)中的卷积层(10-2)、卷积(11)中的卷积层(11)共6个卷积层,在6个卷积层上取不同尺度的预选框与真实标签框进行匹配,将预选框划分为正样本集和负样本集,具体匹配原则为预选框与真实标签框的面积交并比大于交并比阈值IOU,记为正样本,否则为负样本,其中,设定交并比阈值IOU为0.5;
(4)训练改进的SSD双网络
改进的SSD双网络由动态阈值SSD网络与上采样SSD网络构成,同时训练,训练的步骤为:
(a)设置分类数为2、训练集的训练时期为8~20次、训练批次尺寸为15~32、基础学习率参数为0.0002~0.001、学习率衰减因子为0.7~0.95;
(b)采用VOC2007数据集对改进的SSD双网络进行预训练,将预训练后的权重和偏置作为改进的SSD双网络的初始权重和偏置;
(c)将预处理后的600~800张大小为250×250~500×500的训练样本图像输入到预训练后的动态阈值SSD网络中,设定交叉熵函数为损失函数,使用梯度下降法降低损失值来进行前向传播和反向传播,反复循环前向传播和反向传播,并更新网络的权重值和偏置,训练8~20次,得到训练好的动态阈值SSD网络模型;
(d)将预处理后的600~800张大小为250×250~500×500的训练样本图像输入到预训练后的上采样SSD网络中,设定交叉熵函数为损失函数,使用梯度下降法降低损失值来进行前向传播和反向传播,反复循环前向传播和反向传播,并更新网络的权重值和偏置,训练8~20次,得到训练好的上采样SSD网络模型;
(5)对测试样本图像进行测试
(a)设置目标的类别置信度阈值为0.45~0.65;
(b)将预处理后的80~280张测试样本图像同时输入到训练好的动态阈值SSD网络和上采样SSD网络中进行测试,得到2组不同的图像目标检测结果,其中每组结果包含每个目标的位置坐标、类别和所属类别的置信度;
(c)用非极大值抑制算法对2组检测结果中目标的位置重合度超过重合度阈值0.35~0.6的检测结果进行去重,保留置信度较高的位置坐标及其类别,得到最终检测结果,选取平均精准度mAP值作为评价指标,对检测结果进行评价。
2.根据权利要求1所述的改进SSD双网络的考场考生位置快速检测方法,其特征在于在构建动态阈值SSD网络步骤(2)的步骤(b)中,所述的不同尺度的预选框的宽度ωk和高度hk为:
其中,Sk为尺寸基础值,Smin为0.1,Smax为0.9,分别表示最小尺度和最大尺度,m是预测的卷积层个数、为6,k为(1,m]的整数,a为预选框的不同宽高比、a∈{1/3,1/2,1,2,3}。
3.根据权利要求1所述的改进SSD双网络的考场考生位置快速检测方法,其特征在于:所述的训练改进的SSD双网络步骤(4)的步骤(a)中,训练集的训练时期为10次,训练批次尺寸为16。
4.根据权利要求1所述的改进SSD双网络的考场考生位置快速检测方法,其特征在于:所述的对测试样本图像进行测试步骤(5)的步骤(a)中,目标的类别置信度阈值为0.5。
5.根据权利要求1所述的一种改进SSD双网络的考场考生位置快速检测方法,其特征在于:所述的对测试样本图像进行测试步骤(5)的步骤(c)中,检测结果中位置坐标的重合度阈值为0.4。
请联系平台。