一种标准化考场考生实时监控方法,由制作单帧考场图像数据集、预处理图像、设置超参数、构建实时监控模型、训练实时监控模型、测试预处理后的测试集图像步骤组成。与现有技术相比,具有网络结构简单、检测速度快和检测精度高等优点,可在标准化考场监控环境下推广使用。
1.一种标准化考场考生实时监控方法,其特征在于由下述步骤组成:
(1)制作单帧考场图像数据集
将标准化考场监控视频按不同的考场划分,每个考场提取时间间隔为10~100分钟的2帧图像,标注出每幅图像中考生所在位置及其类别标签,构成标注文件,图像与其对应的标注文件构成考场图像数据集,将考场图像数据集按1:3~5划分为训练集和测试集;
(2)预处理图像
将训练集和测试集中图像的像素调整为长边W为800~1200像素,短边H为400~800像素的图像;
(3)设置超参数
设置分类数为2、训练集训练轮数为24~48、训练批次尺寸为2~6、基础学习率参数为0.005~0.015、学习率衰减因子为0.85~0.95;
(4)构建实时监控模型
监控模型包括特征提取阶段、特征融合阶段、候选区域建议阶段、分类回归阶段;
1)特征提取阶段,选用MobileNetV2网络作为主干网络提取特征,输出到特征融合阶段;
2)特征融合阶段,将1×1、W/32×H/32、W/16×H/16大小的特征图,通过1×1卷积、双线性插值,调整成大小为W/16×H/16、通道数为256的特征图,三个特征图相加,输出到候选区域建议阶段;
3)候选区域建议阶段,用5×5深度可分离卷积核代替3×3的普通卷积核,将生成特征图输出到分类回归阶段;
4)分类回归阶段,用深度可分离卷积层替代第一个全连接层,减少一层共享全连接层,得到实时监控模型;
(5)训练实时监控模型
通过考场图像数据集训练实时监控模型的步骤为:
1)将标准化考场考生数据集中图像按照步骤(2)进行预处理,输出到实时监控模型,使用imagenet数据集上的权重对实时监控模型的MobileNetV2网络进行初始化;
2)将按步骤(2)预处理后的训练集输入到实时监控模型;设定交叉熵函数为损失函数,使用梯度下降法降低损失函数的损失值进行前向传播和反向传播;反复循环24~48个前向传播和反向传播轮数,并更新网络的权重值和偏置,得到训练好的实时监控模型权重;
(6)测试预处理后的测试集图像
1)设置测试参数
设置目标的类别置信度阈值为0.5~0.8;
2)测试
将步骤(2)预处理后的测试集内的图像输入到训练好的实时监控模型中,得到图像中每个目标的位置坐标、所属类别以及所属类别的置信度;
3)筛选检测结果
在检测结果中,保留类别置信度大于置信度阈值的目标位置坐标信息、类别信息和所属类别的置信度信息;
4)输出考生位置
输出图像中类别置信度大于置信度阈值的考生位置信息和定位结果图。
2.根据权利要求1所述的标准化考场考生实时监控方法,其特征在于:所述的在制作单帧考场图像数据集步骤(1)中,将标准化考场监控视频按不同的考场划分,每个考场提取时间间隔为30分钟的2帧图像,标注出每幅图像中考生所在位置及其类别标签,构成标注文件,图像与其对应的标注文件构成考场图像数据集,将考场图像数据集按1:4划分为训练集和测试集。
3.根据权利要求1所述的标准化考场考生实时监控方法,其特征在于:在预处理图像步骤(2)中,将训练集和测试集中图像的像素调整为长边W为1000像素,短边H为600像素的图像;在构建实时监控模型步骤(4)的步骤2)中,所述的构建实时监控模型为:将1×1、1000/32×600/32、1000/16×600/16大小的特征图,通过1×1卷积、双线性插值,调整大小为1000/16×600/16、通道数为256的特征图,三个特征图相加,输出到候选区域建议阶段。
4.根据权利要求1所述的标准化考场考生实时监控方法,其特征在于:在设置超参数步骤(3)中,设置分类数为2、训练集训练轮数为36、训练批次尺寸为4、基础学习率参数为0.01、学习率衰减因子为0.9。
5.根据权利要求1所述的标准化考场考生实时监控方法,其特征在于:所述的测试预处理后的测试集图像步骤(6)的步骤1)中,目标的类别置信度阈值为0.7。
请联系平台。