本发明提供的一种基于DQN算法的集中式光片上网络自适应路由规划方法,通过建立无向加权图以及多个因子参数;将因子参数的当前状态参数输入对应的DQN算子模型中,得到输出结果并将其输入至ε‑greedy策略网络中,ε‑greedy策略网络根据输入以及内插损耗状态参数选择数据链路组成一条路径,输出每个因子参数的奖励以及下一时刻的状态参数,组成一个变迁样本训练DQN算子模型,结合基于ε‑greedy策略网络规划路由路径。本发明利用经验池的变迁样本作出路由决策,利用神经网络对Q表进行拟合,不需要时间或者空间来搜索或存放Q表,当源节点与目标节点更改时无需重新学习;同时考虑多个影响因素,从高维数据中提取和处理特征,使得路径规划效率以及准确率得到显著提高。