本发明公开了基于机器学习预测单重态裂分材料的三重态产率的方法,从现有文献中收集13个苝二酰亚胺衍生物分子,苝二酰亚胺衍生物分子的三重态产率ΦSF分布在5‑178%之间;并将13个苝二酰亚胺衍生物分子分别转换成分子描述符,然后将分子随机分成训练集和测试集;采用支持向量‑多项式核函数算法与选定的水合能(HE),三重态LUMO轨道能量ET‑LUMO和可扭转键数目NumRot,同时,优化建模中的惩罚因子C、不敏感损失函数ε;然后构建预测苝二酰亚胺衍生物的三重态产率ΦSF的预报模型。与现有技术相比,本发明基于小样本集建模的支持向量回归算法模型的建立,有助于研究者快速,简便的筛选出高ΦSF产率的分子,能够为开发高效太阳能电池提供指导意义。
1.一种基于机器学习预测单重态裂分材料的三重态产率的方法,其特征在于,包括以下步骤: 步骤一、从现有文献中收集13个苝二酰亚胺衍生物分子,苝二酰亚胺衍生物分子的三重态产率ΦSF分布在5-178%之间;并将13个苝二酰亚胺衍生物分子分别转换成分子描述符,然后将分子描述符随机分成训练集和测试集: (1)10个分子的分子描述符作为训练集; (2)3个分子的分子描述符作为测试集; 步骤二、筛选出3个分子描述符作为特征变量:水合能HE,三重态LUMO轨道能量ET-LUMO和可扭转键数目NumRot,采用支持向量-多项式核函数算法与选定的三个特征变量,同时,优化建模中的惩罚因子C、不敏感损失函数ε;然后构建预测苝二酰亚胺衍生物的三重态产率ΦSF的预报模型,所述预测苝二酰亚胺衍生物的三重态产率ΦSF的预报模型的标准化方程为: y=∑βi[(X·Xi)+1]2+0.55; 其中X是未知矢量,Xi是该模型中包含的支持向量,n是支持向量的数量,n=9,βi是相应支持向量的拉格朗日因子,对应9个支持向量其值分别为-1.15,-0.34,-1.68,7,7,-4.37,-7,0.55,-0.0052; 步骤三、对优化后的预测苝二酰亚胺衍生物的三重态产率ΦSF的预报模型进行训练; 步骤四、向训练后的预测苝二酰亚胺衍生物的三重态产率ΦSF的预报模型中输入苝二酰亚胺衍生物分子的分子描述符,即输出苝二酰亚胺衍生物的三重态产率ΦSF。
2.根据权利要求1所述的基于机器学习预测单重态裂分材料的三重态产率的方法,其特征在于,所述步骤一中,苝二酰亚胺衍生物分子采用数据挖掘软件进行数据挖掘,然后采用分子力学程序MM+对苝二酰亚胺衍生物分子构象进行优化,最后根据分子构型和量子化学半经验算法PM3计算得到相应的分子描述符。
3.根据权利要求1所述的基于机器学习预测单重态裂分材料的三重态产率的方法,其特征在于,所述步骤二中优化建模中的惩罚因子C、不敏感损失函数ε的方法为:采用LOOCV进行参数网格化搜索,以均方根误差RMSE最小为最优参数,参数优化的搜索范围和步长如下:设置惩罚因子C在1到100之间,步长为1;不敏感损失函数ε在0.01到0.1之间,步长为0.01;经计算得到的最优参数分别为惩罚因子C=7、不敏感损失函数ε=0.05,均方根误差RMSE为18.85。
请联系平台
请联系平台