政策资讯

基于文档层词频重排序的特征选择方法

专利类型:
申请号/专利号:
CN201810820200.X
申请人(专利权人):
周红芳
行业类别:
技术成熟度:
公布时间:
证书状态:
授权
交易价格:
45000元
我要咨询

摘要详情

技术摘要

权利要求书

技术附图

交易流程

委托经理人

本发明公开了一种基于文档层词频重排序的特征选择方法。它的主要目的是为了降低特征空间的维度,提高分类的精度。首先基于现有数据集,去除那些冗余的、信息量特别少的特征,然后依据特征选择方法进行数据集的降维处理,最后基于当前特征集合,通过5折交叉验证的方法,构建分类模型并得出分类F1值,选取对应分类F1值最高的特征集作为最优特征集。本发明专利技术的方法用于特征选择,帮助发现具有区分能力的词条信息,并且通过词条频率在文档层上的重排序方法来克服文档频率计算方式的单一性问题和数据集的非平衡性问题。

我要咨询

商标号:
联系人:
联系电话:
商标名称:
报价:
需求描述:
提交
服务
客服
电话:18504815395
邮箱:965848622@qq.com
地址:呼和浩特市赛罕区昭乌达路70号内蒙古科技大厦906
微信
招聘
返回顶部