[00335875]一种基于样本特征值分布混淆度的特征选择方法
交易价格:
面议
所属行业:
分析仪器
类型:
发明专利
技术成熟度:
通过小试
专利所属地:中国
专利号:CN201710454479.X
交易方式:
资料待完善
联系人:
大连海事大学
进入空间
所在地:辽宁大连市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
摘要:本发明公开了一种基于样本特征值分布混淆度的特征选择方法,其包括1、分别对数据集X中各类样本每一个特征fi的取值集合按从小到大的顺序进行排序;2、确定各类样本所对应的特征fi的限定值范围;3、确定数据集中M类样本对于第i个特征所对应的样本混淆数量,计算数据集X中第i个特征的特征值分布混淆度进而使用同样方法获得数据集X中每一个特征的Confusion值;4、依据所获得的Confusion值对数据集X中各个特征进行重要度排序以获得有序特征集合F;5、基于所设定的子集搜索策略,使用分类器对有序特征集合F或有序特征集合F中的部分特征所组成的子集Fsub进行子集搜索以得到所需的特征子集D。本发明能选出性能较好的特征子集,提高特征子集的识别能力,降低子集搜索过程中搜索次数。
摘要:本发明公开了一种基于样本特征值分布混淆度的特征选择方法,其包括1、分别对数据集X中各类样本每一个特征fi的取值集合按从小到大的顺序进行排序;2、确定各类样本所对应的特征fi的限定值范围;3、确定数据集中M类样本对于第i个特征所对应的样本混淆数量,计算数据集X中第i个特征的特征值分布混淆度进而使用同样方法获得数据集X中每一个特征的Confusion值;4、依据所获得的Confusion值对数据集X中各个特征进行重要度排序以获得有序特征集合F;5、基于所设定的子集搜索策略,使用分类器对有序特征集合F或有序特征集合F中的部分特征所组成的子集Fsub进行子集搜索以得到所需的特征子集D。本发明能选出性能较好的特征子集,提高特征子集的识别能力,降低子集搜索过程中搜索次数。