本发明公开了一种基于模式挖掘的噪音数据过滤方法。
该噪音数据过滤方法首先建立由词袋数据集D构成的预处理数据结构FP树,该FP树包含了词袋数据集及其相应的事物数据集;其次,根据FP-2INF算法,最终将所有2-项集兴趣模式添加到兴趣模式集L中,完成噪音数据过滤。本发明根据兴趣度指标条件,将兴趣度指标直接进行剪枝,一步到位地挖掘出兴趣模式,噪音数据过滤方法有效实现噪音数据过滤,获得高质量数据,提高了数据的正确性、一致性
Copyright © 2016 国家技术转移西南中心-区域技术转移公共服务平台 All Rights Reserved 蜀ICP备12030382号-1
主办单位:四川省科技厅、四川省科学技术信息研究所、四川省技术转移中心科易网