[00845320]基于INTERNET的信息挖掘技术
交易价格:
面议
所属行业:
软件
类型:
非专利
交易方式:
资料待完善
联系人:
所在地:
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
该课题深入地研究了当前Internet信息获取方面所面临的问题,并将计算智能方法有效地应用于Web挖掘技术,对Internet信息处理方面的一些关键技术进行了改进并取得了突破,提出了机械分词的词条最大延伸长度等概念,有效提高了文本预处理的速度;给出利用概念推理网(concept-reasoning network,CRN)进行词组分割的新方法,有效地解决了词组分割的精度问题;提出了基于改进GA的特征向量获取算法、基于协同演化GA的特征向量获取算法和基于粗集理论的特征向量获取算法;将模糊理论与向量空间方法相结合,提出了基于模糊测度的VSM获取方法,有效地提高了信息处理的效率和准确性;提出基于多Agent的并行、分布式的Web文本挖掘模型,提升了Web文本挖掘的速度。在理论研究的基础上,实现了“Web文本分类原型系统WebClassifier”,该原型系统运行效率高、分类效果良好,从实践中验证了所提出的理论方法的可行性。
该课题深入地研究了当前Internet信息获取方面所面临的问题,并将计算智能方法有效地应用于Web挖掘技术,对Internet信息处理方面的一些关键技术进行了改进并取得了突破,提出了机械分词的词条最大延伸长度等概念,有效提高了文本预处理的速度;给出利用概念推理网(concept-reasoning network,CRN)进行词组分割的新方法,有效地解决了词组分割的精度问题;提出了基于改进GA的特征向量获取算法、基于协同演化GA的特征向量获取算法和基于粗集理论的特征向量获取算法;将模糊理论与向量空间方法相结合,提出了基于模糊测度的VSM获取方法,有效地提高了信息处理的效率和准确性;提出基于多Agent的并行、分布式的Web文本挖掘模型,提升了Web文本挖掘的速度。在理论研究的基础上,实现了“Web文本分类原型系统WebClassifier”,该原型系统运行效率高、分类效果良好,从实践中验证了所提出的理论方法的可行性。