融合特征排序的多标记特征选择算法.pdf

上传人:fengzhicai 文档编号:47858313 上传时间:2019-05-05 格式:PDF 页数:8 大小:9.30MB
下载 相关 举报
融合特征排序的多标记特征选择算法.pdf_第1页
第1页 / 共8页
融合特征排序的多标记特征选择算法.pdf_第2页
第2页 / 共8页
融合特征排序的多标记特征选择算法.pdf_第3页
第3页 / 共8页
融合特征排序的多标记特征选择算法.pdf_第4页
第4页 / 共8页
融合特征排序的多标记特征选择算法.pdf_第5页
第5页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
Computer Engineering and Applications计算机工程与应用
2016,52(17)
融合特征排序的多标记特征选择算法
王晨曦,林梦雷,刘景华2,王娟,林耀进2
WANG Chenxi, LIN Menglci, LIU Jinghua, WANG Juan, LIN Yaojin
1.漳州职业技术学院计算机工程系,福建漳州363000
2.闽南师范大学计算机学院,福建漳州363000
1. Department of Computer Engineering, Zhangzhou Institute of Technology, Zhangzhou, Fujian 363000, China
2. School of Computer Science, Minnan Normal University, Zhangzhou, Fujian 363000, China
WANG Chenxi, LIN Menglei, LIU inghua, et al. Multi-label feature selection via fusing feature ranking. Computer
Engineering and Applications, 2016, 52(17): 93-100
Abstract In the framework of multi-label learning, feature selection is a powerful tool for solving the curse of dimension-
ality, which can improve the classification performance of multi-label classifier. In this paper, a multi-label feature selec
tion algorithm via fusing feature ranking is proposed. First, it conducts adaptive graining samples based on different labels
and employs the neighborhood of sample to compute the neighborhood mutual information between feature and label
which can measure the importance degree of feature. Then, all features are sorted in descending order by the value of their
neighborhood mutual information under each label. Finally, it acquires a new feature rank by fusing all individual feature
rank lists. Experiment is conducted on tour data sets, and four evaluation criteria are used to measure the effectiveness. Experi
mental results show that the proposed algorithm is superior to several state-of-the-art multi-label feature selection algorithms
Key words: feature selection: multi-label classification: clustering ensemble: mutual information
摘要:在多标记学习框架中,特征选择是解决维数灾难,提高多标记分类器的有效手段。提出了一种融合特征排
序的多标记特征选择算法。该算法首先在各标记下进行自适应的粒化样本,以此来构造特征与类別标记之间的邻
城互信息。其次,对得到邻域互信息进行排序,使得每个类別标记下均能得到一组特征排序。最后,多个独立的特
征排序经过聚类融合成一组新的特征排序。在4个多标记数据集和4个评价指标上的实验结果表明,所提算法优于
些当前流行的多标记降维方法。
关键词:特征选择;多标记分类;聚类融合;互信息
文献标志码:A图分类号:TPI8doi:10.3778/is.1002-8331.1506-0067
是,直观的处理方式就是给文档或者图片娥予一个标记
传统的监督学习框梨中,认为每个测对象是具有集合,在此基础上进行建模和学习,并利用该模型预测
明确,单一的语义标记。但是在现实世界中,每个对象末知对象的所有相关类别标记。这就是近年来引起
不仅只有一个语义标注,而是常常表现出多义性。例泛关注和研究的多标记分类问题
如:在文档分类标注中,一篇新闻可能同吋标注为“政
在多标记数据中,数据的高维性严重干扰了多标记
治”和“经済"”;在图像分类任务中,一张风景图可能同时分类器的分类性能。而特征的降维技术能在降低特征
标注多个语义概念,如:“湖泊”,“森林”,“小船”等。于维数的基础上,提高分类器的分类性能。多标记的特征
基金项目:国家自然科学基金(No.61303131,No.61379021);福建省自然科学基金(N。.2013J01028);福建省高校杰出青年科研人
培育计划(No.JA14192);漳州市科技项目(N。.Z72013.04,No.Z72014J14)。
作者简介:王晨曦(1981-),女,讲师,主要研究方向为数据挖掘,F-mail:want5(asine.com:林梦需(1963-),男,教授,主要研
究方向为模糊集理论及其应用粒计算;刘景华(1989-),女,硕土研究生,主要研究方向为数据挖掘:王娟(1978一)
女,讲师,主要研究方向为信息安全、数字水印;林趯进(1980-),男,博上,副教授,主要研究方向为数据挖掘、粒计算。
收稿日期:2015-06-05修回日期:2015-07-09文章编号:1002-8331(2016)17-0093-08
CNKI?络优先出版:2015-09-29,http://www.cnki.net/kcms/detail/11.2127.tp.20150929.1045.020.html
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 论文 > 电子信息

版权所有:www.WDFXW.net 

鲁ICP备09066343号-25