金伟 作品数:4 被引量:9 H指数:2 供职机构: 中国计量学院信息工程学院 更多>> 发文基金: 国家自然科学基金 浙江省自然科学基金 浙江省科技厅国际合作项目 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
基于测地距离与极限学习机的监督型LLE算法研究 被引量:1 2015年 局部线性嵌入算法LLE(Locally Linear Embedding)是一种有效的非线性降维方法,但是该算法没有考虑样本的类别标签,并且欧式距离无法精确表示非线性数据的流形结构。针对以上LLE方法的缺陷,提出一种结合测地距离与样本类别信息的监督型LLE算法(ISO-SPLLE)。首先在LLE算法的近邻选择中使用测地距离作为相似性度量,然后利用极限学习机求出其映射函数后进行分类测试。将ISO-SPLLE算法与其他改进的LLE算法在UIC标准数据集与基因数据集上进行对比实验,结果表明,该方法对已知类别的数据能更有效地进行降维与识别。 金伟 何灵敏 杨小兵 王康健关键词:局部线性嵌入 极限学习机 测地距离 降维 基于云平台的互信息最大化特征提取方法研究 被引量:2 2013年 随着大规模基因芯片的应用,针对高维度的基因表达数据存在大量无关和冗余特征可能降低分类器性能的问题,提出了一种基于云平台的互信息最大化特征提取(CMI-Selection)方法。Hadoop云计算平台对基因表达数据划分后进行并行计算,同时结合互信息最大化方法对特征进行提取,实现了云计算平台上的特征过滤模型。实验结果表明,基于云平台的互信息最大化特征提取方法能够在保证较高分类精度的情况下,快速提取特征,节省大量时间资源,是一种高效的基因特征提取系统。 魏莎莎 陆慧娟 金伟 李超关键词:云计算 特征提取 一种基于互信息最大化的模型无关基因选择方法 被引量:7 2014年 针对大规模基因芯片高维度的基因表达数据存在大量无关和冗余特征可能降低分类器性能的问题,提出了一种基于互信息最大化方法(MMI)和与遗传算法的模型无关的基因选择方法来将特征选择转化为全局优化问题,其中的适应度函数定义为类间距离与类内距离之比,适应程度高。为了评价算法的性能,采用3个数据集进行了实验,结果表明MMIGA-Selection取得了较好的效果,在每个数据集上获得了较高的5折交叉验证正确率。MMIGA-Selection主要有两个优点:一是可以有效减少冗余基因;二是模型无关性,选择得出的特征子集可直接用于其他类型的分类器,分类精度较高。 魏莎莎 陆慧娟 安春霖 郑恩辉 金伟关键词:遗传算法 基因选择 基于测地距离与极限学习机的监督型LLE算法研究 局部线性嵌入算法(LLE)是一种有效的非线性降维方法,但是该算法没有考虑样本的类别标签,并且欧式距离无法精确表示非线性数据的流形结构。针对以上LLE 方法的缺陷,本文提出一种结合测地距离与样本类别信息的监督型LLE 算法... 金伟 何灵敏 杨小兵 王康健关键词:局部线性嵌入 极限学习机 测地距离 降维