【摘 要】
:
为解决克隆代码有害性预测过程中特征无关与特征冗余的问题,提出一种基于相关程度和影响程度的克隆代码有害性特征选择组合模型。首先,利用信息增益率对特征数据进行相关性的初步排序;然后,保留相关性排名较高的特征并去除其他无关特征,减小特征的搜索空间;接着,采用基于朴素贝叶斯等六种分类器分别与封装型序列浮动前向选择算法结合来确定最优特征子集。最后对不同的特征选择方法进行对比分析,将各种方法在不同选择准则上的
【机 构】
:
内蒙古师范大学计算机与信息工程学院
【基金项目】
:
国家自然科学基金资助项目(61363017,61462071), 内蒙古自治区自然科学基金资助项目(2014MS0613,2015MS0606)
论文部分内容阅读
为解决克隆代码有害性预测过程中特征无关与特征冗余的问题,提出一种基于相关程度和影响程度的克隆代码有害性特征选择组合模型。首先,利用信息增益率对特征数据进行相关性的初步排序;然后,保留相关性排名较高的特征并去除其他无关特征,减小特征的搜索空间;接着,采用基于朴素贝叶斯等六种分类器分别与封装型序列浮动前向选择算法结合来确定最优特征子集。最后对不同的特征选择方法进行对比分析,将各种方法在不同选择准则上的优势加以利用,对特征数据进行分析、筛选和优化。实验结果表明,与未进行特征选择之前对比发现有害性预测准确率
其他文献
针对以案例推理机制为推理核心的分拣作业机械臂系统不能用于物体信息较多的复杂场景的问题,提出一种改进的基于范例推理-信念期望意图(CBR-BDI)推理机制。首先,将输入的信息作为信念(Belief),通过分词与检索得到案例属性,将其作为期望(Desire);然后,加入地图匹配、期望分析和引导三个部分以完善期望;最后,完整的期望生成解决方案作为意图(Intention)。在多物体多信息的场景中,用户可
海门市是全国170个限时"禁实"的城市之一,2001年,新型墙材产量达1.8亿块标准砖,占墙材总产量的65%,实心黏土砖产量压缩到1亿块标准砖,城区建筑已全部使用新型墙材,乡镇建筑使
邯郸市宏达名都花园工程总建筑面积42000m2,地下1层,地上10层,分3栋住宅楼,标准层层高3.1m.工程采用了CL结构体系,该结构体系不用实心黏土砖,具有自重轻、抗震、节能、经济合
在贵州省的墙体材料中,属于新型墙材的品种有轻骨料混凝土砌块、GRC轻质墙板、粉煤灰加气混凝土砌块、烧结空心砖、粉煤灰蒸压砖、粉煤灰碳化制品等.在省会贵阳市,因建筑多样
绝热材料是保温、保冷材料的总称.防止建筑物、热力设备及管道散热的绝热材料称保温材料,在冷冻(普冷)和低温(深冷下)使用的绝热材料称保冷材料.以绝热材料为芯材,与金属或非
针对多噪声环境下的语音识别问题,提出了将环境噪声作为语音识别上下文考虑的层级语音识别模型。该模型由含噪语音分类模型和特定噪声环境下的声学模型两层组成,通过含噪语音分类模型降低训练数据与测试数据的差异,消除了特征空间研究对噪声稳定性的限制,并且克服了传统多类型训练在某些噪声环境下识别准确率低的弊端,又通过深度神经网络(DNN)进行声学模型建模,进一步增强声学模型分辨噪声的能力,从而提高模型空间语音识
随着经济的发展和技术水平的提高,混凝土框架结构建筑、框架剪力墙结构建筑、高层现浇混凝土建筑以及钢结构建筑在大、中城市建筑中有了很大发展.这些结构体系为各类建筑板材
针对现有行为特征提取方法识别率低的问题,提出了一种融合稠密光流轨迹和稀疏编码框架的无监督行为特征提取方法(DOF-SC)。首先,在稠密光流(DOF)轨迹提取的基础上,对以轨迹为中心的原始图像块进行采样作为轨迹的原始特征;其次,对轨迹原始特征基于稀疏编码框架训练稀疏字典,得到轨迹的稀疏特征表示,利用词袋(BF)模型对稀疏特征聚类得到轨迹的码书,再根据码书对每个动作中出现的所有轨迹所属的码书类别进行投
针对动态信任网络中企业信任联盟的识别及演变问题,提出一种基于片段的演化图聚类(GC)算法。首先,通过考虑企业信任网络演化的时间信息来对信任网络进行编码;其次,构建划分和表示信任网络结构编码成本的评价函数,如信任联盟稳定则将该时间段内信任网络组成片段压缩表示,如联盟突变则开始新的信任网络片段并重新划分结构;最后,通过搜索最小编码成本,得到信任联盟的稳定结构和结构突变的时间点。仿真实验表明,所提算法能