【摘 要】
:
文本向量特征挖掘应用于信息资源组织和管理领域,在大数据挖掘领域具有较大应用价值,传统算法精度不好.提出一种基于多因素方差分析的文本向量特征挖掘算法.使用多因素方差分
【机 构】
:
广州工程技术学院信息工程系,广州城建职业学院机电与信息工程学院
论文部分内容阅读
文本向量特征挖掘应用于信息资源组织和管理领域,在大数据挖掘领域具有较大应用价值,传统算法精度不好.提出一种基于多因素方差分析的文本向量特征挖掘算法.使用多因素方差分析方法得到多种语料库的特征挖掘规律,结合蚁群算法,根据蚁群适应度概率正则训练迁移法则,得到种群进化最近时刻获得的数据集有效特征概率最大值,基于最优划分的K-means初始聚类中心选取算法,先对数据样本进行划分,然后根据样本分布特点来确定初始聚类中心,提高文本特征挖掘性能.仿真结果表明,该算法提高了文本向量特征的聚类效果,进而提高了特征挖掘性能,
其他文献
近年来,六西格玛管理在国内企业得到大力推广和发展,但在六西格玛人才培养上,企业多是以专业咨询公司辅导为主,忽视了企业内部员工对六西格玛教材的适应性。本文利用QFD工具,
针对吉藁生产的粘胶基白竹炭纤维进行了染色方面的逐步探讨,对粘胶纤维、白竹炭纤维及竹炭/棉混纺纱线(70/30)用B型活性染料染色,比较了白竹炭纤维与粘胶纤维染色性能的差异,并找出
传感器是信息系统的源头,在某种程度上是决定系统特性和性能指标的关键部件。本文试图探讨现代传感器技术发展方向,从概念、原理、性能和应用等层面评述了9种传感器:光纤传感器
“图书漂流”听上去很有吸引力,也很时尚、浪漫,然而这种时尚的漂流方式在中国还太稚嫩,能真正普及这种漂流方式恐怕就更难了。本刊早在2004年3月上旬刊曾报道过题为“春风文艺
目的了解北京市海淀区学院路周边市售油条样本中铝含量水平,检测其明矾使用情况及居民对油条中铝危害相关知识的知晓情况。方法对海淀区学院路周边4所高校食堂、5个流动摊位
记得二战时期,德国坦克从一座坚固的桥上轰隆隆开了过去,后面的几万名步兵为了显示威风,排好纵队,正步走上大桥,没想到坚固的大桥在德国兵整齐的脚步声中波动的越来越厉害,一声巨响