基于文档重要度的静态索引剪枝方法

来源 :华南理工大学学报:自然科学版 | 被引量 : 0次 | 上传用户:guoyurun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对网页质量参差不齐、重要程度差别巨大的问题,提出了按照网页重要程度确定其剪枝幅度的静态索引剪枝方法,并在GOV2数据集上进行了验证.实验结果表明:这种方法体现了静态索引剪枝能极大降低存储需求、提高查询效率的优点;当剪枝后的索引大小是原始大小的13%时,P@10、P@20值能达到甚至超过使用完整索引时的结果;在相同的剪枝幅度下,P@10、P@20和MAP都明显好于以往的剪枝方法.
其他文献
针对无线传感器网络能量不平衡影响网络寿命的问题,引入一个新的基于节点剩余能量标准差的能量平衡指标,据此提出了一种能量平衡的最优分布式成簇机制,将其转化为多目标约束优化
回顾性分析妇科腹腔镜手术患者68例的资料,按照舒芬太尼给药模式的不同分为两组:通过间断助推给药的A组38例,通过血浆靶控给药方式给药的B组30例。手术后记录两组患者的平均呼
收集45例临床有泌尿系症状患者,行CT平扫,肾皮质、肾髓质及排泄期增强扫描,根据肾脏积水程度决定延迟扫描时间,无积水者延迟10~15m in,积水者延迟30~180m in扫描,将原始资料
图像学由图像志发展而形成,常用来分析绘画的主题、内在含义及与其他文化之间各种外在的或者暗含的联系。图像学的研究方法在20世纪80年代被引入国内,有效促进了我国美术史研
文中探讨了利用偏轴混杂纤维来实现1.5MW风力机叶片主梁弯扭耦合的设计方法,建立了弯扭耦合设计的控制系数,并就碳纤维偏轴角和碳纤维偏轴体积比对弯扭耦合系数的影响进行了