农业科技信息服务个性化推送模型与系统

被引量 : 0次 | 上传用户:yangyan215076379
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络规模的发展和个人计算机的普及,互联网中农业科技信息逐步走向爆炸状态。然而,由于农业用户对信息技术了解不足,他们在快速、准确地寻找自己感兴趣信息上出现了很大的困难,从而阻碍了农业科技信息地传播,造成“信息孤岛”现象。针对目前农业科技信息共享率低、分散分布等问题,本文以权威的农业科技信息站点为信息源,以Web日志和网页内容为研究对象,主要完成了以下工作:(1)农业科技信息动态获取方法研究。针对农业科技信息分布不对称的问题,采用爬虫技术自动获取与主题相关的网页;在此基础上使用基于包装器的信息抽取方法获取具体信息,再使用正则表达式清洗无关标记,将得到的信息存入数据库中供后期研究使用;通过动态定时机制将抽取任务划分为小模块,使用自定义XML文件控制抽取流程实现了失败URL重试。经过实验验证,信息抽取F-指标保持在85%左右。采用失败重试机制后,信息抽取的成功率提高了10%。(2)农业科技信息服务个性化推送模型研究。针对农业用户精确定位感兴趣内容难的问题,通过对Web访问日志进行预处理,使用改进的k-means聚类方法对用户会话进行聚类,得到具有代表性的用户访问模式;然后抽取网页内容关键字,通过中文分词得到网页特征信息项,应用TF-IDF方法计算信息项权重,构建了用户兴趣模型库;通过计算来访会话与用户兴趣模型的相异值对来访会话分类,从而为用户实时推送感兴趣内容,实现了个性化的信息推送服务。通过实验验证,本研究建立的个性化推送模型的预测准确度达到了69.23%,推荐精确度为45.34%。(3)在分析研究农业科技信息动态获取及个性化推送模型的基础上,采用面向对象编程方法设计并实现了农业科技信息个性化推送服务系统,实现了动态定时获取农业科技信息、农业科技信息个性化推送等功能,促进了农业科技信息的共享与传播。经过系统测试表明,该系统具有良好的可用性、健壮性和可维护性。
其他文献
在东方百合、亚洲百合、麝香百合的几个品种和兰州百合、布朗百合中 ,利用离体花粉发芽检验法来鉴定各自花粉的生活力及经不同处理和贮藏后花粉生活力所受到的影响。新鲜花粉
<正> 1 直译 有的词不必翻译,可以直接用于译文中。凡属于国名、地名、官名、人名及其他专有名词,以及古今意义、用法一致的词,可直接用于译文中。如《伤寒论·序》中“余每
期刊
黑果腺肋花楸是集食用、药用、园林和生态价值于一身的蔷薇科落叶灌木。果实富含黄酮、花青素和多酚等物质,其提取物对治疗心脏病、高血压等心脑血管疾病有特效。可以在我国
<正> 为贯彻执行建设部、国家发展和改革委员会、财政部等八部委《关于城镇供热体制改革试点工作的指导意见》和建设部《民用建筑节能管理规定》,落实民用建筑节能设计标准,
滇西南新生代盆地中多富集沉积矿产资源,此盆地中的新生代沉积盆地特征及沉积环境的研究对探明盆地物质来源以及沉积演化有重要指示意义。笔者通过野外剖面测制,古生物鉴定分
预告登记是不动产登记中的一项重要制度,其目的是为了保全一项将来要发生的不动产物权变动的请求权。在我国,2007年颁布的《物权法》第20条第一次以法律形式确立了预告登记制度
我公司MFB风扫煤磨于2010年5月投入使用,一直正常运行。在2015年12月底进行大齿轮和小齿轮翻面大修后,一度出现固定端轴承温升异常,因未能及时准确判断故障产生的原因和故障发生
西葫芦病毒病的原因有种子带毒、土壤粪肥带毒、人为机械带毒以及蚜虫传播带毒等,其防治可以从加强田间肥水管理,促壮苗生长,防止土壤互干互湿,增加植株抗病性几个方面着手。