【摘 要】
:
随着智能手机的广泛流行,移动互联网正不断改变着人们的生活方式,将用户从PC端带到了移动端,这一切都是因为手机应用程序(Application)的丰富,使移动终端基本上具有电脑的所有功
论文部分内容阅读
随着智能手机的广泛流行,移动互联网正不断改变着人们的生活方式,将用户从PC端带到了移动端,这一切都是因为手机应用程序(Application)的丰富,使移动终端基本上具有电脑的所有功能,并且使用更加便捷;但是随着App数量的不断增长,用户对App的检索需求也不断加大,传统的搜索引擎很难准确的返回用户所需要的信息,浪费了大量时间。本文的主要研究内容是通过文本挖掘的方法从网页信息与查询日志两方面获取App的概念体系、属性及语义三种不同的标签,并最终通过这些标签构建一个面向App领域的垂直搜索应用,进行App查询和推荐服务。App的概念体系标签挖掘是通过获取App网站导航栏信息的方式实现的,通过对导航栏的解析可以获得App的分类信息,之后通过本文提出的一种基于余弦相似度和同义词扩展的分类体系融合策略将所有分类信息进行合并,使得每一个App都有自己的分类体系;对于属性标签,是将抓取到的App简介信息作为文本,通过关键词抽取技术获得而成的;语义标签的获取则是通过查询日志实现的,使用查询日志中的Query、Titile、Url和点击行为等信息,通过本文提出的一系列规则和过滤策略使得查询Query和App一一对应起来,再通过分词、词法分析、句法分析等手段对Query进行处理,获取其语义标签。以上标签挖掘方法不需要人工参与,节省了大量资源开销。整个应用系统采用Django框架进行搭建,并通过Lucene全文搜索工具包对标签数据构建索引,实现了具有语义分析功能的检索系统。经过功能测试,满足人们对App领域检索的需求。
其他文献
蕈样肉芽肿是一种少见的T淋巴细胞瘤,主要表现为皮肤的瘙痒脱屑和浸润性斑块的出现,目前其发病机制仍不清楚,但该病晚期可侵犯淋巴结及内脏系统,目前该病还没有统一具体的治
伍慧明是美国华裔女作家的后起之秀,为当代美国文学,特别是当代美国华裔文学做出了巨大的贡献。伍慧明在1996年被格兰塔出版社评选为“百名美国年轻作家”之一。2009年,她还
中国画中的线条作为媒介的艺术体现,表达出不同的情感和审美情趣,具有传递审美和情感宣泄的功能。本文从线的起源到人类直观感受,发掘线条与情绪在中国画中的重要性。
手是人体最重要的器官之一,在人类日常生活中扮演着无可替代的作用。由于脑卒中(中风)等术后因中枢神经损伤导致的手部运动功能障碍,为患者的日常生活带来了极大了影响,需要通过康
根据牛、羊线粒体中物种特异性序列设计引物,应用可视化环状等温扩增技术(visual loop-mediate isothermal amplification,vLAMP)对牛、羊源性成分进行快速扩增及可视化判断,
移动机器人的自主导航能力是机器人智能水平高低的重要评判依据,机器人要实现自主导航首先要解决机器人定位的问题。未知环境中移动机器人的定位首先需要建立环境地图,然而建立
随着国家烟草行业信息化的快速发展,浙江中烟已经完成营销系统、ERP系统、专卖系统、客户关系管理系统、研发系统等多个内部应用系统的建设,每个应用系统都在其各自的工作业务
朱熹生活在民族冲突激烈,民族矛盾尖锐的南宋。宋以来,北方民族政权的强大威胁,社会的极度动荡,使得中国传统的伦理秩序遭到空前破坏,传统的“天下”观逐渐被打破,以华夏(汉)族为主导
以DK7740机床为引线,介绍了快走丝线切割机床的基本结构及加工原理,分析了产生断丝的原因,并提出了处理办法。
随着科技的发展,各高校对科研任务和科研水平的要求逐渐提高。高等院校越来越重视对教师科研信息的管理,其中管理模式的科学化与规范化、管理手段的信息化和自动化也将对学校的