基于Page Rank算法的蒙古文搜索引擎设计

来源 :内蒙古大学 | 被引量 : 1次 | 上传用户:hjh8607
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎是指根据一定的策略,运用特定的计算机程序从互联网上搜集信息,然后对信息进行组织和处理,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。目前,以百度和谷歌为首的中英文搜索引擎得到了全世界的广泛使用,但针对蒙古文的搜索引擎还没有出现。据统计,2015年上半年蒙古国网页浏览人次达到2,121,900,其中83%的互联网用户在乌兰巴托,因此,急需设计一款针对蒙古国新蒙文文字且高效准确的搜索引擎,这也是我回国后工作的主要研究方向。本文主要研究了搜索引擎的核心算法—Page Rank算法。首先,从主流的蒙古文网站上获取大量网络页面;然后,制定网络页面关联关系的表达方式和存储方式,并设定所有页面的搜索关键词;最后,在蒙古文页面集上对Page Rank算法进行验证,并根据蒙古文特点对算法提出改进方案。在本文的算法研究基础上提出了蒙古文搜索站点的建设方案。本文借鉴现有中英文搜索引擎的核心算法和方案,对蒙古文搜索引擎进行了研究,该研究对蒙古文的信息检索、互联网普及等有着非常积极的意义。
其他文献
在世界经济一体化和科技迅猛发展的时代,现代物流产业的发展对降低社会流通成本,促进城市环境改善、完善城市功能、提高城市综合竞争力,实现可持续发展等方面具有不可替代的
会议
信息化的时代,社会期待人才的全面发展,但是我国现有的基础教育却跟不上时代的发展,因此教育部鼓励地方进行教学模式的改革。“四环节”教学模式将小组合作学习和问题式教学相结合,把教学过程分为项目设置、项目实施、表达交流、评价激励这四个环节,在保证课堂效率的情况下,通过合作、交流以及多样化的评价发展学生表达交流的能力,并将新的教学理念实践于课堂,确保学生课堂的主体地位。在已有的研究基础之上,本研究将在XX
本文主要介绍了汽车维修专业"工学结合,校企双元"的一种人才培养模式。介绍了该人才培养模式的操作和实施过程,如何实现"校企双元"培养学生的能力。该人才培养模式学生在学校
随着微电子技术高速发展,电子器件的高度集成化快速上升,芯片发热量也急剧增加,轻量化、高性能、快速散热能力已成为影响电子微型设备发展的重要因素,单一的电子封装材料已经
多机电力系统非线性微分代数系统的研究取得了较大的进展。已有的研究多数将被控对象视为孤立系统,不考虑其与系统外部之间的相互影响。然而多机电力系统应用中,元件被控对象
中国原创民族歌剧《运河谣》的诞生,直接推动了中国民族原创歌剧的发展,在借鉴西方歌剧创作手法上融入了我国大量的现代化及民族化的元素内容,故事情节更具戏剧性,在欣赏过程中更容易引起观众的共鸣,因此能够得到广大观众的欢迎与喜爱。唱段《你在哪里啊,红莲》是整部歌剧中经典的咏叹调唱段之一,在音乐特点和表现手法的创作上极具创新性,是民族男高音唱法的试金石之作。文章将立足于歌剧《运河谣》咏叹调唱段《你在哪里啊,
随着隧道数量的日益增多,由于复杂地形条件,施工方法、施工顺序的不同产生隧道偏压的现象普遍存在。如何合理选择施工方法和施工顺序,减小地形偏压对结构受力的影响,成为许多学者研究方向。本文以湖南省安乡至慈利高速公路为背景,采用有限元分析程序Midas GTS/NX,建立软弱围岩浅埋偏压下连拱隧道模型,根据双侧导洞法施工,进行数值模拟计算,讨论偏压连拱隧道力学行为,并结合现场监控数据,进行深入研究,主要研
1 引言电力电容器是电工技术学样中的一个分支。在输变电系统中,电力电容器起着提供无功功率,提高末端电压,降低系统损耗,提高第统伟,为电网的计量和继电保护提供电压记号,
会议
盲分离图像加密是一种可靠、具有极高安全性的图像加密方法。盲分离依据源信号之间的相互独立性把混合信号分离开,最终得到的是源信号的估计。独立分量分析(ICA)是近期发展起
全球贸易发展和中国“一带一路”倡议使得中国本国银行和外资银行之间的联系和竞争逐步增强。企业年报在传递信息、吸引投资者过程中发挥着重要作用。目前关于企业年报的研究主要是从语言学和经济学等角度进行分析阐发,鲜有从文化视角深入分析年报背后的文化因素,探讨差异动因。本文选取了中美20家银行的年报(10家中国银行的中文年报,10家美国银行的英文年报)作为研究对象,利用描述性分析法和案例分析法,依照体裁分析理