【摘 要】
:
互联网现在已经成为了人们生活与工作的必需品,每天人们都会在互联网上获取信息和发布信息,所以互联网成为了信息的海洋。互联网中的信息纷繁复杂,而在这个以人为主体的现代
论文部分内容阅读
互联网现在已经成为了人们生活与工作的必需品,每天人们都会在互联网上获取信息和发布信息,所以互联网成为了信息的海洋。互联网中的信息纷繁复杂,而在这个以人为主体的现代社会中,人物信息成为了研究者们关注的重点。在所有的人物信息属性中地理位置属性有着最为广泛的应用,比如其可以应用于广告推荐、人物事件定位、人物行为评估等多个领域,所以对于人物的地理位置属性的识别也成为了当今研究的一个热点。在所有互联网的网络类型中,社交网络因为其巨大的用户量和交互的实时性受到了人们广泛的关注,而正因为社交网络这种以人为主体的特征属性,使得其蕴含了最为丰富的人物信息。所以本文以社交网络为主要研究对象来进行人物的地理位置属性的识别,其中需要识别的人物地理位置属性分为两类,分别为用户推文中提到的地理属性以及用户主要位置地理属性,其中用户主要位置属性指用户的主要工作和生活区域。本文对于这两类位置属性的主要研究和创新如下:(1)提出了基于地理特征与特征集成结合的地理实体识别方法,该方法用于用户推文中提到地名属性的识别。该方法主要改进了以传统命名实体识别方法来获取地名实体的不足,并且该方法为地名实体制定了丰富的且有针对性的机器学习特征,包括了个体特征以及组合特征,经过实验验证,这些特征能有效的提升模型的识别效果。同时为了解决传统模型中特征训练不足的问题,该方法使用了特征集成的方法,特征集成不仅解决了问题同时提升了模型识别的稳定性,并且还少许提升了识别效果。(2)提出了基于多种信息融合的用户主要位置识别方法。该方法使用了多种信息进行用户主要位置的识别,解决了现有研究手段单一的问题。该方法使用的多种信息主要包括了用户的社交网络朋友信息以及用户的自身信息,其中自身信息又包含用户的推文信息、用户账号及描述信息、用户的关注列表信息。通过信息统一表示、地理位置聚类等手段进行以上信息的融合,并通过对聚类位置的经纬度加权计算识别出用户的主要地理位置。本文通过实验发现,该识别方法能有效的识别出用户的主要地理位置。
其他文献
生活·情感·意蕴———《关东风情系列》创作随感高殿才长白山以她雄伟壮观、绮丽秀美闻名于世,白山脚下居住着许多质朴善良的庄户人家,他们世代在这片黑土地上辛勤劳作,生息、
随着海洋开发与海洋运输能力的不断提高,溢油事故发生的频率也不断加大。因此,如何准确地对溢油行为与归宿进行数值模拟已经成为了一个重要的研究方向。其中,流场模拟的准确性
为了研究多孔介质中CO2水合物的生成速率和储气量,利用1.8 L的水合反应釜研究了孔隙为13.8 nm和26.7nm的石英砂中CO2水合物的生成过程,结果表明:孔径为26.7 nm石英砂中,1 m3
目的:探讨4周低氧训练对男子足球运动员有氧耐力相关指标与免疫系统中T淋巴细胞亚群的影响。方法:选取某体育学院及其附属竞技学校20名男子足球运动员为受试者,平均分为训练
<正> 本刊讯 新年伊始,由高等教育出版社控股的教育图书发行中盘——北京蓝色畅想图书发行有限公司成立。 北京蓝色畅想图书发行有限公司是一家股份制总公司,目前在各省还成
针对当前电厂电力监控系统存在的安全问题及当前严峻的安全形势,阐述了基于“白名单”技术的电力监控系统安全解决方案的技术路线及完全自主的知识产权、化繁为简的安全防护
为探究东北自然发酵酸菜中细菌群落结构,本试验采用454 FLX+平台对东北地区传统自然发酵的16份酸菜汁样品中细菌16S rRNA基因的V3-V4区进行测序。通过454焦磷酸测序,共得到302
<正>2006年月21日下午,中国长城学会新春联欢会在军事博物馆举行。中国长城学会名誉会长罗哲文,副会长张文彬、蔡德明,副会长兼秘书长董耀会参加了此次联欢会,董耀会首先简要
不同基质扦插繁殖效果比较试验表明,适宜绿萝扦插苗生长的最佳基质配方是35.3%木糠+35.4%泥炭土+20%珍珠岩+6%石灰+2%奥绿复合肥+0.6%呋喃丹+0.7%敌克松,扦插成活率为100%。
中印两国幅员辽阔、药材资源丰富,都有独特的传统医药体系,如中医学、阿育吠陀等,且都是世界上较有影响力的医学系统。中印传统医学交流始于秦汉,以唐为盛,宋后式微,且与佛教的盛衰直接相关。我国藏蒙医学在发展过程中曾经吸收了阿育吠陀的部分理论、诊疗和治法,但亦具有自身民族和地域特色。本论文以阿育吠陀、藏医、蒙医、佛医、傣医、维医六种医学的药物制剂为研究对象,开展主治、药材、配伍、剂型等方面的对比研究,以期