【摘 要】
:
随着移动互联网的发展,互联网已经融入人们工作和生活的各个角落,成为人们获取和传播信息的重要方式。然而信息科技的飞速发展导致的信息爆炸使得人们想获取的信息往往存在于
论文部分内容阅读
随着移动互联网的发展,互联网已经融入人们工作和生活的各个角落,成为人们获取和传播信息的重要方式。然而信息科技的飞速发展导致的信息爆炸使得人们想获取的信息往往存在于浩瀚的信息海洋里,给人们带来了信息甄别的困难。在这种条件下,精准的个性化服务对提供更好的互联网服务尤为重要,如何给互联网用户画像成为当前热门的研究课题之一。本文主要研究利用用户文本数据进行用户兴趣建模,主要工作如下:首先研究短文本分析中的基础问题,通过改进中文分词算法、新词发现算法和关键词抽取算法解决了短文本处理基础问题,用于后续分析工作。其次研究短文本分类方法,在对比和分析了传统分类算法的优劣之后提出了基于词空间聚合的短文本向量的训练方法,并应用于微博短文本分类,提升了分类效果。最后在短文本分析的基础上,基于关键抽取和扩展并融合词向量的思想进行用户兴趣建模,在此基础上通过主题模型和用户向量关系来进一步增强模型的可扩展性和稳定性,取得了不错的效果。
其他文献
近来证据表明除五聚体C-反应蛋白(C-reactive protein,CRP)外,单体C-反应蛋白(monomeric CRP,mCRP)在炎症与心血管疾病之间发挥了重要的作用。然而目前还没有合适的mCRP定量
东道海子北环带中生界是高效油气藏勘探较现实的领域,该区接受东道海子凹陷和盆1井西凹陷两大生烃凹陷的油气充注,且中生界成藏条件有利,埋藏浅,产量高,在滴南凸起发现滴20、
本文通过两个课堂观察量表,对上海交通大学初级阶段不同汉语水平的两个口语班级任务型教学法实施情况进行观察分析。同时,对所在班级的教师和学生进行访谈,以此来补充课堂观
随着我国经济水平日益发展,民众对汽车购买欲上升,汽车资讯类新闻逐渐增多,汽车新闻资讯的汉译的重要性也不言而喻。本翻译实践文本来自于笔者实习的车企的汽车新闻,主要为企业内部员工供广泛而丰富的汽车资讯,其内容包括企业内部资讯、行业资讯、竞品对手资讯等。本文将从关联翻译理论的视角分析汽车资讯类新闻的英汉翻译,并在翻译过程中分析和选择适合的翻译方法与翻译技巧。奥古斯特·格特的关联翻译理论将翻译视为一种言语
细菌素是由某些细菌在代谢过程中通过核糖体合成机制产生的一类具有生物活性的多肽或蛋白质类物质,因具有不易使肠道病原细菌产生耐药性且无致畸变、无毒性蓄积作用,被认为是
鉴于粉虱危害的严重性及其抗药性问题的日趋严重,全世界都在寻找有效合理治理粉虱的方法。本研究鉴于座壳孢菌的优点以及我们已有的菌株贮备,本研究的目标主要有:(1)对本实验
MicroRNAs(miRNAs)是由长度约21~25个核苷酸序列的RNA分子组成的,是哺乳动物和植物中基因转录后调控的关键因子,并且彻底改变了我们对基因转录后调控的理解。目前研究发现大部
改革开放后,中国金融市场持续发展,而各类风险事件也相继频繁发生。其中,信用风险涵盖范围最广,是需要管理与防范的重要内容。同时,最近几年的上市公司其数量逐渐增多,以此为背景,便增加了信用风险,在信用风险度量方面也更加困难,精确的度量和预测上市公司的信用风险成为重中之重。本文在研究过程中,参考学习国内外有关信用风险技术,对各种信用风险度量模型是否适用于我国的状况作出明确,并最终从中选择一种信用风险度量
当视觉刺激出现在先前注意停留过的位置时我们对其加工效率会降低,这种注意的抑制性机制被称作返回抑制。返回抑制被认为通过抑制注意返回先前停留的位置从而提高个体对视觉
首先采用定容压力搜索法测量了浓度为0.29%,1.0%的TBAB溶液作为介质时生物质气化气水合物形成的平衡条件。然后本文针对生物质气化气中二氧化碳的分离的问题,研究了不同压力,