时态文本数据的周期性挖掘研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:zuiainivip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生活中的信息随时间不断变化,数据库中记录的信息大都也带有时间维,对带有时间维的数据进行挖掘逐渐成为数据挖掘领域一个非常重要研究课题,周期模式作为时态数据库中用于理解时态数据的一个非常有意义的特征,可以很好的反映事件演变规律,指导现在的生活,越来越受到国内外学者的关注。同时,生活中的信息80%以文本形式存在,然而,目前很少有人研究带有时间维的文本数据,因此考虑文本数据的时间属性,研究时态文本数据的周期模式会是一个非常有趣而且有意义的研究方向。本文从以下几个方面对文本周期进行了研究:(1)从文本挖掘、周期模式挖掘的研究现状引入了文本周期模式挖掘的研究现状和不足,提出了本文的研究内容;(2)在时态型、时态因子、时间粒度的基础上,给出了多粒度时间间隔和粒度转换的定义和性质,构造了一个多粒度时间下的文本周期模型;(3)在多粒度时间间隔的基础上提出了周期长度固定不变的严格周期模式和周期长度可以在一定时间段范围内波动的宽松周期模式。并定义了周期模式的支持和置信度,以及周期模式的覆盖关系,证明了周期模式的相关性质;(4)研究了周期模式的挖掘算法,提出了基于划分的Apriori算法和借鉴蚁群算法的思想计算周期长度并对1990年到2009年的生物医学文献进行了实验,实验表明算法可以挖掘出一些有效的周期模式。本文获得的主要成果和创新点为:1.提出了多粒度时间间隔和粒度转换的数学定义,并给出了相关性质;2.构造了多粒度时间下的文本周期模型;3.提出了周期严格周期模式和宽松周期模式的定义,给出了借鉴蚁群算法思想的周期模式挖掘算法。
其他文献
一、复习导入  1. 出示词语,检查预习。  阳光普照 桃红柳绿 草色青青  绿草如茵 波澜起伏 不知疲倦  奔腾而去 司空见惯 遇水必观  意味深长 一番宏论 深思熟虑  2. 引导学生思考:老师的积累有什么特别的地方?(预设:物、水、人)提醒有序的分类不仅能帮助大家高效地积累词语,还可以幫助我们理解课文内容。  3. 聚焦课题,思考:这是一篇写什么的文章?写了什么事?  4. 对于孔子,你能用
期刊
  有关高等教育绿色化问题的研究正在引起学术界的广泛重视,而培育绿色人才作为建设绿色大学的核心内容之一,更受到了社会的普遍关注。所谓绿色人才是指具备了和谐存在意识和
特发性血小板减少性紫癜是一种常见的出血性自身免疫性疾病,它的发病机制错综复杂,目前尚未完全明确.近年来,由于分子免疫学、细胞生物学以及分子遗传学的快速发展,ITP的发病机制也取得了很多新进展.本文将从血小板免疫、分子模拟、基因调控失衡、Fas/FasL凋亡途径缺陷、Fcγ受体、HLA遗传多态性、细胞因子多态性、Th1/Th2类细胞漂移、自身T细胞功能缺陷等多个角度,对ITP的发病机制作一综述。
《语文课程标准》每个学段都强调诵读,且注重诗歌的积累,每个学段都对诗文背诵做出具体的篇数要求。结合《语文课程标准》的要求,笔者认为读才是诗歌教学的落脚点。一、读顺诗词,初识大意  书只有读熟,意思才会领悟。课堂上要给学生充分的阅读时间,在初读环节,重点纠正易错读音,读通、读熟、读正确是理解诗歌的第一步。比如,在教学古诗两首《夜宿山寺》时,我重点让学生读准“星辰”“恐惊”“夜宿”,注意平翘舌音、前后
期刊
【中图分类号】G633.2 【文献标识码】B 【文章编号】2095-3089(2015)36-0189-01  政治课教学是学校教育教学的主渠道。但思想性,时代性,社会性,理论性,实践性很强的科目普遍存在着教师难教,学生难学,教学质量不高等现象。要改变这种情况,达成素质教育,全面提高学生的知识,能力,觉悟,我觉得应该运用新理念,从实际出发,大胆改革,创新教学方法。  一、课前预习,收集资料  正是
【摘要】PBL是基于拟真情景问题的以学生为中心的教育方式。与传统的教学模式相比,PBL教学提高了学生的学习兴趣,增强了学习主动性,培养了学生临床思维,以及综合能力的提高;也能促进指导教师业务水平的提高,真正做到教学相长,文中讨论了外科案例教学过程中,对PBL教学模式的探索应用、效果及经验体会。  【关键词】PBL教学法 ; 外科教学 ; 应用  【中图分类号】R656.7-4 【文献标识码】B 【