基于域的中文数据清理系统分析与设计

来源 :北京林业大学 | 被引量 : 0次 | 上传用户:puhongjin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库营销作为一种新兴的营销手段,可以帮助企业更好的了解顾客资料,从而开展更加个性化的客户服务或者营销活动。但随着信息系统数据的增多和不同系统数据整合的过程中出现的“脏数据”的问题,严重影响了数据的质量。数据清洗的目标就在于解决各式各样的“脏数据”问题,提高数据质量从而保证数据更好的支持企业的各种分析或其他应用。  基于现有数据清洗理论,引入了域的概念,研究了针对12种域类型的验证规则、内涵信息以及域之间的关联关系,并在此基础上设计了基于域的数据清洗系统。将基于域的数据清洗系统作为对常规查重的补充和支持,设计了相应的基于域思路的数据分析报告,以及针对空值及异常数据的处理方法。同时,提出“二叉B-树”数据结构进行字符串识别,提高了数据拆分的效率。
其他文献
阿尔卑斯山谷中一条公路上插着的标语牌上写着这样的标语慢慢走,欣赏啊!我很是喜欢,也给了我很大的启发。这是旅游的心态,也应该是教育研究的心态,更应该是对待生活的心态。  教育研究的过程应该是一个享受的过程,关注的是过程而非结果。只有享受过程才能真正的体会研究过程中的快乐,才不会计较最终自己究竟得到了多少,才不会被名誉和金钱所累。  苏联大教育家苏霍姆林斯基曾说如果你想让教师的劳动能够给教师带来乐趣,
湖南省“十二五”教育技术规划课题《信息技术与教学方式的整合研究》是我校课题组2011年7—11月通过开题论证申报成功的课题,批准文号为HNETR0439。经过两年来的反复研究与实践,我们对课题的原始建模进行了扩充与修改,本文试就新的建模作些诠释,以便为课题的进一步研究铺垫道路。   一、建模信息技术应用于课堂教学的基本原则  我们认为这种能进行文本、图形、图像、动画、音乐、声音等各种信息处理和组合
在接近二十年的中学物理教学中,发现物理概念的教学占有极其重要的地位。目前, 在概念的教学中存在的问题是:对概念教学应该达到的目的不明确,忽视概念建立的条件和背景,断头去尾,取其表面略其质等等。导致学生对概念只会死记硬背, 不能正确理解和灵活应用。本人就教学中经常出现的比值定义法中的一种性质量的定义,谈谈自己的粗浅认识。  比值定义法就是用两个或两个以上的物理量的比值去定义另外一个新物理量的方法,
【关键词】分组教学 信息技术 课堂教学  在当前小学的信息技术课堂中,学生的信息技术水平是参差不齐的,特别是在一些乡镇小学,这些现象尤为明显。那么在这种情况下,经过实践尝试,我认为在小学信息技术课堂上实施“分组教学”是一种比较有效的教学方法。根据学生现有的信息技术知识水平或教学内容把全班学生分若干小组,每小组成员为4—6人,根据小组成员信息技术水平,选取1名水平相对较好的学生作为组长。每节课教师首