高维数据相似性度量方法研究

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:SCY512355337
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将低维空间中的距离度量方法(如Lk-范数)应用于高维空间时,随着维数的增加,对象之间距离的对比性将不复存在。研究高维数据有效的距离或相似(相异)度度量方法是一个重要且具有挑战性的课题。通过对传统的距离度量或相似性(相异性)度量方法在高维空间中表现出的不适应性的分析,并对现有的应用于高维数据的相似性度量方法进行总结,提出了高维数据相似性度量函数Hsim(X,Y)的改进方法HDsim(X,Y)。函数HDsim(X,Y)整合了各类型数据的相似性度量方法,在处理数值型、二值型以及分类属性数据上充分体现了原Hsim(X,Y)处理数值型数据、Jaccard系数处理二值数据以及匹配率处理分类属性数据的优越性。通过有效性及实例分析,充分论证了HDsim(X,Y)在高维空间中的有效性。
其他文献
利用文献分析法和问卷调查法,依托22家城市电视台新闻栏目的反馈内容,分析了城市台民生类新闻节目实例。认为在国家台新闻、省级卫视新闻、娱乐节目及新媒体网络节目的多重冲
《四库全害总目》是古典目缘孥的集大成之作,缝承了中圆目鲸旱“辨章旱钭亍,考镜源流”的侵良傅毓,它不懂是古典目缘学的里程碑之作,逯是一部具有很高孥衍儇值的文旱批评著作
近年来,外墙贴砖特别是外墙外保温贴砖的可行性引起了业界的广泛关注。JG126—2000《外墙饰面砖工程施工及验收规程》标准针对不同气候区对外墙陶瓷砖提出了吸水率、抗冻融能
明朝自洪武元年(1368)起至崇祯十七年(1644),统治时间长达二百七十七年,是我国历史上持续时间较长的朝代。明代刻书相应亦夥,现今明版书存量约两三万部。因此,明朝是我国古籍
采用反相气相色谱法将离子液体作为固定相测定了27种溶质(烷烃、芳烃,卤代甲烷、醇、酮、醚、酯、三乙胺、二硫化碳、四氢呋喃、乙腈、吗啡啉、吡啶和水)在离子液体1-乙基-3-甲
目的:探讨超声检查在胎儿先天性心脏病的诊断及其临床应用价值。方法:选择我院门诊及住院的孕妇进行胎儿心脏超声检查,产后对新生儿进行超声心动图随访。结果:非紫绀型先天性
在研究二维码及其手机识别技术的基础上,开发了基于Android平台的手机二维码识别系统,在系统架构设计中将二维码识别系统的平台支撑层、客户端应用层、云端处理层进行分层设
<正>近日,辽阳市地税局、国税局、财政局联合签发文件,从今年6月1日起,全市各县(市)区地税局在对应的县(市)区国税局办税服务厅内设置一个地方税费征收窗口,负责征收个体工商
民主在当今社会已经成为了人们普遍追求的政治价值。民主政治从形式上看是为实现人民统治而设立的各种民主政治制度,而实质上则是人民的统治。中国民主政治在形式上是为实现
文章从宏观角度研究财务会计的概念、特征,通过揭示宏观财务会计核算的主要内容,使我们能够站在宏观的高度上认识会计问题、处理会计问题,具有一定现实意义和社会价值。本文