自动文本聚类系统的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:wwwenda
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文对自动文本聚类技术的现状和发展进行了简要的回顾.阐述了文本聚类技术的应用需求和与相关领域技术的互通性及发展上的相互作用;针对大规模文本集探讨了实现自动文本聚类系统的关键技术,提出了采用奇异值分解技术构造概念空间模型,并用此模型表示文本实现自动文本聚类的机制,文中对采用奇异值分解构造概念空间模型的数学基础和理论依据进行了详细的分析和论述,然后,对此自动文本聚类系统进行了编程实现,最后进行了测试,并对得到的测试结果进行了分析和讨论.
其他文献
CDMA2000是第三代移动通信系统的主要技术标准之一,其关键技术以IS-95为基础,保持了与第二代通信系统良好的兼容性,同时又采用了多项新技术,支持从话音分组数据到多媒体业务,
数字示波器是电子测量领域最常见的一种检测工具,为科研工作者和工程技术人员广泛使用。但是传统台式数字示波器一般都是体积庞大而略显笨重,使用范围局限于实验室,不方便进行现场测试和外部作业,而且大都采用实体按键,波形效果显示平淡,不能与互联网连接。所以设计一款简单便用、自动测量并能直观显示便携式数字示波器很有意义,而且该示波器并具有支持多点触摸,显示色彩绚丽,操作界面友好等特点。课题旨在设计一款Andr
在当今各种通讯系统中,语音通讯一直是一项重要的,必不可少的业务.随着通信网络用户数量的增加,网络业务更加综合化,多样化,系统容量,服务质量与网络带宽的矛盾也日益突出,如
SCDMA(同步码分多址)系统是使用智能天线、同步码分多址和SWAPTM(同步无线接入信令规范)信令、用软件无线电实现的无线通信系统。受多种因素影响,SCDMA系统的语音质量一直不理想,有