基于大规模语料库的汉语词相似计算

来源 :中原工学院学报 | 被引量 : 0次 | 上传用户:fsp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对词语相似度这一问题,在大规模语料库上,通过分布相似对汉语词相似进行了研究.实现了一个词相似计算平台,可灵活组合各种计算词相似算法,新增加语料库可以被增量式用于计算;对比研究了基于距离的度量和基于概率的度量2类算法的性能,通过和人工创建的黄金标准进行比较,基于概率的度量算法要优于基于距离的度量算法.
其他文献
利用HOLLIAS公司的先进集散控制MACS系统的硬件和软件对双容水箱对象构建了串级控制系统.通过MACS系统硬件中的FM148模拟输入单元现场采集2组检测数据,由FM151模拟输出单元输
对于刑事强制措施制度正当性的分析能够为该制度的完善提供方向性参考。既有研究更多的从制度的一般正当性考虑的多,从刑事强制措施制度正当性的内涵及标准进行分析,可以有利
提出了一种基于训练集的自动文摘方法.依据训练集所产生的主题词,设计出一种新的段落加权公式和一种新的句子重要性加权公式,将生成的主题句消除冗余后得到文摘.测试结果表明
服务经济时代,服务质量管理是服务运作和服务营销的重要研究问题之一.本文以某企业为例,以笔者多年从事的服务质量管理的经验为基础,从顾客满意度这个角度对服务质量管理进行了一