【摘 要】
:
近年来,随着互联网和搜索技术的进一步发展,仅仅对于网页文本的搜索已经无法满足人们的需要,对于多媒体特别是语音数据的检索已经成为当今研究的热点问题,也是未来几年中互联
论文部分内容阅读
近年来,随着互联网和搜索技术的进一步发展,仅仅对于网页文本的搜索已经无法满足人们的需要,对于多媒体特别是语音数据的检索已经成为当今研究的热点问题,也是未来几年中互联网搜索技术的发展方向。基于内容的语音数据检索仍然是研究领域中的难点问题,主要有基于文本的语音搜索和基于语音学的语音搜索这两种方法。前者主要依赖于大词汇量连续语音识别和传统的文本搜索技术;而后者则主要从声学特征出发,从信号处理上对语音进行分析。对于基于语音学的语音搜索方法,以传统的基于特征值的搜索和基于格的搜索为基准,深入讨论它们的优缺点,并在其基础上提出基于语音片段的聚类算法,新的算法准确高效,并能很好得适用于搜索引擎,具有一定的理论价值和应用前景。对于基于文本的语音搜索方法,主要关注于它与基于语音学的语音搜索的结合。并在基于语音片段的聚类算法的基础上,提出了两者结合的算法的公式,更大的扩展了新算法的适用性。对于搜索结果的整理,已经不在仅仅局限于传统的排序,而关注于现在流行的对搜索结果的聚类算法。在对现今的主流算法进行分析的同时,提出一种新颖的基于搜索的聚类算法,该算法可以说是对搜索引擎的一种全新的运用。Reference case finding系统是一个以上述关键算法为基础的语音搜索引擎。它以电话数据为主要实验对象,提供一个完整的混合了基于语音学和文本的语音搜索引擎和对搜索结果的自动聚类工具。经过测试,该系统的性能和效率良好,能达到一个优良的搜索引擎所必须的准确率和搜索速度,在实践的基础上证明了新算法的可行性。
其他文献
实时系统是一种带有时间约束的计算系统,这些系统的许多动作的完成是与时间相关的,即要满足一定的时间限制。为了确保实时系统的正确性和可靠性,需要对其进行严格的分析和验证。
随着TB量级的计算技术与通信技术的发展,TB量级的存储技术成为必然。人们对数据存储与读取速度的要求也越来越高。为了满足这些要求,出现了多种网络存储架构。存储局域网(SAN
随着社会的进步和科学技术的迅猛发展,我们已逐渐迈入以自动化和信息化为平台的智能化社会。智能小区是近年来产生并迅速崛起的一种新型住宅群,它为住户提供了一种更加安全、
随着Internet的飞速发展,各种异构数据交换越来越频繁,XML(eXtensible Markup Language)作为一种Internet上主要的数据表示和交换标准之一,应用范围非常广泛,如电子商务、Web
数据库技术的逐渐成熟、网络技术的迅速普及和计算机硬件的不断出新,使人们采集数据的能力得到了极大的提高,从而导致了全球范围内数据存储量的急剧增大。为增强人们对这些海量
缓存技术和预取技术是解决Web访问延迟问题的主要方案。虽然缓存技术在互联网上有着非常广泛的应用,但是单纯的缓存机制只是利用WWW的访问模式的时间局部性,对于未曾访问过的内
在光盘系统中,通道编码方法对于通道性能有很大的影响,是光盘标准制订过程中需要重点考虑的因素之一,也是光盘标准中知识产权关注的要点,因此一直都是国内外研究的焦点。游程
随着语义Web的迅速发展,语义Web中的信息量呈现爆炸式的增长趋势,如何从海量信息中快速、准确的获取有用信息成为一个热门课题。RDF(Resource Description Framework,资源描
智能视频监控是利用计算机视觉和图像处理的方法对摄像机拍下的图像序列进行自动分析,实现对场景中运动目标的定位、识别与跟踪,并在此基础上对目标的行为进行分析与判断,从
3G的蓬勃发展和4G的悄然到来,无论是个人还是企业团体,都越来越深入地走进了现代信息化的生活,基站作为支持信息传播最基本和最重要的硬件,同样遇到了挑战。基站具有数量多、