论文部分内容阅读
随着通信技术、计算机技术和网络技术的发展,会议系统越来越多的应用在人们的社会生产和生活中。目前跨地域的企业内部会议,企业间的商务会议等正越来越多地使用会议系统。各个企业用户每天都会接收到大量的会议通知等各种信息。对于这些信息,企业用户需要人工过滤和筛选。这样的工作不仅耗费了大量的人力资源,降低了信息流通的时效性,也降低企业员工的工作效率和质量。因此对会议信息进行智能的自动化过滤需求非常急迫。
目前,尽管信息过滤相关技术的研究在某些领域中有所应用,比如有邮件过滤、网关信息过滤等,大多数的过滤研究集中在客户端,这样就可以使用效果比较好、相对负载较高的算法,如SVM算法等来实现过滤功能。而国内外对于会议系统的信息过滤的研究还处于初始阶段,与其他大多数过滤系统相比,会议系统普遍要求在服务器端进行信息的训练和分类过滤,这样就对服务器端的过滤算法的性能效率有更高的要求。另外,由于与其他领域的过滤模型有一定的差异性,本论文就需要进行相关的算法设计,建立新的模型。
本论文介绍了会议信息过滤的数学模型,并作了智能过滤相关模块的设计。考虑到系统负载和分类准确率等因素,智能过滤采用并实现了基于朴素贝叶斯算法的信息分类引擎。同时也采用了效果较好的χ2统计作为评估函数来进行特征抽取,优化过滤效果,以提高分类的准确率。
文中给出了关键算法的研究与实现,最后通过实验给出了实验结果和数据分析,做出了结论。