基于写作风格的中文邮件作者身份识别技术研究

被引量 : 19次 | 上传用户:gghe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络信息的迅猛发展,电子邮件已经成为人们生活和工作中必不可少的、经济而实用的信息交换手段,成为最重要的通信方式之一。在电子邮件给人们带来方便的同时,也出现了许多新的问题,比如,通过电子邮件传播垃圾邮件、病毒邮件、甚至反动宣传和诈骗等违法邮件,造成的危害越来越大,这就需要找出邮件的真正作者并予以处置。而在这些邮件中,发送者总是试图隐藏他的真正身份以逃避侦察,发送者通过匿名邮件服务器可以更改或伪造自己的地址,更改自己的真实姓名等。因此,通过邮件头部信息找出邮件作者的真实身份是一件很困难的事情。这就需要研究一种识别原始邮件作者真实身份的方法,为计算机取证提供依据,追究邮件作者的责任,这无疑为控制电子邮件的滥用提供一种行之有效的方法。本文首先对电子邮件身份识别研究领域的国内外研究现状进行了论述,探讨了现有研究技术和方法。在详细分析中文电子邮件的写作风格的基础上,提出了可用于身份识别的中文电子邮件作者写作特征的提取方法和新的特征模式以及权值确定模型;提出了基于中文电子邮件作者写作特征,利用支持向量机来分类识别邮件作者身份的方法。为防止新邮件的误判,尝试建立了新邮件的验证模型。为了验证所提出的模型和方法的正确性和可行性,本研究对有限数据集进行了实验研究。分别采用不同主题、不同特征、不同数量的特征、不同的模型、不同的核函数、不同的参数以及综合特征等从各个方面进行了实验。实验结果表明本研究提出的模型和方法是可行的,朝着实际取证应用迈出了可喜的一步。
其他文献
打破将散度演化分析局限于水平动力学框架内的传统认识思维,针对大气的斜压性与层结特征将对大气运动散度场演化产生显著影响的事实,从湿斜压原始方程出发,将大气的斜压热力
本研究评价新、老两种鱼腥草注射液制剂在体内对H1N1流感病毒感染的防治作用。采用甲型H1N1流感病毒FM1和PR8株,滴鼻感染正常小鼠和免疫低下小鼠造成肺炎模型,分别进行治疗性
在人机系统的设计中,建立合理协调的人机关系尤为重要。本文介绍了基于人机系统的人的自然行为倾向,概述了人机系统设计中如何有效地利用人的自然行为倾向的研究现状,提出了
目的 快速测定九州虫草中的部分核苷类成分及其主要活性成分虫草素与腺苷的含量 ,并考察九州虫草不同部位虫草素和腺苷含量的分布。方法 用高效毛细管区带电泳法确定野生和
我国港口物流的发展模式已从运输、装卸搬运、堆场、仓储、配送等传统功能向加工、包装、分拣功能、信息处理功能、口岸服务、结算等延伸功能演变。选取16个对港口综合评价有
《红楼梦》中与梅有关的文化相当丰富 ,体现在咏梅、赏梅、赠梅、用梅、梦梅诸方面。在咏梅和赏梅中 ,表现了大观园少男少女对美好事物的赞美和对自身的感怀。在赠梅中 ,则表
[目的]了解青岛市崂山区学校管道直饮水的卫生状况。[方法]2011年5、11月,对青岛市崂山区46所学校(幼儿园)的学校管道直饮水卫生状况进行调查,采集水样进行检验。[结果]检测
目的:分析研究瘢痕子宫再次妊娠经阴道试产的安全性与可行性。方法:选取某医院收治的120例再次妊娠患者,其中60例瘢痕子宫经阴道试产患者作为观察组,另60例为非瘢痕子宫经阴
目前,乳腺癌的常规治疗手段如化疗、放疗等存在严重的全身副作用,为此,开展乳腺癌的靶向治疗研究具有重大意义。本文综述了乳腺癌靶向治疗的3个研究领域:抗体介导的靶向、微
诸多杨树多倍体实例表明,基于有性多倍化的多倍体育种,可以通过一轮次的育种过程实现杨树多目标性状综合改良,获得生长快、纤维长、木素低、纤维含量高以及抗逆性强等性状表