论文部分内容阅读
随着计算机应用技术和互联网技术的迅猛发展,海量信息通过互联网快速传输,人们交流信息的方式变得多元化,但也让信息的安全传输面临着考验。近几年,各种网络软件作品的版权争议、文本信息非法盗用等问题层出不穷,重要的信息找不到合适的载体在网络中安全传输,通过加密算法生成的密文也由于字符乱码引起第三方的注意和攻击。因此,如何提高信息的传输安全性与隐蔽性成为了亟待解决的问题。本文研究文本信息隐藏技术,为重要的信息提供安全传输的载体,进一步完善基于自然语言的文本信息隐藏技术,主要研究工作包括以下两个方面:(1)针对基于同义词替换规则的文本信息隐藏技术中存在的同义词词语类别和一词多义的问题,提出基于二元依存同义词替换隐写算法。该算法从WordNet词集中选择语义相同的目标词语作为候选同义词,利用依存句法分析器得出同义词在语句中的二元依存词语搭配关系,计算各候选同义词在大规模语料库中出现的二元依存搭配关系成分频数,构造同义词词频规模度和二元依存同义词搭配重要度,计算目标词和各候选同义词的依存向量距离,得到同义词替换合适度。实验结果表明,该算法提高了上下文语句中同义词替换准确率,有效抵抗同义词结对统计分析检测和同义词相对词频统计分析检测。(2)为了保持文本统计特性不变,提出基于字典排序的选择题选项隐写算法。该算法利用选择题内部选项字典排序规则进行编码,然后根据秘密信息从题库中选取选择题组成隐写文本,通过改变选项顺序嵌入秘密信息。同时,将基于二元依存同义词向量距离的隐写算法与基于字典排序算法混合嵌入秘密信息,生成选择题隐写文本。实验结果表明,该混合选择题隐写算法生成的文本在抗隐写攻击能力和鲁棒性均高于现有文本信息隐写算法,具有高嵌入比特率,并能抵抗统计分析攻击。本文的研究是对基于自然语言的文本信息隐藏技术中的英文同义词替换规则存在的不足进一步改进,同时论文的研究工作和成果对于选择题文本信息隐藏技术具有一定的科学意义和研究价值。