论文部分内容阅读
在当今社会中,越来越多的信息科技被应用到各个领域,在刑事案件侦破上,也体现出了这种趋势。在公安机关侦查案件时,刑事模拟画像技术是一种重要的侦查手段。公安机关可以根据目击者的叙述,绘制犯罪嫌疑人的相貌特征,从而大大提高侦查破案的几率。然而模拟画像技术员通常绘制的画像是手绘的素描图像,因此,急需一种技术能高效准确地把手绘的素描人脸图像转换为彩色人脸图像,还原人脸图像的相貌特征。随着GAN在生成清晰图像上的成功,基于GAN的方法在处理图像翻译任务上受到越来越多的国内外研究者关注。为了使得人脸图像翻译方法具有更好的翻译效果,本文提出了一种基于生成对抗文本的人脸图像翻译方法(T-GAN)。该方法使用一个Word-LSTM模型来提取文本特征,文本特征与所匹配图像能产生更高的兼容性分数。然后结合生成对抗“博弈”的思想,设计了生成对抗文本网络,对判别器增加了第三种类型的输入,由真实图像伴随着不匹配的文本组成。通过这样的方法,强化判别器的训练效果,强迫判别器判断生成的图像是否符合文本描述,让判别器能够更好地学习文本描述和图像内容的对应关系。又由于在训练过程中,文本描述数量是限制生成图像效果的一个重要因素,故本文通过在训练集的嵌入之间进行插值来生成大量额外的文本描述。为了验证本文方法的有效性,在CelebA人脸数据集上测试本文方法以及对比方法。实验结果表明,本文方法具有使用价值,在各种肤色、发色人脸图像翻译任务上都给出了高质量的图像翻译结果,并与其他图像翻译方法相比较,翻译效果更好。