论文部分内容阅读
时序数据分析是一项重要的数据挖掘技术。在现实中,该科学技术不仅可以用于发现时序数据中潜藏的发展模式或演化规律,而且也可以用于预测时序数据的未来发展趋势。时序数据分析通常包含两个方面的科学研究,即结构学习和模式预测。其中,结构学习的目标是利用时序数据样本之间的内在关系来提炼出新型的样本特征或者样本标签;模式预测的目标则是在样本特征和样本标签之间建立起有一种有效的映射关系。相比于传统的时序数据分析方法通常将上述两者视为相互独立的模块,本文认为结构学习和模式预测存在着内在的互动联系,并且从理论分析与模型设计上阐明结构学习和模式预测是相互支持与相互促进的。本文深入分析了实际应用中可能出现的各种问题和挑战,在研究大量前人先进工作的基础上,提出了多种联合结构学习模型和模式预测模型的新型时序数据分析算法。论文工作的主要内容和创新之处在于:一,提出了一种基于消费者社会影响力分析的商品行为研究算法,并实际应用于女装商品的销量预测。该算法首先利用电子商务平台中的商品数据和消费者数据来建立商品特征和消费者特征,并以此研究商品之间的竞争合作关系和消费者之间的社会影响力。其次,考虑到实际中的商品销量变化同时存在平缓性以及波动性,该算法将商品销量分解为销量主体部分和销量噪声部分,并分别进行回归建模。最后,该算法建立一种有效的优化模型来联合实现消费者社会影响力的挖掘与商品销量的预测。二,提出了一种基于慢特征分析的人脸年龄估计算法。该算法首先联合人脸样本的时序结构和上下文结构来建立结构化人脸序列,并以此表征人脸样本的内在结构。其次,该算法利用上述的结构化人脸序列来提取人脸样本的慢特征,并将其作为一种新型的人脸特征。最后,该算法建立一种有效的优化模型来联合实现结构化人脸序列的构造和人脸样本年龄标签的预测。三,提出了一种基于自适应年龄分布学习的人脸年龄估计算法。该算法首先利用子空间技术来发现人脸样本的上下文结构。其次,该算法基于样本上下文结构来建立人脸样本的年龄分布,并将其作为一种新型的预测目标;并且,样本年龄分布的建立可以有利于研究者理解上下文相关样本中的时序年龄关联性以及分析年龄标签模糊性问题。最后,该算法建立一种有效的优化模型来联合实现人脸样本上下文结构的发现与人脸样本年龄分布的预测。