论文部分内容阅读
社会性网络不同于普通的静态网络,社会性网络中的网络结构伴随着时间变化而不断变化,一定程度上反映了真实世界的状况。股票交易量能够很好的反映群众对事件发生的现实反映,而股吧中的发帖量及发帖内容能很好的反映群体在网络虚拟世界里对事件的真实反映。然而,同一件事件的发生,群体在虚拟世界和现实世界的反映可能一致也可能不一致。本文最后针对两个世界行为是否有一致性也做了相关研究。本文着重研究基于事件现实世界中交易行为。对股票的日交易数据进行数据挖掘分析。由于股票交易时间序列具有非平稳,非线性等特征,所以要先对它进行分线段性表示。本文采用了基于特殊极值点将序列分线段表示。然后再进行异常检查,聚类等分析。异常检测采用的方法根据股票交易量的特性来检测的,主要根据分线的斜率来判断的。分别对每支股票的交易时间序列进行异常检测,分析出异常的时间段(点),同时得到异常序列的时间域。并且每支股票的异常都用一个事件函数来表示。由于股票交易时间序列具有伸缩性,聚类分析采用的是基于改进的动态时间弯曲(DTW)的聚类方法。股票交易时间序列中的每个异常序列都视为一个事件,再通过聚类分析查找出具有相同异常交易行为的股票,而这些股票所属的领域可以从实验室所研究的基于领域的知识图谱中找到,最后就判断出事件所影响到的时间域和空间域。本文对交易行为时空域的研究是为之后分析虚拟世界行为与现实世界行为的联系做准备。在实验部分也对股票贴吧(股吧)中各股的帖子量进行分析,这属于虚拟世界行为研究。最终找出由事件引发股民去发帖热议某一话题的股吧。将这个结果与由股票交易量分析出来的结果相比较,判断事件对两级世界的影响中存在的关系。