论文部分内容阅读
证券市场是经济的晴雨表。我国证券市场规模庞大,总量接近40万亿元,证券市场既是优秀企业进行融资同时带给股民红利的场所,也是国家经济安全的要塞。对证券市场的研究越来越受学者们的关注,大量的计算机技术被引入到证券研究中来,各种技术手段大多依赖于对大量历史数据的研究。股票交易每天产生大量的数据,在分析处理之前有必要对这些数据进行压缩。股票交易数据具有时间序列特征,对股票时间序列进行特征表示时要充分考虑股票领域理论知识,这样才能尽可能多的保留股票时间序列的趋势特征。本文在综合研究不同的特征表示方法优劣的基础上,同时对股票理论和K线进行充分研究,提出了一种新型的时间序列分段表示法。该分段方法具有拟合误差小、压缩率高、易于扩充数据、对股票交易序列趋势特征保存良好的优点。相似性度量是对股票时间序列分段表示后进行的距离比较,一般是比较股票的价格、涨幅等。本文提出一种时间序列分段表示后的形态拓扑结构的相似性度量新方法,根据一定规则将多个分段组合成一个走势段,走势段的划分将符合道氏理论、波浪理论等证券理论的基本原理。用走势段内各个分段构成的拓扑结构来识别和区分走势段的类型,并将其符号化,把股票按其走势的形态进行分类,从而利用数据挖掘功能找出其变化规律,作为股票交易的依据。