论文部分内容阅读
投资者可以基于技术分析构建技术指标来预测资产价格走势,技术分析构建技术指标的过程为从历史价格信息中提取预测特征的过程,神经网络可以实现特征的自动提取;投资者也可以通过分析市场对宏观新闻的反应来预测资产价格走势,同时以神经网络表示的语言模型能学习到文本的概率分布,并得到新闻文本的向量表示,本文以神经网络连接两种信息构建预测市场的模型。本文以外汇市场为研究对象,选取了市场上以美元为核心的七个主流交易货币对,通过分析证明了本文所选新闻与货币对的相关性以说明实施本文预测方案的可行性。通过引入机器学习的框架,将预测问题转化为有监督的二分类问题,本文研究了本文构建的特征和深度神经网络模型在这七个货币对的不同周期上的预测正确率。具体来讲,本文收集了欧元/美元、英镑/美元、澳元/美元、纽元/美元、美元/加元、美元/人民币、美元/日元七个主要货币对的从2013年1月1日到2019年12月20日的历史K线日数据,爬取了FX168财经网站的从2013年11月25日到2019年12月20日的外汇新闻,以过去120个交易日的历史价格K线和经由文档嵌入模型向量化的当日新闻数据为特征,预测汇率这七个货币对在3,5,10,20个交易日后的涨跌。本文研究表明:将两种特征融合的神经网络模型在所有货币对的所有周期的涨跌预测上表现出了显著的预测效力,其平均样本外预测正确率显著高于单独使用其中某一种特征构建的神经网络模型的样本外预测正确率。单独以历史价格K线或新闻作为特征的预测方案只在某些货币对的某些周期中表现出比较明显的预测效果,此两种方案的有效性低于融合方案。同时,本文还发现,以价格为特征的预测方案在10,20个交易日后的涨跌预测中高于其在3,5个交易日后的涨跌预测,而新闻方案表现得较为平均。本文还发现所有模型均在纽元/美元、欧元/美元、英镑/美元、美元/日元四组货币对上表现了很高的样本外预测正确率,而在其余三组货币对上的表现都较为差,说明货币对可预测性与其本身有关,尚不清楚背后的原因。最后,本文分析了造成各个模型表现差异的原因,由于技术条件导致价格K线方案的神经网络没有过拟合是价格模型表现较差的原因,而新闻特征维度过低造成的新闻文本地低效表示可能是新闻方案表现较差的原因,对此本文提出了一定的改进和展望。