股票日线数据网上分布式抓取的设计与实现

来源 :信息与电脑(理论版) | 被引量 : 0次 | 上传用户:ashwingangel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要对数据量大、更新快的股票行情数据采用网上分布式抓取的设计和实现,使用了Java网页抓取分析技术、Oracle存储技术和分布式设计,有效提高了数据抓取速度和数据量。对此,本文将采用Java网页抓取分析技术、Oracle存储技术、分布式设计,来实现股票日线行情数据的网上分布式抓取。关键技术本文主要用到了如下关键技术:1 Java网页抓取技术使用Java的URL类实现对网页数据的抓取,并使用Pattern类进 In this paper, the main data on the amount of large, updated stock market data using online distributed crawler design and implementation, the use of Java web crawling analysis technology, Oracle storage technology and distributed design, effectively improve the data capture speed and data the amount. In this regard, this article will use Java web crawling analysis technology, Oracle storage technology, distributed design, to achieve online daily online stock market data capture. The key technologies This paper mainly uses the following key technologies: 1 Java web crawling technology Use Java URL class to crawl webpage data, and use the Pattern class
其他文献
相同任务 共享一个网盘  首先需要申请一个华为网盘账号,同时,工作双方都要在自己的PC上下载和安装华为网盘PC客户端软件(如图1)。与此同时,双方电脑上的华为网盘PC客户端软件都用同一个账号登录(注意,相同的账号登录十分关键),建议最好将登录设为“记住密码”和“自动登录”,这样免得忘了登录而下班回家后才发现无法实现数据自动传送(如图2)。  协同工作 全仗智能备份  工作双方均通过华为网盘客户端,