【摘 要】
:
随着大数据和人工智能时代的到来,数据已经成为每一个行业的重要生产因素以及企业命脉,而获得数据并对数据进行分析已成为大数据时代最重要的部分。提出了一种基于Selenium框
【机 构】
:
陕西工业职业技术学院信息工程学院,西安科技大学计算机科学与技术学院
【基金项目】
:
国家重点研发项目(2019YFB1405000),陕西工业职业技术学院院级项目(KCZ19-04)
论文部分内容阅读
随着大数据和人工智能时代的到来,数据已经成为每一个行业的重要生产因素以及企业命脉,而获得数据并对数据进行分析已成为大数据时代最重要的部分。提出了一种基于Selenium框架的定向网络爬虫设计方法。通过Python操作自动化测试框架模拟人工浏览网页的方式,绕过一些动态网页中通过复杂JavaScript编辑的复杂反爬虫加密算法而获取指定页面信息,完成数据正常获取,提高爬行效率。利用该爬虫对豆瓣网页电影评论页面数据分类爬取,具有针对性强、操作简单且数据准确等优点。
其他文献
根据某锻造企业的实际需求,分析了质量管理系统在该企业应用的必要性,设计了系统的总体框架及业务流程,利用JSP技术,并基于B/S(Browser/Server)结构开发了系统的功能模块。实践
针对高速喷气织机恒张力控制问题,通过对高速喷气织机织造工艺技术的研究,在分析纱线张力影响因素的基础上构建了喷气织机纱线张力数学模型,提出了一种改进的模糊神经网络PID
船舶引航员(以下简称引航员)是世界公认的高风险职业,人身安全风险主要来自其登离船过程。引航员伤亡事件频发便是佐证,主要原因是引航职业的性质决定了所引领船舶的不确定性
根据MBD研究现状,分析了三维元器件建模方法,并提出了一种基于UG、Mentor、Teamcenter8的三维元器件模型库建立方法。采用参数建模方式,对接口技术进行了开发,从而方便了属性
大气偏振效应不仅可应用于高分辨率定量遥感,其偏振场模式图还可作为偏振导航的信息源。大气偏振场模式图在不同时空与天气条件下对偏振传感器的导航精度有重要影响,天空偏振
红色旅游自20世纪90年代后期出现以来,一直被认为是对人们进行爱国主义教育和革命传统教育的鲜活教材。经过近10年的发展,如今,红色旅游与德育的结合日益紧密,而它的德育功能的发
考虑到我国金融市场受宏观政策等影响较大,社保基金的波动可能存在结构变化特征,以"社保重仓"代表社保基金的投资组合,基于马尔科夫状态转移GARCH(MRS-GARCH)模型研究社保基