网络招聘信息的数据挖掘研究

来源 :杭州电子科技大学 | 被引量 : 1次 | 上传用户:liuyan881119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,企业在发布招聘信息时逐渐摒弃了传统的线下招聘模式,开始选择boss直聘、前程无忧、拉勾网等线上招聘网站。同时,由于自动化和人工智能技术在各行业中的逐步应用,企业对高新技术类岗位复合型人才的需求量增大。据移动招聘平台boss直聘发布的《2018旺季人才趋势报告》显示,在2018年人才最为紧缺的前十个职位中,数据类岗位占比近50%。本文从招聘网站采集数据类岗位的招聘信息,通过文本挖掘技术探索数据类岗位的发展现状以及不同数据类岗位对人才要求的异同,对人才的学习规划和教育部门的培养方案具有一定的理论价值和现实意义。本文首先根据boss直聘网站的特点编写爬虫程序,采集该网站中技术类下的数据类招聘信息作为本文的研究对象。爬虫程序设计过程中主要包括网页结构分析和网页内容分析、设计高效的爬虫策略以及字段解析入库三部分,最终采集的数据包括岗位名称、薪资范围、工作城市、学历、工作经验、公司名称、公司融资阶段、公司规模、公司所属行业、职位描述等10个字段。然后本文根据工作城市所属的地区将数据类招聘信息划分为东部地区、西部地区、中部地区和东北地区,分别探索四大地区发布数据类岗位招聘信息的企业现状和数据类岗位现状。并且分别对四大地区的招聘信息字段做关联规则,挖掘招聘信息字段之间隐藏的强关联规则。另外,本文对采集到的招聘信息中职位描述部分进行中文分词、去停用词等文本预处理,构造向量空间模型,将该文本表示为向量的形式。本文利用基于DF的特征相似度算法对特征进行降维,然后使用k-means聚类算法对招聘信息中职位描述文本进行文本聚类,从岗位的工作内容和招聘要求方面将数据类岗位聚为5类,分析不同类别的数据类岗位的薪资待遇以及对人才要求的差异。研究结果表明,东部地区数据类岗位的发展较好;数据类岗位对应聘者的专业技能要求较为综合,同时对应聘者的综合素质能力也有一定的要求。针对以上结果,本文分别对数据类人才的自我学习规划,以及教育部门的人才培养计划等提出建议,为缩小数据类人才缺口做出贡献。
其他文献
《随想曲》是桑桐先生在1959年创作的一首钢琴曲,因其高超、独特的作曲技巧,一经问世便获得了大众的认可。其中民族化和声的应用、中国民歌元素的开拓性借鉴,对当今的学者和作曲家们具有重要的启示意义,值得深入地研究和思考。桑桐先生的作曲风格以突出的中国风格与西方作曲技术相糅合而形成,在这部作品中桑桐先生在运用西方作曲技术的基础上开拓性地植入了中国民族调式和民歌元素,展现了中国钢琴音乐跟现代作曲技术之间完
电影作为一种综合艺术表现形式,通过视觉、听觉感官以及一定的审美活动来传达和感受艺术所展现的内容。吴天明导演的《百鸟朝凤》是一部充满人文情怀的电影,影片以平实朴素的
对于大功率轴流流体压缩机械装置,由于导叶、动叶、和静叶的位置没有变化,单纯依靠降低转速的措施很难实现非设计转速下的性能最优匹配。进口导叶和静叶可调技术则由于不受功
生产管理信息系统研究了发电厂生产管理工作流程,介绍了系统的结构配置和功能模块,该系统在发电厂生产应用中满足了生产运维的各项业务需求,实现了生产信息的实时共享,有效的提高
<正>一、概述中山市中医院是一家综合性的三甲医院,设有住院部和门诊部,共有床位500张,由于医疗污水中含有大量粪大肠菌群以及其他污染物,直接排放将污染水质且容易传染、引
会议
2018年1月中国国务院发布了《中国的北极政策》白皮书,代表中俄合作共建“冰上丝绸之路”项目正式地进入了务实发展的阶段,并成为“一带一路”倡议与欧亚经济联盟对接的重要
基于组织的自尊(organization-based self-esteem,简称OBSE)是20世纪80年代末在自尊(self-es-teem)概念的基础上发展起来的,学者们主要是借鉴Pierce开发的量表对其进行测量。
传统进出口贸易经历前三十年的高速发展后,目前已处在放缓阶段,而作为新兴的国际贸易发展模式的跨境电商正处在朝阳之中,中国的跨境电子商务交易额正以每年30%以上的增速迅猛
气体压缩机械由于必须考虑变工况运行的实际需要,导致运行工况点偏离设计点,尤其是在大型轴流压气机运行方面表现的更为突出,一方面要保证压比的不变,一方面要满足减少流量的
<正>四、培养数学品格的教学实践例说行是知之始,知是行之成。如何培养学生良好的数学品格呢?下面结合具体的教学案例,谈谈我们的认识与做法。(一)思维严谨严谨性是数学科学