论文部分内容阅读
伴随着以城市公共就业服务机构为渠道进行招聘的方式的使用率逐年下滑,加之互联网大环境的到来,网络招聘市场规模逐年增大,已成为各个行业招聘企业所需人才的主要途径。随着高等院校招生规模的不断扩大,高校毕业生的数量也呈逐年增长趋势,受经济下行影响,全国三分之一地区失业率较去年上升,给青年群体产生了巨大的就业压力,企业在需求人才的同时对求职者也提出了更高的要求。造成这种现象的原因之一是高校对于学生培养与市场需求存在一定程度上的脱节,高校不能及时了解当前市场对于人才各方面能力的需求。互联网时代的到来,使得各行各业发展迅速,尤其“大数据”时代的到来对各行业产生的冲击使得企业对人才各方面能力的需求也随之变化。招聘网站的招聘信息中包含有企业对于求职者各方面技能的要求,最能反映出市场对于人才的需求,但招聘信息存在于网页中,对于求职者详细的要求形式上大多数是半结构化或非结构化的文本信息。首先,本文选取数据类岗位和计算机科学与技术专业岗位为例,通过网络爬虫技术采集多个招聘网站数据源的招聘文本,利用自然语言处理技术和机器学习等构建了相对完善的招聘词典,从多个维度对招聘岗位的需求特征进行分析。这种方法弥补了传统调研、人工编码、统计分析等方式浪费资源的缺陷,能够快速、高效、智能化的实现对岗位需求特征的挖掘,尤其是针对大批量招聘数据优势相对明显。其次,通过分析,在对数据类岗位的研究中,从工作地点、薪资、企业性质、所属行业等角度了解其总体情况,从综合能力要求、学历和专业要求、专业知识、工作和计算机技能、工作经验等五个维度对数据类岗位特征进行统计分析,得到数据类岗位多个角度的需求特征,并比较了三个岗位,发现它们有一定共性的同时也存在着差异;对计算机科学与技术专业岗位研究中,利用构建的不同维度的指标体系并使用统计分析、相关分析、关联规则分析等方式挖掘出市场对计算机科学与技术专业各类岗位的技能需求特征。最后,基于前面对数据类岗位和计算机科学与技术专业岗位需求特征的分析,发现数据类岗位对计算机专业存在巨大需求的同时,计算机专业从事数据类岗位的却很少。在分析数据科学与统计学、计算机科学关系后,对统计学和计算机科学的人才培养提出几点建议。