近几年来,随着高校扩招规模不断地扩大,每年都有大量的应届毕业生面临就业问题,高校就业指导工作就显得尤为重要。对于高校而言, 毕业生的就业率成为评估高校办学水平和学校社会声誉的重要指标, 就业率低下将成为影响高校生存发展的制约因素。在高校就业指导部门的就业管理信息系统中积累了大量的、重要的学生就业信息资源,虽然大多数就业管理系统具有管理和分析功能, 但是这些就业管理系统大多是面向业务操作而设计的,不能对这些数据所包含的内在信息和规律、趋势进行提取和分析,更不能提供重要的决策信息。随着学生数量、就业行业、影响就业因素的多元化和就业管理的提高,高校管理者对毕业生就业趋势的预测以及学生培养模式的改进越来越多的依赖于毕业生就业信息分析的结果。针对上述问题,本文提出利用决策树技术对影响大学生就业的多种因素进行多层次、多角度的分析和比较,挖掘这些数据中所蕴含的有价值的信息,以此来帮助决策人员在学校的管理和发展中做出及时正确的判断,同时也为大学生的择业就业提供有价值的参考。
本文将某高校近三年所积累的学生就业信息进行随机的数据抽取,通过分析,确定与本论文相关的数据表,采用多表合并的抽取方法,使用 SQL 查询语句,根据表中的主键、外键将这些数据表逐步合并成一张数据表,并获取所需求的字段。通过对以往影响毕业生就业因素的分析, 从而确定了影响毕业生就业的影响因素。包括:性别、综合成绩、学生身份、外语水平、毕业论文、计算机等级、城乡、就业共 8 个属性。其中城乡属性是由毕业生的来源确定,其中省会城市或直辖市,地级市及县级市或县城归为“城镇”,乡镇和农村归为“农村”。由于样本数据集合的数据量比较大, 通过本文的数据采集和数据预处理的操作, 将训练样本集中的 800 条样本分为训练样本集和测试样本集两个部分。其中训练样本集约占总样本集的 2/3(即 533 条样本),其余的 1/3(即 267 条样本)作为测试样本集合对决策树评估验证。表 1 为部分就业训练样本集。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !