一个助你事半功倍的数据挖掘工具!

描述

Pandas模块当中,对于表格数据的分组操作(groupby)和透视表(pivot_table)的制作一直都是比较常见的,今天小编为大家分享一个数据分析的利器,能够自动为我们完成上述提到的一系列操作,并且带有GUI界面,所以使用起来非常的方便。

PivotTableJS

看名字我们就能知道,该模块是专门用来生成透视表(pivot_table),而且是用JavaScript代码来构建的,由于其有GUI界面,所以我们在进行数据分析与可视化操作的时候并不需要写多少代码。

当然我们先用pip命令来安装该模块,代码如下

pip install PivotTableJS

加载数据集

那么首先,我们先来加载数据集,这里导入Pandas模块


	

import pandas as pd df = pd.read_csv("employee_dataset.csv") df.head()

output

数据挖掘

牛刀小试

这里我们尝试来调用pivottablejs模块当中的pivot_ui方法,只需两行代码


	

from pivottablejs import pivot_ui pivot_ui(df)

output

数据挖掘

这里可能需要等待1-2分钟左右的时间来供其加载,随后我们就能看到如上图所示的窗口,窗口中包括了表格当中的每一列的字段、可视化图表的各种形式等等

数据挖掘

同时我们也可以拖拽指定的列到空白的窗口中,对其进行分组统计以及透视表的制作,如下图所示

数据挖掘

而要是我们想要进行可视化操作,只需要在下拉框中选中,例如我们想要绘制的是直方图,

数据挖掘

分组统计

接下来我们进行分组(groupby)操作,例如我们想要查看一下员工状态(Employee_Status)的分组统计,只需要将该列拖拽至空白的区域即可

数据挖掘

我们可以看到员工分为是全职员工以及实习生,分别是有791位和209位,当然除了计数(count)之外,我们还能够计算平均值、中位数、最大/最小值等一系列统计方法,例如我们想要计算一下全职员工和实习生的平均工资,就可以这么来操作

数据挖掘

我们还可以更进一步,将上面的结果进行可视化展示,如下所示

数据挖掘

透视表

对于透视表而言,pivottablejs模块实现起来也格外的简单,我们只需要在上述操作的基础之上,将列拖拽到右边空白的长方形区域当中,例如我们想要看一下分布在不同城市当中不同职位员工的分布,就可以这么来做

数据挖掘

当然该模块给我们带来的便利和自身所具备的功能远不止此,大家可以安装一下该模块,然后在空余的时间中自行探索。

当然我们看来该模块还存在着一个小小的bug,大家可以尝试用其他版本来试一下,小编在这里用的是0.9.0

 

审核编辑 :李倩


 


打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分