菜鸟学Python的第160篇原创文章
阅读本文大概需要3分钟
用Python来玩转数据分析实在是太爽了,因为有强大的Pandas来处理数据非常方便,我个人对数据分析情有独钟,探索数据的秘密非常好玩!前段时间写过一篇小白学数据分析入门招式,但是进阶的部分上次没有来得及整理,今天分享给大家。
我们依然用比较有名的泰坦尼克数据集来做示例,通过对这个数据集的处理,来快速上手数据分析的常见招式和基本手法,让初学者可以快速上手数据分析!
要点:
-
数据的字符处理
-
数据的过滤
-
数据的分组
-
数据的透视表
4.数据的切片和透视表
第九招:神奇的groupby函数
我们喜欢对数据按照某种类别分组统计:
1).从性别的维度来对是否获救的人数进行统计
df.groupby('性别')['是否获救'].count()
性别
女 314
男 577
Name: 是否获救, dtype: int64
2).从船舱的等级来看是非获救
df.groupby('船舱等级')['是否获救'].count()
船舱等级
1 216
2 184
3 491
Name: 是否获救, dtype: int64
第十招:对数据进行轴切片分析
比如我们希望对是非获救和船舱等级这个两个轴进行深入切片分析,这样的伎俩在R语言里面也经常用到,这里pandas给我们提供了非常方便的agg函数
df.groupby(['是否获救','船舱等级'])['年龄'].agg(['size','max','min','mean'])
这样就很容易发现,获救里面的头等舱的人比较多,平均年龄相对未获救的要年轻不少.
第十一招:数据透视表
透视表在很多数据分析里面都有,比如常见的excel里面,pandas也提供了类似的功能.
根据一个或者多个键对数据进行聚合,我们用透视表也能做出类似上面的功能,比groupby还要强大.
df.pivot_table(columns=['性别'],
index=['是否获救','船舱等级'],
values='年龄',
aggfunc={'年龄':[np.mean,min,max]})
看完上面的11招,加上前面的(18招,小白必看的数据分析招式|精选上篇),学会这些招数基本上可以算是入门数据分析了。
当然如果需要对数据分析进行系统的学习,还需要掌握很多其他的知识,这里推荐一个不错的学院“天善学院”,里面有很多大牛在讲课,比如爬虫大神崔庆才老师,比如数据分析大牛陈老师,现在数据分析课程有限时特惠价格,有兴趣的同学可以看看。
近期热门:
超酷,用Python还能写超级玛丽游戏
30岁后还能不能学Python,这里有一碗鸡汤
程序员如何用Python科学炒股
零基础学了8个月的Python,到底有啥感悟
本篇文章来源于: 菜鸟学Python
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ Python 56个内置函数详解(5)01/05
- ♥ 如何在c中嵌入python12/23
- ♥ python中using语句的常见陷阱01/10
- ♥ 如何使用python脚本定时清空文件内容?12/05
- ♥ python中AttributeError异常介绍08/19
- ♥ python中如何判断字符的大小写09/21
内容反馈