知行编程网知行编程网  2022-03-15 03:35 知行编程网 隐藏边栏 |   抢沙发  2 
文章评分 0 次,平均分 0.0

菜鸟学Python的第160篇原创文章

阅读本文大概需要3分钟

菜鸟独白

用Python来玩转数据分析实在是太爽了,因为有强大的Pandas来处理数据非常方便,我个人对数据分析情有独钟,探索数据的秘密非常好玩!前段时间写过一篇小白学数据分析入门招式,但是进阶的部分上次没有来得及整理,今天分享给大家。


我们依然用比较有名的泰坦尼克数据集来做示例,通过对这个数据集的处理,来快速上手数据分析的常见招式和基本手法,让初学者可以快速上手数据分析!


11招,高手都在用的数据分析招式


要点:

  • 数据的字符处理

  • 数据的过滤

  • 数据的分组

  • 数据的透视表


4.数据的切片和透视表


第九招:神奇的groupby函数

我们喜欢对数据按照某种类别分组统计:

1).从性别的维度来对是否获救的人数进行统计

df.groupby('性别')['是否获救'].count()

性别

女    314

男    577

Name: 是否获救, dtype: int64


2).从船舱的等级来看是非获救

df.groupby('船舱等级')['是否获救'].count()

船舱等级

1    216

2    184

3    491

Name: 是否获救, dtype: int64


第十招:对数据进行轴切片分析

比如我们希望对是非获救和船舱等级这个两个轴进行深入切片分析,这样的伎俩在R语言里面也经常用到,这里pandas给我们提供了非常方便的agg函数

df.groupby(['是否获救','船舱等级'])['年龄'].agg(['size','max','min','mean'])

11招,高手都在用的数据分析招式

这样就很容易发现,获救里面的头等舱的人比较多,平均年龄相对未获救的要年轻不少.


第十一招:数据透视表

透视表在很多数据分析里面都有,比如常见的excel里面,pandas也提供了类似的功能.


根据一个或者多个键对数据进行聚合,我们用透视表也能做出类似上面的功能,比groupby还要强大.

df.pivot_table(columns=['性别'],

index=['是否获救','船舱等级'],

values='年龄',

aggfunc={'年龄':[np.mean,min,max]})

11招,高手都在用的数据分析招式

11招,高手都在用的数据分析招式

看完上面的11招,加上前面的(18招,小白必看的数据分析招式|精选上篇),学会这些招数基本上可以算是入门数据分析了。


当然如果需要对数据分析进行系统的学习,还需要掌握很多其他的知识,这里推荐一个不错的学院“天善学院”,里面有很多大牛在讲课,比如爬虫大神崔庆才老师,比如数据分析大牛陈老师,现在数据分析课程有限时特惠价格,有兴趣的同学可以看看




近期热门:

超酷,用Python还能写超级玛丽游戏

30岁后还能不能学Python,这里有一碗鸡汤

程序员如何用Python科学炒股

零基础学了8个月的Python,到底有啥感悟


本篇文章来源于: 菜鸟学Python

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写

发表评论

表情 格式 链接 私密 签到
扫一扫二维码分享