这是菜鸟学Python的第115篇原创文章
阅读本文大概需要3分钟
前面有篇文章写了如何爬取南京20000多套挂牌二手房的信息,一直想多写几篇房地产的深入分析,前面是挂牌的二手房数据,想写一篇成交的二手房数据的分析报告。但是因为最近太忙了,而且分析的内容和维度比较多,我洋洋洒洒大概了写了几十页,限于篇幅和内容,今天先看一下上篇~~
想知道:
什么样的房子卖的最快
什么样的房子最后是便宜卖出的,
什么样的房子最后是加价卖出去的
什么小区楼盘成交的比较多
装修的房子好卖还是不装修的好卖
1).数据集是南京成交的16300多套二手房信息,我爬取的时候抽取了14个维度来详细描述一套房子的信息,比如:
-
房屋的装修
-
房屋的面积
-
楼盘的名字
-
成交的总价
-
每平米的单价
-
房屋的挂牌价
-
房屋的楼层数
-
房屋的房龄
-
房屋的地段
-
房屋多少天成交
-
房屋的朝向
-
有无电梯
-
房间数
-
挂牌价和成交价的差值
2).数据总览
数据是csv文件,一共16320套二手房,我们先大概看一下数据的基本情况.
一般拿到数据集都会先清洗一下,发现成交总价里面竟然有0.1万,一套房子再便宜也不可能有0.1万,相信这是异常值,回头处理一下.下面我挑几个终点维度细细探索一下:
1).成交面积分布
count 16320.000000
mean 78.309221
std 31.491450
min 13.000000
25% 55.987500
50% 72.080000
75% 91.362500
max 550.000000
成交的最大房子是550平的豪宅,猜想一定是别墅;最小的是13平方的房子,估计又是学区房,均值在80平不到.
成交的二手房中已60-80平米的房子最多,其中60平米的有2000多套.100平米以上的房子成交都在500套以下
为了更通俗的反映房子的分布情况,我们把房子面积分成4类:
小户型:<60
中户型:(60-100)
大户型:(100-150)
超大户型:(150-300)
超超大户型:>300
>><br />
中户型 8349
小户型 4997
大户型 2566
超大户型 400
超超大户型 8
中户型的房子占到了整个二手房市场上的半壁江山,也就是说100平方以下的房子比较好卖
b).房屋年龄
count 16320.000000
mean 2001.281740
std 8.519805
min 1956.000000
25% 1996.000000
50% 2003.000000
75% 2009.000000
max 2018.000000
房龄均值在2001年,不看不知道一看吓一跳,竟然有1956的年房子在卖,而且成交了.61年的房龄,乖乖隆地洞;还有一个2018年的房子,提前卖!
房龄基本都在1990-2015年之间,其中峰值在2005左右的房子和2010年,看来5年或者10年是换房的一个分水岭。基本住了10年就想换房了,想想老爸老妈那个年代房子都是住一辈子的,也许现在的房子已经是一种商品了,房子已经不是单用来住的.
c).成交的价格
count 16320.000000
mean 197.201342
std 102.240332
min 0.100000
25% 129.500000
50% 171.000000
75% 237.000000
max 1545.000000
二手房的均价是197万,最高的价格是1545万,估计是大别墅.成交的价格里面也有异常值,去掉这些异常值之前,我们先看一眼,是啥房子
竟然有3套房子,2套总价1千,1套1万,面积还不小!希望这些异常值是真的
最贵的一套1500多万的房子到底是何方圣神,我们也看一下
南京建邺区的一套豪宅,天正滨江花园,听名字就知道是豪宅区.
看价格的分布图:
成交的价格的区间集中在100-200万之间,我记得当时挂牌的20000多套房子均价都是300万左右,而成交的房子为啥是 200万左右.
d).成交的时间天数
count 16320.000000
mean 66.649571
std 82.002184
min 1.000000
25% 14.000000
50% 39.000000
75% 89.000000
max 1125.000000
-
成交的天数均值在66天,也就是基本挂牌在2个月左右才能卖掉.
-
最长的一套是1125天,也就是说快3年了才卖掉
-
成交最快的1天就卖了
我很好奇1天就卖掉的都是啥房子
成交1天就卖掉:竟然有438套
len(df[df.house_deal_cycle_days==1])
>>438
看看前10名的都是啥日光楼房啊(等有时间细细挖掘一下为啥这些房子这么好卖)
e).加价和降价的房子分布
有买卖就有伤害,我很想知道哪些房子就降价卖的,降了多少才成交的; 有多少房子是加价还能卖出去的.
只有百分之2是涨价卖的,近百分比98都是降价的,看了房子已经处于买房市场,大家可以尽情的挑房子,砍价了 哈哈
到底哪些楼房降的很多呢,我们取降价最多的前10名:
发现北沿路55号降了190万卖的,看名字应该是别墅.
那么降价的幅度真的很大吗, 分布如何呢,我们再细细分析一下:
结论
看来降价的虽然多,但是都是微微降啊,降5,10万的比较多,大幅降价还没有开始!也就是楼市看起来趋势是要跌的,但是还没有大幅的降低!相对成交均价200万的房子,才降了5%左右,我们也许还需要继续等待。本篇已经用了12张图,限于篇幅,我就不继续展开,敬请期待下篇更精彩!
长按二维码,加入小密圈
每两周一期的训练营在等你
60几个主题,20几篇干货精华文章
来源 | 菜鸟学Python
作者 | xinxin
本文章为菜鸟学Python独家原创稿件,未经授权不得转载
本篇文章来源于: 菜鸟学Python
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ 程序员一天写多少行代码02/25
- ♥ python可以读写内存吗01/14
- ♥ 如何使python创建日期命名文件10/10
- ♥ 为什么推荐你学习 Python?10/22
- ♥ python ChainMap管理应用设置12/30
- ♥ 私藏多年的Markdown编辑器,全部分享给你04/08
内容反馈