知行编程网知行编程网  2022-03-16 03:00 知行编程网 隐藏边栏 |   抢沙发  66 
文章评分 0 次,平均分 0.0

Python中有两个非常常用的数据结构,列表和字典。在做数据存储的时候,到底二者哪家强,字典还是列表,还是差不多呢。与其猜测,不如我们用数据说话!

思路: 

  • 生成一个很大的文本文件

  • 分别用列表和字典来存储数据,然后读取并搜索数据

  • 考察列表和字典做为数据结构的时候,存储的时间,搜索和访问的时间

  • 计算两种方案的消耗时间



1.创建百万字符文件

我们需要一个较大的文件,来证明我们的猜想!干脆直接生成一个有百万行的字符串乱码文件。

 

1).产生一串随机字符:

取一些随机的字符,包括数字,字符,标点和符号等等,一共95个随机字符。

揭密,字典和列表性能哪家强,我用一百万随机字符来证明


2).把字符序列,进行随机化分布


直接用random模块,把字符串序列随机化.


3).随机100万行的字符序列,写入文件

用个大循环把随机的字符串写入文件中,大概有一百万行,文件大小在100M左右,这里只是试例代码,其实可以用并发写更快一点。



2.用列表做数据结构


我们设定的一个场景,用列表作为数据结构容器,从百万文件中来读取数据。

考察列表的存储数据的时间,以及列表的搜索数据的时间。

揭密,字典和列表性能哪家强,我用一百万随机字符来证明

  • 先从百万行随机字符串文件中,读取一定数量的数据(10000行数据),

  • 存入10000行放入all_data列表

  • 接着从10000行all_data列表里面随机取1000行

  • 放到一个target_data列表

  • 最后搜索这个target_data列表



3.用字典做数据结构


我们用相同的场景,用字典作为数据结构容器,从百万文件中来读取数据。

考察字典的存储数据的时间,以及字典中的搜索数据的时间。

揭密,字典和列表性能哪家强,我用一百万随机字符来证明

  • 先从百万行字符串文件中,读取一定数量的字符(假如为10000行)

  • 存到到字典里面,把每一行做为key

  • 接着提取这个字典里面的key,把这个10000行的数据,转为列表

  • 从10000行里面随机取1000行出来,放到target_data列表


4.计算运行时间


我们计算两种数据结构运行的时间,为了更准确。我们运行100次求均值

揭密,字典和列表性能哪家强,我用一百万随机字符来证明


看一下用列表消耗的时间:


看一些用字典消耗的时间:


字典的性能是列表的600倍,可见字典作为数据结构,会快快快很多!尤其是非常大的数据存储和读取的时候。


既然字典这么快,那么线性增加搜索,看看耗时如何,刚才是1万里面搜1千,现在我们从二十万搜1千看看,1百万里面搜1千看看。

发现消耗的时间差不多


揭密,字典和列表性能哪家强,我用一百万随机字符来证明


结论:

为啥字典性能比列表快这么多?这要从字典和列表的原理说起,字典其实是散列表或者说是哈希表!内部存储的时候是根据hash地址来搜索的,搜索的时候不需要从头开始搜索,这也就是为啥哈希表变大,20万和100万的查询的速度差不多!


而列表是什么,Python列表是一种顺序线性表,好处是插入,移除比较快速,但是搜索会慢很多!


综上所述,由于Python中字典的性能远高于列表,Python源码中很多底层的对象都是用字典类型,只要重载__hash__魔法函数,让它返回一个可哈希的对象,这样的对象就可以用做字典的key。小伙伴今天是不是又学到一招!


下面推荐我的小程序,码题达人

Python圈第一个答题有奖小程序

码题达人

好玩·有趣·奖品多

长按·扫码

近期热门:

菜鸟学Python,上半年文章大汇总

周末也要编程,3道Python题,9种解法,你能想出几种

我想带你去旅行,我用Python提前做了一份端午旅游攻略

超酷,用Python还能写超级玛丽游戏

30岁后还能不能学Python,这里有一碗鸡汤

零基础学了8个月的Python,到底有啥感悟


本篇文章来源于: 菜鸟学Python

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写

发表评论

表情 格式 链接 私密 签到
扫一扫二维码分享