情人节马上就要到了,对于情侣们来说,刚过完年又迎来了情人的节日,一定非常的开心,而对于有追求目标的有志人士来说,情人节也是“下手”的绝佳机会,情人节自然少不了甜言蜜语的问候,今天我就带领大家爬取上千条的情人节甜言蜜语,并做一下统计分析,看看用什么样的词,多长的句子,来制造我们浪漫的情人节专属情话。
3.词频统计
接下来,是对于词频的统计,我们将jieba分词后的数据进行清洗,利用collections库的Counter函数进行词频统计,并利用pyecharts库进行词频的柱状图展示。如下图所示:
从上图的高频词汇,我们可以看出,利用哪一些词语来制造情话。有了关键词,接下来是对于句长的分析,因为句子太短,显得不真诚,句子太长,又显得啰嗦,抓不到重点(是不是瞬间感觉不想找对象了)。所以对于句长的拿捏要得当。
由于我们将文本存储时,是分行存储的,所以我们只需要按行进行读取,将每句话的句长进行统计即可,句长统计完成后,我们利用pandas库对句长进行离散化的处理,并利用pyecharts库进行饼图的句长分析,如下图所示:
由上图可以看出,句长在40-60之间是最为合适的,其次是60-80之间。
部分源码如下:
有了关键词,还有了合适的句长分析,相信你脑海中已经想到了属于自己的情话了,下面这句话就是我写的专属情话:
因为爱情,我们走到了一起;
因为爱情,让我们选择相伴到永远;
因为爱情,即便是对你的思念,也是一种幸福。
所以大家趁着情人节,抓紧行动吧!
获取源码,扫上面的二维码,然后输入:【情人节】
近期热门:
没有网络竟然能溜溜地刷抖音?因为有这个Python神器
我是如何一步一步拿下Google offer的
本篇文章来源于: 菜鸟学Python
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ 如何使用 Python 的日志记录模块?11/06
- ♥ python turtle模块有哪些命令?12/16
- ♥ 如何在 Python 中封装 Thread 子类11/13
- ♥ 避坑指南!Python里面的这九个坑,坑的就是你!05/06
- ♥ 15 个让新手爱不释手的 Python 高级库06/30
- ♥ 什么是python南12/03
内容反馈