2018年中国电影票房突破600亿大关标志着国内电影事业进入新纪元,2019年春节档更是出现14部大片竞相角逐的场面,其中《疯狂的外星人》、《飞驰人生》、《神探蒲松龄》、《新喜剧之王》、《廉政风云》、《流浪地球》6部电影预售成绩最好,但是高票房不等于高评分,众多影片之中究竟哪一部最值得观看,今天我们就一起来预测一下。
口碑预测
要作评分预测最简单的模型就是线性回归,这里我们稍微使用一点机器学习的基本算法。
1).数据预处理
在上述选定的特征中,除电影时长是数值型以外,其他特征值都是字符型数据,不便于直接进行分析,因此需要先进行one-hot编码转换,pandas库中有专门的函数进行one-hot编码转换,使用起来也非常方便;另外,为了避免个别特征对数据预测产生过大影响,还需要对数据进行归一化处理,相关代码如下:
转换后的数据样式如下:
2).评分预测
处理完数据,我们就可以利用sklearn的线性回归函数预测电影评分了,首先以2018年及以前的春节档电影数据作为训练集计算回归系数矩阵,然后以2019年春节档6部电影特征值为依据来计算评分,代码如下:
预测出的各电影评分如下:
从预测结果来看,这6部电影预计评分都在5分以上,根据经验都是值得观看的,其中《疯狂的外星人》和《流浪地球》两部影片预测分值最高,按照我们的算法2019春节档中的最佳口碑将会在这两部影片中诞生。客观来说,此次预测比较“简陋”,至于准与不准,就等电影上映后再来看吧。
其实我个人更看好“神探蒲松龄”!
往期精彩:
菜鸟学Python年度抽奖,连续抽奖7天
学Python还是Java, 8张漫画带你全面分析
本篇文章来源于: 菜鸟学Python
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ Python使用运算符实现列表扩展11/10
- ♥ 如何在python3中输出循环?01/05
- ♥ 如何打包python代码11/15
- ♥ python如何整体缩进09/29
- ♥ python支持哪些数据库09/12
- ♥ 如何替换python3字符串11/26
内容反馈