导语:
本文主要介绍了关于python特征生成是什么?的相关知识,希望可以帮到处于编程学习途中的小伙伴
业内常说,数据决定模型效果的上限,而机器学习算法通过数据特征进行预测,良好的特征可以显着提升模型效果。这意味着通过特征生成(即从数据设计中加工模型的可用特征)是特征工程中的重要一步。
一、特征生成作用
1、增加特征的表达能力,提升模型效果;
(例如,体重除以身高是表达健康状况的重要特征,单纯看身高或体重对健康状况的表达有限。)
2. 可以融入业务理解的设计特征,增加模型的可解释性。
二、特征生成方法
1、聚合方式
对于一对多的字段,将对应的多条记录进行分组聚合,统计平均值、计数、值等数据特征。
# 自定义分组聚合统计函数
def x2_sum(group):
return sum(group**2)
df.groupby('cust_no').C1.apply(x2_sum)
2、转换方式
字段之间通过加、减、乘、除等运算生成数据特征的过程,对于不同的字段类型有不同的转换方式。
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ python中print函数输出中sep和end的区别08/27
- ♥ python中的return是什么意思?08/26
- ♥ 基于Python的openpyxl如何实现vlookup功能09/08
- ♥ 如何在python中保留两位小数08/25
- ♥ python字典有顺序吗?12/12
- ♥ python GUI编程的模板有哪些11/07
内容反馈