传统的特征工程方法手动构建特征,这是一个繁琐、耗时且容易出错的过程。自动化特征工程是通过 Fearturetools 等工具从一组相关的数据表中自动生成有用特征的过程。与手工生成的特征相比,这种方法更高效、更可重现,并且可以更快地建立模型。
一、Featuretools是什么?
Featuretools是一个用于执行自动化特征工程的开源库。
二、Featuretools
基本的三个概念
1、Feature Primitives(特征基元):
生成特征的常用方法,分为聚合、转换的方式。
特征加工方法
import featuretools as ft
ft.list_primitives()
2、Entity(实体)
可以被看作类似Pandas DataFrame, 多个实体的集合称为Entityset。
实体间可以根据关联键添加关联关系Relationship。
3、dfs(深度特征合成)
它是从多个数据集创建新特征的过程,特征生成的复杂度可以通过设置搜索的深度(max_depth)来控制。
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ python如何使用模块中的类12/20
- ♥ 如何在Windows中卸载python12/02
- ♥ 如何在python中计算pi10/12
- ♥ 如何使用 python pip 更新软件包09/19
- ♥ 如何计算python列表中元素的数量08/19
- ♥ 如何实现python绘制混淆矩阵?09/20
内容反馈