知行编程网知行编程网  2022-11-16 10:00 知行编程网 隐藏边栏  3 
文章评分 0 次,平均分 0.0
导语: 本文主要介绍了关于python特征生成中字符类型有哪些?的相关知识,包括python特征选择,以及c语言转义字符这些编程知识,希望对大家有参考作用。



python特征生成中的字符类型有哪些?



python特征生成中字符类型有

截取、

字符长度和

频次。









一、python特征生成中字符类型






1、截取

当字符类型的值过多时,通常可以截取字符类型变量,以减少模型的过拟合。例如,可以将特定的家庭住址截取到城市级别的粒度。



2、字符长度

统计字符串长度。例如,在转账场景中,转账消息中的字数可以在一定程度上描述转账的类型。



3、频次




二、python特征类型中字符使用






1、截取第一位字符串



df['I1_0'] = df['I1'].map(lambda x:str(x)[:1])


2、字符长度

df['I1_len'] = df['I1'].apply(lambda x:len(str(x)))

display(df.head())


3、字符串频次

df['I1'].value_counts()

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写
扫一扫二维码分享