导语:
本文主要介绍了关于python实现信息熵的计算代码的相关知识,包括python实现svm代码,以及信息熵的计算公式例子这些编程知识,希望对大家有参考作用。
1、什么是信息熵?
1948年香农提出了信息熵(Entropy)的概念。
信息理论:
1、从信息的完整性上进行的描述:
当系统的有序状态一致时,数据越集中的地方熵值越小,数据越分散的地方熵值越大。
2、从信息的有序性上进行的描述:
当数据量一致时,系统越有序,熵值越低;系统越混乱或分散,熵值越高。
“信息熵”是衡量样本集纯度最常用的指标之一。
二、python实现信息熵的计算代码
1、导入库
import numpy as np
import pandas as pd
2、 准备数据
data = pd.DataFrame(
{'学历': ['专科', '专科', '专科', '专科', '专科', '本科', '本科', '本科', '本科', '本科',
'研究生', '研究生', '研究生', '研究生', '研究生'],
'婚否': ['否', '否', '是', '是', '否', '否', '否', '是', '否', '否', '否', '否', '是', '是', '否'],
'是否有车': ['否', '否', '否', '是', '否', '否', '否', '是', '是', '是', '是', '是', '否', '否',
'否'],
'收入水平': ['中', '高', '高', '中', '中', '中', '高', '高', '很高', '很高', '很高', '高', '高',
'很高', '中'],
'类别': ['否', '否', '是', '是', '否', '否', '否', '是', '是', '是', '是', '是', '是', '是', '否']})
3、定义信息熵函数
# 定义计算信息熵的函数:计算Infor(D)
def infor(data):
a = pd.value_counts(data) / len(data)
return sum(np.log2(a) * a * (-1))
4、数据测试
# print(infor(data["学历"])) #测试结果为: 1.584962500721156
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ 如何在python中获取一天中的时间11/06
- ♥ python库是如何实现对象的转换的12/21
- ♥ 什么是 Python 运算符重载12/14
- ♥ Python判断一个对象是否具有某个属性10/17
- ♥ 什么是 python 中的 ssl 身份验证?12/15
- ♥ Python的md5是什么意思?11/08
内容反馈