导语:
本文主要介绍了关于python聚类算法如何选择的相关知识,包括kmeans算法python源码,以及python选择排序这些编程知识,希望对大家有参考作用。
说明
1.如果数据集是高维的,选择谱聚类作为子空间的一种。
2、如果数据量是中小型的,K均值会是更好的选择。
如果数据量超过100W条,可以考虑使用MiniBatchKMeans。
3、如果数据集中有噪声,选择DBSCAN。
使用基于密度的DBSCAN可以有效解决这个问题。
4、若追求更高的分类准确性,则选择谱聚类。
实例
import numpy as np
import matplotlib.pyplot as plt
# 数据准备
raw_data = np.loadtxt('./pythonlearn/cluster.txt') # 导入数据文件
X = raw_data[:, :-1] # 分割要聚类的数据
y_true = raw_data[:, -1]
print(X)
本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ 如何在python中定义函数的返回值12/16
- ♥ 如何使用python打包投递11/17
- ♥ python中pop是什么意思08/21
- ♥ 如何检查python环境是否安装正确09/29
- ♥ python中元组相关方法如何使用?01/10
- ♥ python列表推导的结构探索08/28
内容反馈