聚类评价指标 MATLAB 实现
本仓库提供了一系列聚类评价指标的 MATLAB 实现,涵盖了外部有效性指标和内部有效性指标。这些指标可以帮助用户评估聚类结果的质量,从而选择最优的聚类算法或参数设置。
资源文件内容
本资源文件包含了以下聚类评价指标的 MATLAB 实现:
外部有效性指标
- Rand index:衡量聚类结果与真实标签之间的一致性。
- Adjusted Rand index:对 Rand index 进行调整,考虑了随机分配的影响。
- Mirkin index:衡量聚类结果与真实标签之间的不一致性。
- Hubert index:基于成对比较的指标,衡量聚类结果与真实标签之间的相似性。
内部有效性指标
- Silhouette:衡量聚类结果的紧密度和分离度。
- Davies-Bouldin:衡量聚类结果的紧密度和分离度之间的平衡。
- Calinski-Harabasz:衡量聚类结果的紧密度和分离度之间的平衡。
- Krzanowski-Lai:衡量聚类结果的紧密度和分离度之间的平衡。
- Hartigan:衡量聚类结果的紧密度和分离度之间的平衡。
- weighted inter- to intra-cluster ratio:衡量聚类结果的紧密度和分离度之间的平衡。
- Homogeneity Separation:衡量聚类结果的同质性和分离度。
使用说明
- 下载本仓库中的 MATLAB 文件。
- 将文件添加到 MATLAB 的工作路径中。
- 根据需要调用相应的评价指标函数,并传入聚类结果和(可选的)真实标签。
- 函数将返回相应的评价指标值,帮助您评估聚类结果的质量。
注意事项
- 部分指标需要真实标签作为输入,适用于有监督的聚类评价。
- 内部有效性指标不需要真实标签,适用于无监督的聚类评价。
- 请确保输入数据的格式符合函数要求,以避免运行时错误。
贡献
如果您在使用过程中发现任何问题或有改进建议,欢迎提交 Issue 或 Pull Request。我们期待您的贡献!