聚类评价指标 MATLAB 实现

2022-07-27

聚类评价指标 MATLAB 实现

本仓库提供了一系列聚类评价指标的 MATLAB 实现,涵盖了外部有效性指标和内部有效性指标。这些指标可以帮助用户评估聚类结果的质量,从而选择最优的聚类算法或参数设置。

资源文件内容

本资源文件包含了以下聚类评价指标的 MATLAB 实现:

外部有效性指标

  1. Rand index:衡量聚类结果与真实标签之间的一致性。
  2. Adjusted Rand index:对 Rand index 进行调整,考虑了随机分配的影响。
  3. Mirkin index:衡量聚类结果与真实标签之间的不一致性。
  4. Hubert index:基于成对比较的指标,衡量聚类结果与真实标签之间的相似性。

内部有效性指标

  1. Silhouette:衡量聚类结果的紧密度和分离度。
  2. Davies-Bouldin:衡量聚类结果的紧密度和分离度之间的平衡。
  3. Calinski-Harabasz:衡量聚类结果的紧密度和分离度之间的平衡。
  4. Krzanowski-Lai:衡量聚类结果的紧密度和分离度之间的平衡。
  5. Hartigan:衡量聚类结果的紧密度和分离度之间的平衡。
  6. weighted inter- to intra-cluster ratio:衡量聚类结果的紧密度和分离度之间的平衡。
  7. Homogeneity Separation:衡量聚类结果的同质性和分离度。

使用说明

  1. 下载本仓库中的 MATLAB 文件。
  2. 将文件添加到 MATLAB 的工作路径中。
  3. 根据需要调用相应的评价指标函数,并传入聚类结果和(可选的)真实标签。
  4. 函数将返回相应的评价指标值,帮助您评估聚类结果的质量。

注意事项

  • 部分指标需要真实标签作为输入,适用于有监督的聚类评价。
  • 内部有效性指标不需要真实标签,适用于无监督的聚类评价。
  • 请确保输入数据的格式符合函数要求,以避免运行时错误。

贡献

如果您在使用过程中发现任何问题或有改进建议,欢迎提交 Issue 或 Pull Request。我们期待您的贡献!

下载链接

聚类评价指标MATLAB实现