CTCC框架的效果如何?实验数据给出了明确的答案。研究团队在五个基准数据集上进行了全面测试,包括MSRCV(210个样本,7个类别,6个视图)、Leaves(1600个样本,100个类别,3个视图)、HandWritten(2000个样本,10个类别,6个视图)、UCI-digit(2000个样本,10个类别,3个视图)和ALOI(10800个样本,100个类别,4个视图)。这些数据集涵盖了不同规模、不同复杂度的多视图场景,能够全面评估CTCC的性能。 实验结果令人振奋。在所有五个数据集上,CTCC都显著超越了现有方法。以聚类准确率(ACC)为例,在MSRCV数据集上,CTCC达到了93.33%的准确率,比第二好的方法LMVSC(83.73%)高出近10个百分点;在Leaves数据集上,CTCC的准确率为81.38%,比BMVC(74.38%)高出7个百分点;在HandWritten数据集上,CTCC达到了97.45%的准确率,超过了DSMVC(95.25%);在UCI-digit数据集上,CTCC的准确率为95.65%,比MFLVC(92.00%)高出3.65个百分点;在ALOI数据集上,CTCC的表现尤为突出,准确率达到75.29%,比第二好的方法BMVC(63.54%)高出近12个百分点。 除了准确率,CTCC在归一化互信息(NMI)、纯度(Purity)和F1分数(F-score)等指标上也取得了最佳成绩。这些多角度的评估指标共同证明了CTCC框架的有效性和稳定性。 为了更深入地理解CTCC的工作机制,研究团队进行了一系列可视化分析。他们展示了HandWritten数据集上双重代理图的演变过程。从最初的单视图代理图,到融合一致性信息后的代理图,再到加入互补性信息后的最终代理图,可以清晰地看到聚类效果的逐步提升。特别是在第三阶段,互补性信息的加入使得样本与特定簇的关联变得更加明确,这解释了为什么CTCC能够取得如此高的聚类准确率。 研究团队还分析了视图拓扑图对聚类性能的影响。在HandWritten数据集上,视图拓扑图显示视图3与视图5之间关系较近,而与视图6关系较远。基于这一拓扑关系,CTCC能够更有效地利用视图3和视图5中的共享信息,同时保留视图6中的特有信息,从而实现97.45%的高准确率,远超单个视图的最佳表现(视图3的79.95%)。 此外,研究团队还进行了详细的参数敏感性分析。他们考察了正则化系数φ(控制一致性信息)和β(控制互补性信息)对模型性能的影响。在MSRCV数据集上,当φ=10且β=1时,CTCC取得了最佳性能;在HandWritten数据集上,当φ=100且β=0.01时,CTCC表现最佳。这表明不同数据集对一致性和互补性信息的需求不同,需要通过参数调整来平衡。 为了直观展示CTCC的效果,研究团队还对HandWritten和UCI-digit数据集进行了t-SNE可视化。对比原始特征和CTCC学习后的特征,可以清晰地看到CTCC使得同类样本聚集在一起,不同类样本分离开来,形成了更有利于聚类的特征分布。
1956年美国一名科研人员在进行实验时,错误地将1兆欧的电阻器当成了1万兆欧的电
【5评论】【11点赞】