我在看HDBSCAN,想知道它是分裂的还是凝聚的?我理解这两种方法,但我似乎无法理解HDBSCAN使用哪种方法。想找些细节。
发布于 2023-05-12 12:07:44
HDBSCAN论文1中的命题1给出了答案。它指出,DBSCAN* (定义为一种非分层聚类算法)可以通过在另一个空间中通过聚集聚类计算,并具有额外的“噪声”聚类:
Proposition 1.设
X是在度量空间中由n × n成对距离描述的一组n对象。DBSCAN* w.r.tm_{pts}和ε获得的这些数据的划分与first在相互可达距离的转换空间上运行单链路获得的数据相同,然后在其规模的ε级别上切割生成的树状图,并将所有产生的单子作为表示“噪声”的单一类对待。
https://datascience.stackexchange.com/questions/110584
复制相似问题