演算法引數:鄰域點距離閥值( > 0)、核心物件密度閾值(整數>=1)
基礎概念:
1、球樹:以核心物件,畫半徑生成點圓,圓包含點數量必須>=密度閥值。
2、空閒球樹:未被聚類到簇的球樹。
3、核心物件:即是:圓點。
4、噪音點:即以該點為圓無法形成球樹。
5、球樹交集:兩棵球樹的圓,相交的陰影部分。
6、簇禁忌核心點:簇的核心點已經全量掃描過所有空閒核心點。
7、簇:簇內所有球樹至少存在一棵和它有交集。
計算步驟:
1、新建簇集合:從空閒球樹集合選擇一棵球樹,作為簇集合的第一個元素。
2、計算和第一棵球樹有交集的空閒球樹,並作為簇集合的第二批元素(可能有多個球樹)。
將第一棵樹點核心點記入簇的核心禁忌點。
如果簇點核心禁忌點數量==簇點核心點數量,
那麼,計算結束。
3、回到步驟1。
視覺化演示:https://www.naftaliharris.com/blog/visualizing-dbscan-clustering/