RVN 一种新的聚类算法

etc,rvn,erg,cfx,ethw,ethf中转地址,点击进入

在进行数据集合时,我们首先要学习的是 K means, DBscan, hierarchical clustering。传统的群集方法往往把所有的数据都看成一个小的节点。然而,在实际的环境中,这些数据点一般都有尺寸或者界限(边界线)。如果忽视了这些边沿,就会造成更大的误差。RVN是一种将各节点和各节点结合起来的一种新的方法。

RVN的创意来源于一系列家具企业的经营情况。他们的工作就是把家具按照人们的习惯进行归类,因为它们的外形和尺寸都不一样,而且有些家具的交迭程度也要大于它们的间距,因此建立了一个 RVN的计算模型,可以将各个节点的尺寸都纳入到 RVN中。

地球地图范本- K媒介

在要对全球各国进行群集时,必须先确定各国的座标(经纬)。

照片

照片

可以通过 K mean或者其它的演算法来调节优化的群集数目,或者为 DB scan寻找一个最优的 eps。我们将以 K mean为例子

照片

从上面的图片中,我们可以确定 k=3。

挺好看的!不过,我们也能看到在某些地方,例如俄罗斯。

俄罗斯正和其它亚洲的人进行着交流。理由是,俄罗斯的地理坐标与其它亚洲国家的距离更近。假如我们稍微向左偏一点,俄罗斯就会向左翼靠拢。

用本例来确定各点的方位将会极大地改变我们的结论。

RVN算法

RVN的基本原理如下所述。

资料需求:最高和最低限度

开始

初始化 n组(数据尺寸 n),每一组为一个集群

为每一群(利用最高和最低限度)的范围

重复

查看全部交迭的地方。(重叠的区域)

将全部交迭的点集成相同的群集

对各群集进行质量中心和直径的修正

终止战略

不存在交迭的群组,终止

K:设定 K并在总群集小于 K时终止该演算法(k mean)

其它:各尺寸的比例,以及最近群集的间距