在进行数据集合时,我们首先要学习的是 K means, DBscan, hierarchical clustering。传统的群集方法往往把所有的数据都看成一个小的节点。然而,在实际的环境中,这些数据点一般都有尺寸或者界限(边界线)。如果忽视了这些边沿,就会造成更大的误差。RVN是一种将各节点和各节点结合起来的一种新的方法。
RVN的创意来源于一系列家具企业的经营情况。他们的工作就是把家具按照人们的习惯进行归类,因为它们的外形和尺寸都不一样,而且有些家具的交迭程度也要大于它们的间距,因此建立了一个 RVN的计算模型,可以将各个节点的尺寸都纳入到 RVN中。
地球地图范本- K媒介
在要对全球各国进行群集时,必须先确定各国的座标(经纬)。
照片
照片
可以通过 K mean或者其它的演算法来调节优化的群集数目,或者为 DB scan寻找一个最优的 eps。我们将以 K mean为例子
照片
从上面的图片中,我们可以确定 k=3。
挺好看的!不过,我们也能看到在某些地方,例如俄罗斯。
俄罗斯正和其它亚洲的人进行着交流。理由是,俄罗斯的地理坐标与其它亚洲国家的距离更近。假如我们稍微向左偏一点,俄罗斯就会向左翼靠拢。
用本例来确定各点的方位将会极大地改变我们的结论。
RVN算法
RVN的基本原理如下所述。
资料需求:最高和最低限度
开始
初始化 n组(数据尺寸 n),每一组为一个集群
为每一群(利用最高和最低限度)的范围
重复
查看全部交迭的地方。(重叠的区域)
将全部交迭的点集成相同的群集
对各群集进行质量中心和直径的修正
终止战略
不存在交迭的群组,终止
K:设定 K并在总群集小于 K时终止该演算法(k mean)
其它:各尺寸的比例,以及最近群集的间距
本文地址:https://ethk.top/2022/12/30929.html
关注我们:请关注一下我们的微信公众号:扫描二维码
,公众号:gyuuoo
版权声明:本文为原创文章,版权归 矿池中转地址 所有,欢迎分享本文,转载请保留出处!
关注我们:请关注一下我们的微信公众号:扫描二维码

版权声明:本文为原创文章,版权归 矿池中转地址 所有,欢迎分享本文,转载请保留出处!
评论已关闭!