美腿玉足

  • telegram 萝莉 空间贬抑多元聚类职责旨趣

  • 发布日期:2025-04-17 19:05    点击次数:148

telegram 萝莉 空间贬抑多元聚类职责旨趣

当咱们不雅察周围的天下时,咱们会很当然地对所看到的事物进行组织、分组、区别和分离,以便匡助咱们更好地了解周围的一切;这类心绪分类过程是学习和明白的基础。不异,为了匡助您了解以及更好地明白数据,您可以使用空间贬抑多元聚类器具。给定要创建的聚类数telegram 萝莉,它将寻找一个粗略使每个聚类中的所有要素都尽可能相似但各个聚类之间尽可能不同的解。要素相似性是基于您为分析字段参数指定的一组特点,同期还可以包括对于聚类大小的贬抑。此器具使用的算法接管连通图(最小跨度树)和一种被称为 SKATER 的递次来查找数据中存在的当然聚类以及字据积贮以评估聚类隶属度似然法。

诚然存在数百个类似这么的聚类分析算法,但它们都被归类为 NP-hard 问题。这意味着要确保某个解粗略无缺地终结组内相似性和聚类间各异最大化,惟一递次即是对要聚类的要素的每一种可能组合都进行尝试。诚然这对于少量的要素是可行的,但对于问题来说,会很快变得相配辣手。

不但确保找到最好解相配艰难,而且尝试找到一种最合乎所有可能数据景况的聚类算法也不执行。各个聚类包含的体式、大小和密度各不疏导;属性数据可能包括多样范围、对称性、一语气性和测量单元。这即是曩昔 50 年来开导了如斯庞杂不同聚类分析算法的原因。因此,将空间贬抑多元聚类视为一种可匡助您更好地了解数据基本结构的探索性器具相比合适。

潜在的诓骗

诓骗此器具的一些递次如下:要是您网罗了相关动物不雅察方面的数据,以便更好地了解它们的领地,空间贬抑多元聚类器具可能很有匡助。举例,了解鲑鱼在不同人命阶段的聚拢地点和时辰,可以匡助您规划保护区,以匡助确保告成繁育。行为别称农学家,您可能念念将盘考界限内的不同泥土进行分类。对通过一系列样本发现的泥土特征使用空间贬抑多元聚类可以匡助识别出显著的、空间上相邻的泥土类型的聚类。按购买神色、东谈主口统计特征和旅行神色对客户进行聚类,可以匡助您为公司居品制订有用的营销政策。城市司法师时常需要将各个城市分离红不同的邻域,以便有用地定位寰球要道、促进所在能动性并提高社区参与度。对城市街区的物理和东谈主口统计特征使用空间贬抑多元聚类,可以匡助规划师笃定具有相似物理和东谈主口统计特征而况在空间上相邻的城市区域。每当对团聚的数据进行分析时,生态造作都是一个无人不晓的统计推断问题。时常,用于分析的团聚决策对您念念要分析的内容莫得任何相关。举例,东谈主口普查数据是根据东谈主口分散而团聚,而东谈主口分散情况可能不是用来进行失火分析的最好聘请。针对与当今分析问题准确相关的一组属性,将可能的最小团聚单元分离红同质区域,是裁汰团聚偏差和幸免生态造作的一种有用递次。输入

此器具将具有点或面输入要素、输出要素的旅途、一个或多个分析字段、暗示所要创建的聚类数的整数值以及应在聚类算法中诓骗的空间贬抑类型。另外,还有很多可选的参数,可用于针对每个聚类要素数目的最大值或最小值,或每个聚类属性值总额的最大值或最小值培育聚类大小贬抑。以及一个最好聚类数评估输出表。

分析字段

聘请反应比率、阻隔或序数测量系统的数值字段。诚然标称数据可以使用“哑元”(二进制)变量进行暗示,但它们时常不像其他数值变量类型一样起作用。举例,您可以创建一个名为 Rural 的变量,并向每个要素(如每个东谈主口普查区)分派 1(要是大部分是乡村)和 0(要是大部分是城市)。但是,要是要与空间贬抑多元聚类结合使用,那么此变量更好的暗示递次是,使用与每个要素相关的乡村面积的数目或比例来暗示。

您应该聘请您合计可以将一聚类要素与另一聚类要素区别开来的变量。举例,假定您念念要按学生在法式化获利测试中的获利对学区进行聚类。您可以聘请多样分析字段,如举座测试得分、数学和阅读等特定科主见获利、得志一些最低考试得分阈值的学生比例等。运行空间贬抑多元聚类器具时,将为每个变量忖度 R2 值,并在音书窗口中进行陈说。举例,鄙人面的汇总中,根据学生测试得分、该地区未上完中学的成东谈主比例、每个学生的开支以及学生与老师的平均比率,来对学区进行聚类。请注视,TestScores 变量具有最高的 R2 值。这标明此变量粗略最有用地将学区聚类。R2 值反应在聚类过程之后原始 TestScores 数据中的变化的保留程度,因此,特定变量的 R2 值越大,变量越能更好地对要素进行区分。

空间贬抑多元聚类变量汇总

聚类大小贬抑

可通过聚类大小贬抑参数握住聚类的大小。您可以培育每个聚类必须得志的最大或最小阈值。大小贬抑可以是每个聚类所包含的要素数目,也可以是属性值的总额。举例,要是根据一组经济变量对好意思国各县进行聚类,则可以指定每个聚类的最小生齿数为 500 万,最大东谈主口数为 2500 万。或者,可指定每个聚类都必须至少包含 30 个县。

在指定每个聚类的最大值贬抑时,该算法将以单个聚类驱动,并对空间上相邻和具有相似值的聚类进行分割。议论到每次分割时的所有变量,将会创建新聚类,直到所有聚类大小都低于每个聚类的最大值。

SKATER 通过对感兴味要素具有相似值的数据进行空间分区来造成聚类。聚类大小贬抑参数可能不会对所有聚类收效。要是界说的聚类大小贬抑不复旧最好聚类界说就会出现这种情况。

SKATER 还可通过对所有指定分析字段具有相似值的数据进行空间分区来造成聚类。聚类大小贬抑可能不会对所有聚类收效。要是最大贬抑和最小贬抑的培育值彼此相近可能会发生这种情况,基于空间贬抑构建最小跨度树也可能会引起这种情况的发生。要是发生了这种情况,该器具将完成职责,莫得得志特定条目的聚类将在音书窗口中赐与陈说。

聚类数

无意,您会知谈最合乎于您的问题的聚类数。举例,要是您有五位销售司理,而况要为每一位司理指定我方的相邻区域,那么您可以为聚类数参数使用 5。但是,在许厚情况下,对于聘请具体聚类数您莫得任何法式;而仅仅但愿得到一个数,这个数粗略最稳妥地对要素相似性和各异性进行区分。为匡助您惩处这种情形,您可以留空聚类数参数,然后让空间贬抑多元聚类器具评估将要素分为 2、3、4 和多达 30 个聚类时的有用性。聚类有用性通过 Calinski-Harabasz 伪 F 统计量来测量,它是一个反应聚类间方差和聚类内方差的比率。换言之,是反应组内相似性和组间各异的比率,如下所示:

优优色倩网影视在线看

Calinski-Harabasz 伪 F 统计量

假定您念念要创建四个空间上相邻的聚类。在这种情况下,此器具将创建一个既能反应要素的空间结构又能反应其相关的分析字段值的最小跨度树。然后,将使用此器具笃定切割树的最好位置,以便创建两个单独的聚类。接下来,此器具将决定对生成的两个聚类中的哪个聚类进行分离,以生成三个最好的聚类惩处决策。将分离两个聚类中的其中一个,另一个聚类则保抓不变。临了,此器具将决定应答生成的三个聚类中的哪个聚类进行分离,以提供最好的四个聚类惩处决策。对于每个分组,最好惩处决策即为将聚类内相似性和聚类各异性最大化的惩处决策。当聚类中所有要素的分析字段值疏导期,将不再对该聚类进行分离(立地性之外)。要是生成的所有聚类中具有的要素均疏导,那么即使没达到您所指定的聚类数值,空间贬抑多元聚类器具也将罢手创建新聚类。当所有分析字段具有疏导值时,不存在职何划聚类的依据。

空间贬抑

空间贬抑参数可以确保生成的聚类在空间上相邻。可以启用面要素类的接续选项,来指明仅当要素与聚类中的另一隶属度分享某条边(仅接续边)或分享某条边或某个折点(接续边拐角)时,才暗示这些要素属于合并聚类。但是,要是数据集包括不一语气面或根柢莫得相邻邻域的面的聚类,则面接续选项并不是很好的聘请。

不一语气面

修剪型 Delaunay 三角测量选项合乎点或面要素,并确保仅当某个要素至少有一个其他聚类隶属度是当然邻域 (Delaunay Triangulation) 时,该要素才能包括在聚类中。从主见上讲,Delaunay 三角测量可以根据要造就心创建不肖似的三角网。每个要素是一个三角形结点,具有寰球边的结点被视为邻域。然后将这些三角形剪裁成凸包,以确保要素无法与凸包外的任何要素相邻。此选项不得用于具有重合要素的数据集。另外,由于 Delaunay 三角测量递次会将要素疗养为泰森面来笃定邻域关系,尽头是与面要素的邻域关系,无意是与数据聚拢外围要素的邻域关系,因此使用此选项所得的后果可能不会恒久与您的预期相符。请注视,鄙人图中,某些分组的原始面不是一语气的。可是,当它们疗养为泰森多边形时,所有分组的要素实质上都分享边。

Delaunay 三角测量示例对于修剪型 Delaunay 三角测量,泰森面接续界说了邻域关系。

要是念念让生成的聚类在空间和时态上都附进,可使用生成空间权重矩阵器具创建空间权重矩阵文献 (SWM),然后为空间关系的主见化参数聘请空间时辰窗。然后,可以在运行空间贬抑多元聚类器具时,为权重矩阵文献参数指定您使用生成空间权重矩阵器具创建的 SWM 文献。最小跨度树

为将聚类隶属度落拓为相连或相邻要素,器具最初会构造一个暗示要素间邻域关系的连通图。连通图上的最小跨度树将汇总要素空间关系和要素数据相似性。要素将成为最小跨度树中通过权重边进行贯串的节点。每个边的权重与其贯串的对象的相似性成正比。构建最小跨度树后,树中的分支(边)将被剪除,从而生成两个最小跨度树。要剪除的边会被聘请,以使生成的聚类中的各异最小化,同期幸免(要是可能)单一化(聚类中只具有一个要素)。在每次迭代时,将通过这种剪除过程对其中一个最小跨度树进行分割,直至获取指定的聚类数。所接管的发布递次被称为 SKATER (Spatial "K"luster Analysis by Tree Edge Removal)。诚然在每次迭代时会聘请可优化聚类相似性的分支进行剪除,但并不保证最终后果是最好的。

隶属度概率

忖度成员关系概率的置换参数可界说置换闇练次数以使用字据积贮忖度聚类成员关系概率。隶属度概率包含在 PROB 字段的输出要素类中。隶属度概率高标明此要素与其所分派到的聚类相似或相邻,您可以服气该要素属于其所分派到的聚类。隶属度概率低可能标明此要素与其被 SKATER 算法分派到的聚类判袂很大,或当分析字段、聚类大小贬抑或空间贬抑参数进行了某些转变,该要素可能包含在其他聚类中。

您指定的置换闇练次数界说了为烦扰 SKATER 空间贬抑而创建的立地跨度树数目。随后该算法将针对为每个立地跨度树指定的聚类数进行求值。置换闇练过程使用了由 SKATER 界说的原始聚类,可记载聚类成员在转变跨度树时聚拢在一都的频率。易切换聚类的要素由于对跨度树的隐微转变而隶属度概率小,而不切换聚类的要素隶属度概率较大。

对于较大的数据集来说,忖度这些概率可能会浮滥多数的运行时辰。提议您最初进行迭代并为您的分析找到最好聚类数,然后在随后的运行入网算分析的概率。您也可以通过将并行处理因子环境 培育增多到 50 来普及性能。

输出

空间贬抑多元聚类器具会创建很多输出。音书可从地舆处理窗格进行探问,递次为将鼠标悬停在程度条上,单击器具程度按钮器具程度,或伸开地舆处理窗格底部的音书部分。您还可以通过地舆处理历史探问之前运行空间贬抑多元聚类的音书。

空间贬抑多元聚类音书窗口

空间贬抑多元聚类器具的默许输出是一个新的输出要素类,它包含分析中使用的字段,以及一个名为 CLUSTER_ID 的用于象征每个要素所属的组的新整型字段。此输出要素类会添加到内容列表中,并会向 CLUSTER_ID 字段诓骗一种独有的激情渲染决策。

空间贬抑多元聚类输出要素类空间贬抑多元聚类输出。空间贬抑多元聚类图表输出

可创建多种类型的图表来汇总创建的聚类。箱形图用于裸露对于每个聚类的特征信息以及分析中使用的每个变量的特征。下图裸露了若何解读每个分析字段和创建的聚类的箱形图过火汇总值:最一丝据值、第一四分位数、全局均值、第三四分位数、最大数据值和数据格外值(小于或大于四分位距 1.5 倍的值)。将鼠标悬停在图表上的箱形图上,即可稽察这些值以及四分位数范围值。落在最小值或最大值(上须线或下须线)之外的任何点象征代表数据格外值。

箱形图汇总

默许的平行箱形图图表汇总了各个聚类以及聚类中的各个变量。举例,对东谈主口普查区域实践空间贬抑多元聚类器具创建 4 个聚类。鄙人面的图表中,请注视聚类 2(红色)反应具有平均房钱、有孩子的女户主家庭的最高值 (FHH_CHILD)、住宅单元数目的最高值 (HSE_UNITS) 以及 5 岁以下儿童的最高值的区域。聚类 2(金鳞色)反应具有最高中值房钱、有孩子的女户主家庭数目险些最低、超出住宅单元平均数目的区域。聚类 3(绿色)反应了有孩子的女户主家庭最少、5 岁以下儿童最少、住宅单元数目最少和佣金险些最低(不低于聚类 1)的区域。将鼠标悬停在平均线的每个节点上,稽察每个分析字段的聚类平均值。

空间贬抑多元聚类箱形图

使用上头的平行箱形图检查分析的全局汇总后,可以通过在图表属性窗格的系列选项卡中切换为并列来检查每个变量的各个聚类箱形图。通过这种神色,可以了解哪个组中的每个变量具有最高和最低值范围。针对每个变量为每个聚类创建箱形图,以便稽察每个聚类的值与创建的其他聚类的关系。将鼠标悬停在每个变量的箱形图上,以稽察每个聚类中每个变量的最小值、最大值和中值。举例,鄙人面的图表中可以看到,聚类 4(金色)的 MEDIANRENT 变量具有最高值,并包含值为 354 到 813 的区域。

空间贬抑多元聚类箱形图

可创建一个裸露聚类要素数目的条形图。聘请每个条形图时也会在舆图中聘请该聚类的要素,这将有助于进一步分析。

每个聚类的要素数条形图

当您将聚类数参数留空时,该器具将基于您的数据评估最好聚类数。为聚类数评估输出表指定旅途可创建一个裸露伪 F 统计量忖度值的图表。图表上最高的峰值是最大 F 统计量,暗示使用些许个聚类来区分指定的要素和变量最有用。鄙人面图表中,与四个组相关的 F 统计量是最高的。具有较高伪 F 统计量的五个组亦然可以的聘请。

伪 F 统计量图用于评估最好聚类数的伪 F 统计量图表 最好作念法

诚然倾向于引入尽可能多的分析字段,但对空间贬抑多元聚类器具而言,最好从单个变量驱动构建。较少的分析字段的后果更易于讲明。而且,字段较少时,还易于笃定哪些变量是最好鉴别要素。

在许厚情况下,您可能运行空间贬抑多元聚类器具屡次,才能查找到最好聚类数、最有用的空间贬抑以及粗略对要素进行最有用聚类的分析字段的组合。

要是器具复返 30 行为聚类的最好数目,请务必稽察 F 统计量图表。聘请聚类数与讲明 F 统计量图表亦然一种艺术,较低的聚类数可能愈加合乎您的分析。

其他资源

Duque, J. C., R. Ramos, and J. Surinach. 2007. "Supervised Regionalization Methods: A Survey" in International Regional Science Review 30: 195–220.

Assuncao, R. M., M. C. Neves, G. Camara, and C. Da Costa Freitas. 2006. "Efficient Regionalisation Techniques for Socio-economic Geographical Units using Minimum Spanning Trees" in International Journal of Geographical Information Science 20 (7): 797–811.



相关资讯

白虎 内射 青莲寺藏经阁:阁顶琉璃叙述“西纪行”故事

欧美性交电影 2024-10-08
2024年9月23日《山西晚报》16版 【开栏语】 随着国产3A游戏《黑神话:悟空》的接续火爆,游戏中山西各处取景地就势走红宇宙。晋城府城玉皇庙、高平铁梵刹、陵川西溪二仙庙——游戏画面中出现的晋城境内的三处取景地迎来前所未有的热度。随着“悟...

肛交 小说 以书为媒,促进端淑互鉴

欧美性交电影 2025-03-20
别称异邦读者在翻阅习近平主席文章肛交 小说。 本报记者 许立群摄 "> 别称异邦读者在翻阅习近平主席文章。 本报记者 许立群摄 《原上草:乔治·何克的故事》汉文版新书发布会上,该书作者马克·艾尔温·托马斯论述何克在中国的故事。 本报记者 许...

探花 眼镜 微星 MAG 272UP QD-OLED X24 泄露器发布:4K 240Hz,零卖价

欧美性交电影 2025-04-12
IT之家 4 月 7 日音问探花 眼镜,微星本日公布了一款 MAG 272UP QD-OLED X24 泄露器新品,瞻望将于下周开启预售,零卖价 5499 元。 MAG 272UP QD-OLED X24 搭载了 HDMI 2.1 满血版接...
    友情链接:

Powered by 美腿玉足 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2024