# 统计分析

地理系统,是由多种要素相复合而构成的复杂系统。在这个系统中,一方面,各种要素之间存在着相互联系、相互影响和相互制约的关系;另一方面,各种要素的复合作用又使各种地理事物和地理现象表现出强烈的地域差异性。为了定量地揭示各种地理要素之间的相互关系,以及各种地理事物和地理现象所表现出来的地域分异规律,就必须采用以概率论和数量统计知识为基础的统计分析方法对地理系统进行深入的研究。本节,我们将介绍和探讨系统聚类分析、回归分析、梯度分析、时间序列分析、趋势面分析、统计相关分析、主成分分析、马尔可夫预测等统计分析方法在地理系统分析中的应用问题。

# 相关主题

# 聚类分析

# 功能说明

聚类是一种寻找数据之间内在结构的技术。能够把全体数据实例组织成一些相似组,而这些相似组被称簇。聚类分析亦称群集析或点群分析,是定量地研究地理事物分类问题和地理分区问题的重要方法。其基本原理是,根据在数据中发现的描述队形及其关系的信息,将数据对象按照某个特定标准(如距离准则)分组,让组内的对象相互之间是相似的(相关的),同时不在同组中的数据对象不同(不相关)。即聚类后同一类的数据尽可能聚集到一起,不同数据尽量分离。

# 操作说明

1. 在分析选项卡中,点击“统计分析”按钮,选择 “聚类分析”命令,弹出聚类分析对话框,以气象数据聚类分析为例,如下图所示。

2. 在聚类分析对话框,设置参数,如下:

  • 【输入数据】:可选择当前地图或直接加载数据库中简单要素类或对象类数据。
  • 【分析参数】:可根据实际需求选择分析方法,设置分析信息。
    • 分析方法:提供直接聚类、最短距离聚类、最远距离聚类三种聚类分析方法。不同的聚类分析方法聚类结果不同。
    • 样本距离选择:基于特定的距离准则进行聚类统计,系统提供绝对距离、欧式距离和切比雪夫三种距离度量准则,其中绝对距离是在一维空间下进行的距离计算;欧式距离是在二维空间下进行的距离计算,切比雪夫距离是在n维空间下进行的无穷大的距离。
    • 分析字段:选参与分析的字段。

3. 点击"确定"按钮,执行聚类分析,系统按照所设属性统计参数绘制并显示聚类谱系图和统计分析表。如下图所示,同时系统提供成果导出功能,支持要素类、图片和表格方式导出。

# 主成分分析

# 功能说明

主成分分析是把各变量间相互关联的复杂关系进行简化分析的方法,即将原有的多指标转化为少数几个代表性较好的综合指标,这少数几个指标能够反映原来指标大部分的信息(85%),并且各个指标之间保持独立,避免出现重叠信息。也就是说,主成分分析是在力保数据信息丢失最少的原则下,对高维度数据进行降维处理的一种方法。广泛应用与区域经济发展评价、人口统计学、满意度测评、模式识别和图像压缩等多个领域。

# 操作说明

1. 在分析选项卡中,点击“统计分析”按钮,选择 “主成分分析”命令,弹出主成分分析对话框,以沿海城市经济数据主成分分析为例,如下图所示。

2. 在主成分分析对话框,设置参数,如下:

  • 【输入数据】:可选择当前地图或直接加载数据库中简单要素类或对象类数据。
  • 【分析参数】:可根据实际需求选择分析方法,设置分析信息。
    • 【分析方法】:主成分分析方法。
    • 【分析字段】:选参与分析主成分信息。

3. 点击"确定"按钮,执行主成分析后显示统计分析表,系统支持导出表格,如下图所示。

# 相关分析

# 功能说明

相关分析是统计上研究两个变量之间相互关系分析的常用方法,只研究两个平等地位的变量之间的相关方向和程度,且相关关系数是唯一确定的。

相关分析方法用于揭示地理要素之间相互关系的密切程度。而地理要素之间存在着相互联系、相互影响和相互制约,为了定量地研究各要素之间的数量关系,常用相关分析法和回归分析法来确定它们之间的关系和性质,并通过对相关系数的计算与检验来完成。

相关分析侧重于发现随机变量间的种种相关特性,因此相关分析在工农业、水文、气象、社会经济和生物学等方面都有应用。

# 操作说明

1. 在分析选项卡中,点击“统计分析”按钮,选择 “相关分析”命令,弹出相关分析对话框,如下图所示。

2. 在相关分析对话框,设置参数,如下:

  • 【输入数据】:可选择当前地图或直接加载数据库中简单要素类或对象类数据。
  • 【分析参数】:可根据实际需求选择分析方法,设置相关分析信息。
    • 【待分析要素一】:选参与分析的第一个要素字段。
    • 【待分析要素二】:选参与分析的第二个要素字段。

3. 点击"确定"按钮,执行主成分析后显示统计分析表。如下图所示。

# 回归分析

# 功能说明

回归分析方法也是统计上研究两种或两种以上变量之间相互关系分析的常用方法之一,是通过一个变量或一些变量的变化解释另一变量的变化。在回归分析中,自变量是确定的,变量是随机的,即将自变量的给定值代入回归方程后,所得到的因变量的估计值不是唯一确定的,且会表现出随机波动性,因此存在多个回归方程。

与相关分析相比,不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。可用于对未来进行预测,对某些要素进行控制。回归分析有自变量与因变量之分。回归分析尚有地理预测的性质。

# 操作说明

1. 在分析选项卡中,点击“统计分析”按钮,选择 “回归分析”命令,弹出回归分析对话框,如下图所示。

2. 在回归分析对话框,设置参数,如下:

  • 【输入数据】:可选择当前地图或直接加载数据库中简单要素类或对象类数据。
  • 【分析参数】:可根据实际需求选择分析方法,设置相关分析信息。
    • 分析方法:系统提供了一元线性回归、多元线性回归、逐步线性回归、双曲线回归、幂函数回归、指数函数回归、负指数函数回归、对数函数回归、二元多项式回归。
    • 待预测因子:预测因子。
    • 影响因子:多选对待测因子的影响元素信息。

3. 点击"确定"按钮,执行回归分析后显示统计分析图,如下图所示。分析成果支持导出类要素、导出图片和导出表格的方式。

# 时间序列分析

# 功能说明

时间序列分析也叫时间数列或动态数列,是要素(变量)的数据按照时间顺序变动排列而形成的一种数列,它反映了要素(变量)时间变化的发展过程。

# 操作说明

1. 在分析选项卡中,点击“统计分析”按钮,选择 “时间序列分析”命令,弹出回归分析对话框,如下图所示。

2. 在执行时间序列分析对话框,设置参数,如下:

  • 【输入数据】:可选择当前地图或直接加载数据库中简单要素类或对象类数据。
  • 【分析参数】:可根据实际需求选择分析方法,设置相关分析信息。
    • 分析方法:系统提供一次移动平均、二次移动平均、一次指数平滑、二次指数平滑、三次指数平滑、季节性预测、趋势线预测、自回归预测。
    • 状态字段:预测因子。
    • 最大滑动平均时段数:多选对待测因子的影响元素信息。

3. 点击"确定"按钮,执行时间序列分析后显示统计分析图,如下图所示。分析成果支持导出类要素、导出图片和导出表格的方式。

# 趋势面分析

# 功能说明

趋势面分析是用数学曲面来拟合地理系统要素在空间的分布及变化趋势的一种数学方法。它实质上是通过回归分析原理,模拟地理要素在空间上的分布规律,展示地理要素在地域空间上的变化趋势。趋势面分析常常被用来模拟资源、环境、人口及经济要素在空间上的分布规律,它在空间分析方面具有重要的应用价值。

# 操作说明

1. 在分析选项卡中,点击“统计分析”按钮,选择 “趋势面分析”命令,弹出趋势面分析对话框,如下图所示。

2. 在执行趋势面分析对话框,设置参数,如下:

  • 【输入数据】:可选择当前地图或直接加载数据库中简单要素类或对象类数据。
  • 【分析参数】:可根据实际需求选择分析方法,设置相关分析信息。
  • 【分析方法】:提供多项式趋势面分析
  • 【预测样本数】:选择实际预测样本数。
  • 【状态字段】:要预测的属性字段。

3. 点击"确定"按钮,执行趋势面分析后显示统计分析图,如下图所示。分析成果支持导出类要素、导出图片和导出表格的方式。

# 马尔可夫分析

# 功能说明

马尔可夫(Markov)预测法,就是一种关于事件发生的概率预测方法。它是基于马尔可夫链,根据事件的目前状况来预测其将来各个时刻(或时期)变动状况的一种预测方法。马尔可夫预测法是对地理事件进行预测的基本方法,它是地理预测中常用的重要方法之一。用于研究随机地理过程、预测随机地理事件。

# 操作说明

1. 在分析选项卡中,点击“统计分析”按钮,选择 “马尔可夫分析”命令,弹出马尔可夫分析对话框,如下图所示。

2. 在执行马尔可夫分析对话框,设置参数,如下:

  • 【输入数据】:可选择当前地图或直接加载数据库中简单要素类或对象类数据。
  • 【分析参数】:可根据实际需求选择分析方法,设置相关分析信息。
    • 分析方法:提供马尔可夫预测法进行分析
    • 预测样本数:选择实际预测样本数。
    • 状态字段:要预测的属性字段。

3. 点击"确定"按钮,执行马尔可夫分析后显示统计分析表,如下图所示。分析成果支持导出表格的方式。