摘要: 要想写出无懈可击的定义, 就需要使用集合、元组、序列等术语.

1. 区域

在二维平面中, 区域可定义如下:
定义 1 (连通区域, Area): 二维平面中的连通区域为
$\mathbf{A} \subseteq \mathbb{R}^2,$
其中 $\forall (x_1, y_1), (x_2, y_2) \in \mathbf{A}$ , 均存在一条曲线 $\mathbf{L} \subseteq \mathbf{A}$ 将它们相连.

注意: 如果实在需要, 还可以定义什么是曲线. 不过我觉得没必要.
对于地球而言, 可以认为 $\mathbf{A} \subseteq [-180, 180]^2$ , 其中东经和北纬对应于正数, 西经和南纬对应于负数 (我随便规定的).

也可以通过闭合曲线来定义.
定义 2 (边界, Boundary): 二维平面中的连通区域 $\mathbf{A}$ 的边界为 $B(\mathbf{A}) \subseteq \mathbf{A}$ , 它满足: $\forall (x, y) \in B(\mathbf{A}), \varepsilon > 0$ , $\exists (x', y') \not\in \mathbf{A}$ , st. $\delta$ , 其中 $d(\cdot, \cdot)$ 表示欧氏距离.

注意: $B$ 只是一个函数名, 而且它是一个意义完全固定的函数.

一个地块中如果有水塘, 则该水塘并不是地块的一部分, 也就是出现了斑点. 这个地块仍然是连接区域, 查边界并不只有一条. 为了排除这种情况, 定义如下:
定义 3 (无斑区域, Spot-free area): 给定二维平面中的连通区域 $\mathbf{A}$ , 如果 $B(\mathbf{A})$ 恰为一条闭合曲线, 则称 $\mathbf{A}$ 为无斑区域.

注意: 无斑区域这个名词是我瞎编的, 不知道专业的名词是啥.

2. 图斑

将地图图斑视作地表空间认知的最小单位, 则所有图斑组成的集合记为 $\mathbf{U} = \{x_1, x_2, \dots, x_n\}$ , 其中 $n$ 是图斑的个数. 图斑 $x$ 的区域记为 $A (x)$ . 通常要求图斑区域不重叠, 即 $\forall i \neq j$ , $A(x_i) \cap A(x_j) = \emptyset$ . 将区域属性函数 $A$ 扩展为对图斑集合有效, 即 $\forall \mathbf{X} \subseteq \mathbf{U}$ ,
$A(\mathbf{X}) = \cup_{x \in X} A(x). \tag{1}$
为使得图斑集合 $\mathbf{X}$ 有地理意义, 需要满足区域约束, 即 $A(\mathbf{X})$ 应为一个无斑区域.

注意:

$x_1$ 这种表示仅是一种记号, 即对元素进行编号、枚举. 它本身是不具有任何类型的.
$\mathbf{U}$ 是一个非空有穷集. 但 $A (x)$ 是一个无穷集.
[吴] 你的 (1) 式中 $C_i$ 相当于这里的 $A(x_i)$ , 但 (2) 式重新定义它为一个元组就比较奇怪了. (2) 式的 $U$ 也缺乏定义.

如果我们希望用数据挖掘的方式来定义地理信息系统数据集, 就可以把它看成一张二维表. 当然, 表中数据项并不一定是基本数据类型 (字符、整数、实数之类), 所以并不是标准的关系数据库中的数据表. 但可以看作是面向对象数据库中的数据表. 因此可以按信息表的方式来定义.

定义 4 (地理信息数据集 GIS dataset): 地理信息数据集是一个二元组
$(\mathbf{U}, \mathbf{A}),$
其中 $\mathbf{U}$ 是图斑的集合, $\mathbf{A}$ 是定义在这些图斑上的属性 (函数) 集合.

常见的属性包括: 空间、时间、特征、事件.

$\in \mathbf{A}$ 是空间属性, 它指定了相应图斑的区域. 在实际数据中, 可能通过其有限个边界点链接而成. 这时, 它可以表示为一个序列 $\langle p_1, p_2, \dots, p_k \rangle$ , 其中 $p_i = (x_i, y_i)$ .
$\mathbf{F} = \{f_1, f_2, \dots, f_m\}$ 表示静态特征的集合. 它们不随时间的改变而改变.
$\mathbf{T} = \{t_1, t_2, \dots, t_T\}$ 表示时间节点的集合. 由于数据集合的离散性, 仅在这些时间节点上有观测值.
$\mathbf{E} = \{e_1, e_2, \dots, e_T\}$ 表示事件的集合.
[吴] 单独的时间集合不一定有多大意义, 它应该附属于事件.

3. 空间粒

可以把区域内的图斑进行自顶向下的粒化.
给定区域的图斑全集 $\mathbf{U} = \{x_1, x_2, \dots, x_n\}$ , 构建 $L$ 级划分如下:
$\mathbf{U} = \bigcup_{i_1} X_{i_1} = \bigcup_{i_1,i_2} X_{i_1 i_2} = \dots = \bigcup_{i_1,i_2, \dots, i_L} X_{i_1 \dots i_L},$
其中 $X_{i_1, \dots, i_j} = \bigcup_{i_{j+1}} X_{i_1 \dots, i_{j+1}}.$
例: $\mathbf{U} = \{x_1, x_2, x_3, x_4, x_5, x_6, x_7, x_8, x_9\}$ .
$X_1 = \{x_1, x_2, x_3, x_4\}$ , $X_2 = \{x_5, x_6, x_7, x_8, x_9\}.$
$X_{11} = \{x_1, x_2\}$ , $X_{12} = \{x_3, x_4\}$ , $X_{21} = \{x_5, x_6, x_7\}$ , $X_{22} = \{x_8, x_9\}.$
$X_{111} = \{x_1\}$ , $X_{112} = \{x_2\}$ , $X_{121} = \{x_3\}$ , $X_{122} = \{x_4\}$ , $X_{211} = \{x_5\}$ , $X_{212} = \{x_6\}$ , $X_{213} = \{x_7\}$ , $X_{221} = \{x_8\}$ , $X_{222} = \{x_9\}$ .

自顶向下的粒化一般是根据行政区域的划分, 按市、县、乡、村等级别进行.
向底向上的粒化一般利用数据的层次聚类完成.

4. 图斑的元组表示法

从元组的角度来思考问题, 与从面向对象的角度来思考是一致的. 如果一个类有 $k$ 个成员变量 (不管它是什么类型的), 它就可以定义为一个 $k$ 元组.
定义 5 (图斑 Image spot): 图斑是一个三元组
$(\mathbf{A}, \mathbf{F}, \mathbf{E}),$
其中

$\mathbf{A}$ 为定义 1 所描述的区域;
$\mathbf{F} = [f_1, f_2, \dots, f_m]$ 为静态特征向量, 注意这里的 $f_i$ 是实际的值, 而不是定义 4 中的名字特征;
$\mathbf{E} = [e_1, e_2, \dots, e_s]$ 为时序的向量, $e_i = \langle e_{i1}, e_{i2}, \dots, e_{iT}\rangle$ 为第 $i$ 类事件对应的时序.

定义 6 (地理信息系统 GIS): 地理信息系统是一个图斑的集合
$\mathbf{G} = \{P_i\}_{i=1}^n.$

注意: 定义 6 与定义 5 的区别在于, $P_i$ 是实体, 已经把信息包含进去了.

未完待续

原文链接：https://blog.csdn.net/minfanphd/article/details/129965908