GIS 粒计算定义的几种方式(骆老师,吴老师专用)

摘要: 要想写出无懈可击的定义, 就需要使用集合、元组、序列等术语.

1. 区域

在二维平面中, 区域可定义如下:
定义 1 (连通区域, Area): 二维平面中的连通区域为
A ⊆ R 2 , \mathbf{A} \subseteq \mathbb{R}^2,AR2,
其中 ∀ ( x 1 , y 1 ) , ( x 2 , y 2 ) ∈ A \forall (x_1, y_1), (x_2, y_2) \in \mathbf{A}(x1,y1),(x2,y2)A, 均存在一条曲线 L ⊆ A \mathbf{L} \subseteq \mathbf{A}LA将它们相连.

注意: 如果实在需要, 还可以定义什么是曲线. 不过我觉得没必要.
对于地球而言, 可以认为 A ⊆ [ − 180 , 180 ] 2 \mathbf{A} \subseteq [-180, 180]^2A[180,180]2, 其中东经和北纬对应于正数, 西经和南纬对应于负数 (我随便规定的).

也可以通过闭合曲线来定义.
定义 2 (边界, Boundary): 二维平面中的连通区域 A \mathbf{A}A 的边界为 B ( A ) ⊆ A B(\mathbf{A}) \subseteq \mathbf{A}B(A)A, 它满足: ∀ ( x , y ) ∈ B ( A ) , ε > 0 \forall (x, y) \in B(\mathbf{A}), \varepsilon > 0(x,y)B(A),ε>0, ∃ ( x ′ , y ′ ) ∉ A \exists (x', y') \not\in \mathbf{A}(x,y)A, st. d ( ( x , y ) , ( x ′ , y ′ ) ) < δ d((x, y), (x', y')) < \deltad((x,y),(x,y))<δ, 其中d ( ⋅ , ⋅ ) d(\cdot, \cdot)d(,) 表示欧氏距离.

注意: B BB 只是一个函数名, 而且它是一个意义完全固定的函数.

一个地块中如果有水塘, 则该水塘并不是地块的一部分, 也就是出现了斑点. 这个地块仍然是连接区域, 查边界并不只有一条. 为了排除这种情况, 定义如下:
定义 3 (无斑区域, Spot-free area): 给定二维平面中的连通区域 A \mathbf{A}A, 如果 B ( A ) B(\mathbf{A})B(A) 恰为一条闭合曲线, 则称 A \mathbf{A}A 为无斑区域.

注意: 无斑区域这个名词是我瞎编的, 不知道专业的名词是啥.

2. 图斑

将地图图斑视作地表空间认知的最小单位, 则所有图斑组成的集合记为 U = { x 1 , x 2 , … , x n } \mathbf{U} = \{x_1, x_2, \dots, x_n\}U={x1,x2,,xn}, 其中 n nn 是图斑的个数. 图斑 x xx 的区域记为 A ( x ) A(x)A(x). 通常要求图斑区域不重叠, 即 ∀ i ≠ j \forall i \neq ji=j, A ( x i ) ∩ A ( x j ) = ∅ A(x_i) \cap A(x_j) = \emptysetA(xi)A(xj)=. 将区域属性函数 A AA 扩展为对图斑集合有效, 即 ∀ X ⊆ U \forall \mathbf{X} \subseteq \mathbf{U}XU,
A ( X ) = ∪ x ∈ X A ( x ) . (1) A(\mathbf{X}) = \cup_{x \in X} A(x). \tag{1}A(X)=xXA(x).(1)
为使得图斑集合 X \mathbf{X}X 有地理意义, 需要满足区域约束, 即 A ( X ) A(\mathbf{X})A(X) 应为一个无斑区域.

注意:

  1. x 1 x_1x1 这种表示仅是一种记号, 即对元素进行编号、枚举. 它本身是不具有任何类型的.
  2. U \mathbf{U}U 是一个非空有穷集. 但 A ( x ) A(x)A(x) 是一个无穷集.
  3. [吴] 你的 (1) 式中 C i C_iCi 相当于这里的 A ( x i ) A(x_i)A(xi), 但 (2) 式重新定义它为一个元组就比较奇怪了. (2) 式的 U UU 也缺乏定义.

如果我们希望用数据挖掘的方式来定义地理信息系统数据集, 就可以把它看成一张二维表. 当然, 表中数据项并不一定是基本数据类型 (字符、整数、实数之类), 所以并不是标准的关系数据库中的数据表. 但可以看作是面向对象数据库中的数据表. 因此可以按信息表的方式来定义.

定义 4 (地理信息数据集 GIS dataset): 地理信息数据集是一个二元组
G = ( U , A ) , G = (\mathbf{U}, \mathbf{A}),G=(U,A),
其中 U \mathbf{U}U 是图斑的集合, A \mathbf{A}A 是定义在这些图斑上的属性 (函数) 集合.

常见的属性包括: 空间、时间、特征、事件.

  • A ∈ A A \in \mathbf{A}AA 是空间属性, 它指定了相应图斑的区域. 在实际数据中, 可能通过其有限个边界点链接而成. 这时, 它可以表示为一个序列 ⟨ p 1 , p 2 , … , p k ⟩ \langle p_1, p_2, \dots, p_k \ranglep1,p2,,pk, 其中 p i = ( x i , y i ) p_i = (x_i, y_i)pi=(xi,yi).
  • F = { f 1 , f 2 , … , f m } \mathbf{F} = \{f_1, f_2, \dots, f_m\}F={f1,f2,,fm} 表示静态特征的集合. 它们不随时间的改变而改变.
  • T = { t 1 , t 2 , … , t T } \mathbf{T} = \{t_1, t_2, \dots, t_T\}T={t1,t2,,tT} 表示时间节点的集合. 由于数据集合的离散性, 仅在这些时间节点上有观测值.
  • E = { e 1 , e 2 , … , e T } \mathbf{E} = \{e_1, e_2, \dots, e_T\}E={e1,e2,,eT} 表示事件的集合.
    [吴] 单独的时间集合不一定有多大意义, 它应该附属于事件.

3. 空间粒

可以把区域内的图斑进行自顶向下的粒化.
给定区域的图斑全集 U = { x 1 , x 2 , … , x n } \mathbf{U} = \{x_1, x_2, \dots, x_n\}U={x1,x2,,xn}, 构建 L LL 级划分如下:
U = ⋃ i 1 X i 1 = ⋃ i 1 , i 2 X i 1 i 2 = ⋯ = ⋃ i 1 , i 2 , … , i L X i 1 … i L , \mathbf{U} = \bigcup_{i_1} X_{i_1} = \bigcup_{i_1,i_2} X_{i_1 i_2} = \dots = \bigcup_{i_1,i_2, \dots, i_L} X_{i_1 \dots i_L},U=i1Xi1=i1,i2Xi1i2==i1,i2,,iLXi1iL,
其中 X i 1 , … , i j = ⋃ i j + 1 X i 1 … , i j + 1 . X_{i_1, \dots, i_j} = \bigcup_{i_{j+1}} X_{i_1 \dots, i_{j+1}}.Xi1,,ij=ij+1Xi1,ij+1.
例: U = { x 1 , x 2 , x 3 , x 4 , x 5 , x 6 , x 7 , x 8 , x 9 } \mathbf{U} = \{x_1, x_2, x_3, x_4, x_5, x_6, x_7, x_8, x_9\}U={x1,x2,x3,x4,x5,x6,x7,x8,x9}.
X 1 = { x 1 , x 2 , x 3 , x 4 } X_1 = \{x_1, x_2, x_3, x_4\}X1={x1,x2,x3,x4}, X 2 = { x 5 , x 6 , x 7 , x 8 , x 9 } . X_2 = \{x_5, x_6, x_7, x_8, x_9\}.X2={x5,x6,x7,x8,x9}.
X 11 = { x 1 , x 2 } X_{11} = \{x_1, x_2\}X11={x1,x2}, X 12 = { x 3 , x 4 } X_{12} = \{x_3, x_4\}X12={x3,x4}, X 21 = { x 5 , x 6 , x 7 } X_{21} = \{x_5, x_6, x_7\}X21={x5,x6,x7}, X 22 = { x 8 , x 9 } . X_{22} = \{x_8, x_9\}.X22={x8,x9}.
X 111 = { x 1 } X_{111} = \{x_1\}X111={x1}, X 112 = { x 2 } X_{112} = \{x_2\}X112={x2}, X 121 = { x 3 } X_{121} = \{x_3\}X121={x3}, X 122 = { x 4 } X_{122} = \{x_4\}X122={x4}, X 211 = { x 5 } X_{211} = \{x_5\}X211={x5}, X 212 = { x 6 } X_{212} = \{x_6\}X212={x6}, X 213 = { x 7 } X_{213} = \{x_7\}X213={x7}, X 221 = { x 8 } X_{221} = \{x_8\}X221={x8}, X 222 = { x 9 } X_{222} = \{x_9\}X222={x9}.

自顶向下的粒化一般是根据行政区域的划分, 按市、县、乡、村等级别进行.
向底向上的粒化一般利用数据的层次聚类完成.

4. 图斑的元组表示法

从元组的角度来思考问题, 与从面向对象的角度来思考是一致的. 如果一个类有 k kk 个成员变量 (不管它是什么类型的), 它就可以定义为一个 k kk 元组.
定义 5 (图斑 Image spot): 图斑是一个三元组
P = ( A , F , E ) , P = (\mathbf{A}, \mathbf{F}, \mathbf{E}),P=(A,F,E),
其中

  • A \mathbf{A}A 为定义 1 所描述的区域;
  • F = [ f 1 , f 2 , … , f m ] \mathbf{F} = [f_1, f_2, \dots, f_m]F=[f1,f2,,fm] 为静态特征向量, 注意这里的 f i f_ifi 是实际的值, 而不是定义 4 中的名字特征;
  • E = [ e 1 , e 2 , … , e s ] \mathbf{E} = [e_1, e_2, \dots, e_s]E=[e1,e2,,es] 为时序的向量, e i = ⟨ e i 1 , e i 2 , … , e i T ⟩ e_i = \langle e_{i1}, e_{i2}, \dots, e_{iT}\rangleei=ei1,ei2,,eiT 为第 i ii 类事件对应的时序.

定义 6 (地理信息系统 GIS): 地理信息系统是一个图斑的集合
G = { P i } i = 1 n . \mathbf{G} = \{P_i\}_{i=1}^n.G={Pi}i=1n.

注意: 定义 6 与定义 5 的区别在于, P i P_iPi 是实体, 已经把信息包含进去了.


未完待续


版权声明:本文为minfanphd原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。