首页 南阳师范学院地理信息系统原理及应用课件及考试题四（DOC X页）

南阳师范学院地理信息系统原理及应用课件及考试题四（DOC X页）

南阳师范学院地理信息系统原理及应用课件及考试题四（DOC X页）南阳师范学院地理信息系统原理及应用课件及考试题四（DOC X页）南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) 第五章空间数据的处理 ?5.1 空间数据的坐标变换空间数据的变换即空间数据坐标系的变换,其实质是建立两个平面点之间的一一对应关系，包括几何纠正和投影转换，它们是空间数据处理的基本内容之一。对于数字化地图数据，由于设备坐标系与用户确定的坐标系不一致，以及由于数字化原图图纸发生变形等原因，需要对数字化原图的数据进行坐标系转换和变形误差的消除。有时，不同来源的地图还存在地...

南阳师范学院地理信息系统原理及应用课件及考试题四（DOC X页）南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) 第五章空间数据的处理 ?5.1 空间数据的坐标变换空间数据的变换即空间数据坐标系的变换,其实质是建立两个平面点之间的一一对应关系，包括几何纠正和投影转换，它们是空间数据处理的基本内容之一。对于数字化地图数据，由于设备坐标系与用户确定的坐标系不一致，以及由于数字化原图图纸发生变形等原因，需要对数字化原图的数据进行坐标系转换和变形误差的消除。有时，不同来源的地图还存在地图投影与地图比例尺的差异，因此还需要进行地图投影转换和地图比例尺的统一。一、几何纠正:为了实现数字化数据的坐标系转换和图纸变形误差的改正，现有的GIS软件一般具有仿射变换、相似变换、二次变换等几何纠正功能。 1、高次变其中A、B代表二次以上高次项之和。上式是高次曲线方程，符合上式的变换称为高次变换。式中有12个未知数，所以在进行高次变换时，需要有6对以上控制点的坐标和理论值，才能求出待定系数。 2、二次变换当不考虑高次变换方程中的A和B时，则变成二次曲线方程，称为二次变换。二次变换适用于原图有非线性变形的情况，至少需要5对控制点的坐标及其理论值，才能解算待定系数。 3、仿射变换: 实质:是两坐标系间的旋转变换。设图纸变形引起x,y两个方向比例尺不同，当x,y比例尺相同时，为相似变换。特性: ?直线变换后仍为直线; ?平行线变换后仍为平行线; ?不同方向上的长度比发生变化。求解上式中的6个未知数，需不在一直线上的3对已知控制点，由于误差，需多余观测，所以，用于图幅定向至少需要四对控制点。它的主要特征为:同时考虑到x和y方向上的变形，因此纠正后的坐标数据在不同方向上的长度比将发生变化。二、地图投影变换假定原图点的坐标为x,y(称为旧坐标)，新图点的坐标为X，Y(称为新坐标)，则由旧坐标变换为新坐标的基本方程式为: 1、解析变换法 1)反解变换法(又称间接变换法) 2)正解变换法(又称直接变换法) 2、数值变换法利用若干同名数字化点(对同一点在两种投影中均已知其坐标的点)，采用插值法、有限差分法或多项式逼近的方法，即用数值变换法来建立两投影间的变换关系式。 3、数值解析变换法南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) ?5-2 空间数据结构转换栅格、矢量结构相互转换矢量结构与网格结构的相互转换，是地理信息系统的基本功能之一，目前已经发展了许多高效的转换算法;但是，从栅格数据到矢量数据的转换，特别是扫描图像的自动识别，仍然是目前研究的重点对于点状实体，每个实体仅由一个坐标对表示，其矢量结构和栅格结构的相互转换基本上只是坐标精度变换问题，不存在太大的技术问题。线实体的矢量结构由一系列坐标对表示，在变为栅格结构时，除把序列中坐标对变为栅格行列坐标外，还需根据栅格精度要求，在坐标点之间插满一系列栅格点，这也容易由两点式直线方程得到。线实体由栅格结构变为矢量结构与将多边形边界表示为矢量结构相似，因此以下重点讨论多边形(面实体)的矢量结构与栅格结构相互转换。矢量格式向栅格格式的转换矢量格式向栅格格式转换又称为多边形填充，就是在矢量表示的多边形边界内部的所有栅格点上赋以相应的多边形编码矢量格式向栅格格式的转换算法 ,内部点扩散算法:该算法由每个多边形一个内部点(种子点)开始，向其八个方向的邻点扩散，判断各个新加入点是否在多边形边界上，如果是边界上，则该新加入点不作为种子点，否则把非边界点的邻点作为新的种子点与原有种子点一起进行新的扩散运算，并将该种子点赋以该多边形的编号。重复上述过程直到所有种子点填满该多边形并遇到边界停止为止。特点:扩散算法程序设计比较复杂，并且在一定的栅格精度上，如果复杂图形的同一多边形的两条边界落在同一个或相邻的两个栅格内，会造成多边形不连通，这样一个种子点不能完成整个多边形的填充。 , 复数积分算法 :对全部栅格阵列逐个栅格单元地判断该栅格归属的多边形编码，判别方法是由待判点对每个多边形的封闭边界计算复数积分。对某个多边形，如果积分值为2,i，则该待判点属于此多边形，赋以多边形编号，否则在此多边形外部，不属于该多边形。特点:算法可靠，但极费机时。 , 射线算法 :射线算法可逐点判断数据栅格点在某多边形之外或在多边形内，由待判点向图外某点引射线，判断该射线与某多边形所有边界相交的总次数，如相交偶数次，则待判点在该多边形外部;如为奇数次，则待判点在该多边形内部(如图)。射线算法的优缺点 : , 运算量大; , 射线与多边形边界相交时，有一些特殊情况会影响交点的个数，必须予以排除(如图)。 , 扫描算法 :是射线算法的改进，将射线改为沿栅格阵列列或行方向扫描线，判断与射线算法相似。扫描算法省去了计算射线与多边形边界交点的大量运算，大大提高了效率。特点:占用内存较大;扫描线与多边形相交的各种特殊情况仍然存在。 , 边界代数算法:是一种基于积分思想的矢量格式向栅格格式转换算法，它适合于记录拓扑关系的多边形矢量数据转换为栅格结构。单个多边形的转换由多边形边界上某点开始顺时针搜索边界线，当边界上行时(图a)，位于该边界左侧的具有相同行坐标的所有栅格被减去a;当边界下行时(图b)，该边界左边(前进方向看为右侧)所有栅格点加一个值a，边界搜索完毕则完成了多边形的转换。多个多边形的转换事实上，每幅数字地图都是由多个多边形区域组成的，如果把不属于任何多边形的区域(包含无穷远点的区域)看成编号为零的特殊的多边形区域，则图上每一条边界弧段都与两个不同编号的多边形相邻，按弧段的前进方向分别称为左、右多边形，可以证明，对于这种多个多边形的矢量向栅格转换问题，只需对所有多边形边界弧段作如下运算而不考虑排列次序:当边界弧段上行时，该弧段与左图框之间栅格增加一个值(左多边形编号—右多边形编号);当边界弧段下行时，该弧段与左图框之间栅格增加一个值(右多边形编号—左多边形编号)。两个多边形的转换上行:左—右下行:右—左南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) 边界代数法的特点: 与前述其他算法的不同之处，在于它不是逐点判断与边界的关系完成转换，而是根据边界的拓扑信息，通过简单的加减代数运算将边界位置信息动态地赋给各栅格点，实现了矢量格式到栅格格式的高速转换，而不需要考虑边界与搜索轨迹之间的关系，因此算法简单、可靠性好，各边界弧段只被搜索一次，避免了重复计算。栅格格式向矢量格式的转换多边形栅格格式向矢量格式转换就是提取以相同的编号的栅格集合表示的多边形区域的边界和边界的拓扑关系，并表示由多个小直线段组成的矢量格式边界线的过程。从栅格单元转换为几何图形的过程为矢量化; (一)要求(矢量化过程应保持): 1) 栅->矢转换为拓扑转换，即保持实体原有的连通性、邻接性等; 2) 转换实体保持正确的外形。 (二)方法方法一:实际应用中大多数采用人工矢量化法，如扫描矢量化(该法工作量大，成为GIS数据输入、更新的瓶颈问题之一方法二，程序转化转换(全自动或半自动) 过程为: 1、边界提取2、二值化 3、二值图像的预处理 4、细化:1)剥皮法 2)骨架法 5、跟踪 6、拓扑化栅格格式向矢量格式转换通常包括以下四个基本步骤: ,多边形边界提取:采用高通滤波将栅格图像二值化或以特殊值标识边界点; ,边界线追踪:对每个边界弧段由一个结点向另一个结点搜索，通常对每个已知边界点需沿除了进入方向的其他7个方向搜索下一个边界点，直到连成边界弧段; ,拓扑关系生成:对于矢量表示的边界弧段数据，判断其与原图上各多边形的空间关系，以形成完整的拓扑结构并建立与属性数据的联系; ,去除多余点及曲线圆滑:由于搜索是逐个栅格进行的，必须去除由此造成的多余点记录，以减少数据冗余;搜索结果，曲线由于栅格精度的限制可能不够圆滑，需采用一定的插补算法进行光滑处理，常用的算法有: 线形迭代法;分段三次多项式插值法;正轴抛物线平均加权法;斜轴抛物线平均加权法;样条函数插值法。多边形栅格转矢量的双边界搜索算法(DBDF-Double Boundary Direct Finding) (1)边界点和结点提取: ,边界点的6种情形: 如果窗口内四个栅格有且仅有两个不同的编号，则该四个栅格表示为边界点 . , 结点的8种情形 : 如果窗口内四个栅格有三个以上不同编号，则标识为结点(即不同边界弧段的交汇点)，保持各栅格原多边形编号信息。双边界搜索算法 (2)边界线搜索与左右多边形信息记录: 边界线搜索是逐个弧段进行的，对每个弧段由一组已标识的四个结点开始，选定与之相邻的任意一组四个边界点和结点都必定属于某一窗口的四个标识点之一。首先记录开始边界点的两个多边形编号，作为该弧段的左右多边形，下一点组的搜索方向则由进入当前点的搜索方向和该点组的可能走向决定，每个边界点组只能有两个走向，一个是前点组进入的方向，另一个则可确定为将要搜索后续点组的方向。 (3)多余点去除:多余点的去除基于如下思想:在一个边界弧段上的连续的三个点，如果在一定程度上可以认为在一条直线上(满足直线方程)，则三个点中间一点可以被认为上多余的，予以去除。多余点是由于栅格向矢量转换时逐点搜索边界造成的(当边界为直线时)，多余点去除算法可大量去除多余点，减少数据冗余。双边界搜索算法的优点双边界结构可以唯一地确定搜索方向，从而大大地减少搜索时间，同时形成的矢量结构带有左右多边形编号信息，容易建立拓扑结构和与属性数据的联系，提高转换的效率。南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) ?5-3 矢量数据的图形编辑图形编辑又叫数据编辑、数字化编辑，是指对地图资料数字化后的数据进行编辑加工，其主要目的是在改正数据差错的同时，相应地改正数字化资料的图形。图形编辑是一交互处理过程， GIS具备的图形编辑功能的要求是: 1)具有友好的人机界面，即操作灵活、易于理解、响应迅速等; 2)具有对几何数据和属性编码的修改功能，如点、线、面的增加、删除、修改等; 3)具有分层显示和窗口操作功能，便于用户的使用。 , 数据检查与清理 , 数据的检查: 指拓扑关系的检查。包括检查结点是否匹配、是否存在悬挂线(线段过长或过短;伪结点;线段的断裂);多边形是否闭合(多边形裂口)等。 , 数据清理: 用自动的方法清除空间数据的错误。一、常见问题线段过长或过短伪结点由且仅有两个线目标相关联的结点成为假结点。多边形问题矢量图形的编辑 “碎屑”多边形或“条带”多边形(Sliver Polygon):一般由于重复录入引起，由于前后两次录入同一条线的位置不可能完全一致，造成了“碎屑”多边形。另外，由于用不同比例尺的地图进行数据更新，也可能产生“碎屑”多边形。不正规多边形 ”多边形。是由于输入线时，点的次序倒置或者位置不准确引起的，在进行拓扑生成时，同样会产生“碎屑二、编辑操作 1、结点的编辑 1)结点吻合(Snap) 或称结点匹配、结点咬合，结点附和。方法: A、结点移动，用鼠标将其它两点移到另一点; B、鼠标拉框，用鼠标拉一个矩形，落入该矩形内的结点坐标通过求它们的中间坐标匹配成一致; C、求交点，求两条线的交点或其延长线的交点，作为吻合的结点; D、自动匹配，给定一个吻合容差，或称为咬合距，在图形数字化时或之后，将容差范围内的结点自动吻合成一点。一般，若结点容差设置合理，大多数结点能够吻合在一起，但有些情况还需要使用前三种方法进行人工编辑。 2)结点与线的吻合在数字化过程中，常遇到一个结点与一个线状目标的中间相交。由于测量或数字化误差，它不可能完全交于线目标上，需要进行编辑，称为结点与线的吻合。编辑的方法: A、结点移动，将结点移动到线目标上。 B、使用线段求交; C、自动编辑，在给定容差内，自动求交并吻合在一起。 3)需要考虑两种情况 A、要求坐标一致，而不建立拓扑关系;如高架桥(不需打断，直接移动) B、不仅坐标一致，且要建立之间的空间关联关系;如道路交叉口(需要打断) 4)清除假结点(伪结点) 由且仅有两个线目标相关联的结点成为假结点。有些系统要将这种假结点清除掉(如ARC/INFO)，即将目标A 和B合并成一条，使它们之间不存在结点; 但有些系统并不要求清除假结点，如Geostar,因为它们并不影响空间查询、分析和制图。南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) 2、图形编辑包括用鼠标增加或删除一个点、线、面实体，移动、旋转一个点、线、面实体。 1)删除和增加一个顶点删除顶点，在数据库中不用整体删除与目标有关的数据，只是在原来存储的位置重写一次坐标，拓扑关系不变。增加顶点，则操作和处理都要复杂。不能在原来的存储位置上重写，需要给一个新的目标标识号，在新位置上重写，而将原来的目标删除，此时需要做一系列处理，调整空间拓扑关系。 2)移动一个顶点:移动顶点只涉及某个点的坐标，不涉及拓扑关系的维护，较简单。 3)删除一段弧段:复杂，先要把原来的弧段打断,存储上原来的弧段实际被删除，拓扑关系需要调整和变化. 3、数据检查与清理数据检查指拓扑关系的检查，结点是否匹配，是否存在悬挂弧段，多边形是否封闭，是否有假结点。要求系统能将有错误或不正确的拓扑关系的点、线和面用不同的颜色和符号表示出来，以便于人工检查和修改。数据清理则是用自动的方法清除空间数据的错误. 例如给定一个结点吻合的容差使该容差范围内的结点自动吻合在一起，并建立拓扑关系。给定悬挂弧段容差，将小于该容差的短弧自动删除。在Arc/info中用Data Clean 命令，在Geostar中选择整体结点匹配菜单。 4、撤消与恢复编辑 Undo,Redo功能是必要的。但功能的实现是困难的。当撤消编辑，即恢复目标，要恢复目标的标识和坐标、拓扑关系。这一处理过程相当复杂. 因此，有些GIS不在图形编辑时实时建立和维护拓扑关系，如Arc/Info等，而在图形编辑之后，发Clean 或Build命令重新建立拓扑关系。这样，在每次进行任何一次编辑，都要重新Clean 或Build，对用户不便。三、关键算法南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) ?5-4 拓扑关系的自动建立一、点线拓扑关系的自动建立 1、在图形采集和编辑中实时建立 2、在图形采集和编辑之后自动建立，其基本原理与前类似。二、多边形拓扑关系自动建立 1、链的组织 1)找出在链的中间相交的情况，自动切成新链; 2)把链按一定顺序存储，并把链按顺序编号。 2、结点匹配 1) 把一定限差内的链的端点作为一个结点，其坐标值取多个端点的平均值。 2)对结点顺序编号。南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) 3、检查多边形是否闭合通过判断一条链的端点是否有与之匹配的端点来进行. 多边形不闭合的原因: 1)由于结点匹配限差的问题，造成应匹配的端点未匹配; 2)由于数字化误差较大，或数字化错误，这些可以通过图形编辑或重新确定匹配限差来确定。 3)还可能这条链本身就是悬挂链，不需参加多边形拓扑，这种情况下可以作一标记，使之不参加下一阶段拓扑建立多边形的工作。南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) ?5-5 图形的裁剪、合并和图幅接边一、图形的裁剪--开窗处理、方式: 1 正窗:提取窗口内的数据。开负窗:提取窗口外的数据子集。矩形窗和多边形窗。 2、算法: 包括点、线、面的窗口裁剪---计算机图形学。而不规则多边形开窗------相当于多边形叠置处理。二、图幅数据边沿匹配处理 , 由于空间数据采集的误差和人工操作的误差，两个相邻图幅的地图的空间数据在结合处可能出现逻辑裂隙与几何裂隙。 , 逻辑裂隙指的是当一个地物在一幅图的数据文件中具有地物编码A，而在另一幅图的数据文件中却具有地物编码B，或者同一物体在这两个数据文件中具有不同的属性信息，如公路的宽度、等高线的高程等。 , 几何裂隙指的是由数据文件边界分开的一个地物的两部分不能精确地衔接。 , 图幅接边:在GIS中，需要把单独数字化的相邻图幅的空间数据在逻辑上和几何上融成一个连续一致的数据体，这就是GIS中的图幅接边(图形拼接)问题。图幅接边包括几何接边和逻辑接边。南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) 南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) ?5-6 空间数据压缩与重分类三、栅格数据的压缩 ,栅格数据编码:栅格数据的直接编码方法、栅格数据的压缩编码方法栅格数据的编码方法空间数据编码是空间数据结构的实现，即将根据地理信息系统的目的和任务所搜集的、经过审核了的地形图、专题地图和遥感影像等资料按特定的数据结构转换为适合于计算机存储和处理的数据的过程。由于地理信息系统数据量极大，一般采用压缩数据的编码方式以减少数据冗余。南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) (一)栅格数据直接编码这是最简单直观而又非常重要的一种栅格结构编码方法，通常称这种编码的图像文件为网格文件或栅格文件，栅格结构不论采用何种压缩编码方法，其逻辑原型都是直接编码网格文件。直接编码就是将栅格数据看作一个数据矩阵，逐行(或逐列)逐个记录代码，可以每行都从左到右逐个象元记录，也可以奇数行从左到右而偶数行从右向左记录，为了特定目的还可采用其他特殊的顺序。 (二)栅格数据压缩编码 ,压缩目的:以尽可能少的数据量记录尽可能多的信息 ,压缩类型: ,信息无损压缩: 是指编码过程中没有任何信息损失，通过解码操作可以完全恢复原来的信息 ,信息有损压缩 :是指为了提高编码效率，最大限度地压缩数据，在压缩过程中损失一部分相对不太重要的信息，解码时这部分难以恢复。栅格数据压缩编码方法之一链码:弗里曼链码或边界链码，适用于对曲线和多边形边界进行编码。方法: 八方向定义:东,0，东南,l，南=2，西南,3，西,4，西北,5，北,6，东北,7等八个基本方向。编码:线标号，起始行，起始列，属性码，方位1，方位2，„，方位n, „ ，方位2，„，方位n, „ 线标号，起始行，起始列，属性码，方位1 链式编码的特点:链式编码对多边形和线状地物的表示具有很强的数据压缩能力，且具有一定的运算功能，如面积和周长计算等，探测边界急弯和凹进部分等都比较容易;缺点是对叠置运算如组合、相交等则很难实施，对局部修改将改变整体结构，效率较低，而且由于链码以每个区域为单位存储边界，相邻区域的边界则被重复存储而产生冗余。栅格数据压缩编码方法之二游程编码基本思路:对于一幅栅格图像，常常有行(或列)方向上相邻的若干点具有相同的属性代码，因而可采取某种方法压缩那些重复的记录内容。游程:一行(列)中，属性相同的连续栅格，称为一个游程。思路:将栅格矩阵中的行序列 x1,x2,x3,„, xn 映射成整数对序列。即:(c1,L1),(c2,L2),„, (cn ,Ln). 根据数据结构的不同，可分为: , 游程长度编码:Ci—属性，Li —游程的连续长度。 , 游程终止编码:Ci—属性，Li —游程的终止点列号。游程编码的优、缺点的结构，即许多像元同属一个地理属性值的情况下大大改善了传统编码游程编码的优点:在对“多对一” 的存储情况。游程长度编码栅格加密时，数据量没有明显增加，压缩效率较高，且易于检索、叠加、合并等操作。这种编码方法最适合于小型计算机，同时也减少了栅格数据库的数据输入量。游程编码的缺点:计算期间的处理和制图输出处理工作量都有所增加。栅格数据压缩编码方法之三块码块码是游程长度编码扩展到二维的情况，采用方形区域作为记录单元，每个记录单元包括相邻的若干栅格，数据结构由初始位置(行、列号)和半径，再加上记录单位的代码组成。即(I1,J1,L1,C1，„.，I2,J2,L2,C2，„.) 压缩率:随着图形复杂程度的提高而降低效率，就是说图斑越大，压缩比越高;图斑越碎，压缩比越低块码的优缺点块码在合并、插入、检查延伸性、计算面积等操作时有明显的优越性。然而在某些操作时，则必须将其解码，转换为基本栅格结构才能顺利进行。南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) 栅格数据压缩编码方法之四四叉树编码 (一)思路: 四叉树又称四元树或四分树，四叉树将整个图像区(2n?2n )逐步分解为包含单一类型的方形区域，最小的方形区域为一个栅格象元。分割的原则是，将图像区域划分为四个大小相同的象限，而每个象限又可根据一定规则判断是否继续等分为次一层的四个象限，其终止判据是，不管是哪一层上的象限，只要划分到仅代表一种地物时，则不再继续划分，否则一直划分到单个栅格象元为止。四叉树中象限的尺寸是大小不一的，位于较高层次的象限较大，深度小即分解次数少，而低层次上的象限较小，深度大即分解次数多，这反映了图上某些位置单一地物分布较广而另一些位置上的地物比较复杂，变化较大。正是由于四叉树编码能够自动地依照图形变化而调整象限尺寸，因此它具有极高的压缩效率。采用四叉树编码时，为了保证四叉树分解能不断地进行下去，要求图像必须为2n?2n的栅格阵列，n为极限分割数，n+1为四叉树的最大高度或最大层数，图7-4(c)为23?23的栅格，因此最多划分三次，最大层数为4，对于非标准尺寸的图像需首先通过增加背景的方法将图像扩充为2n?2n的图像。南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) (三)四叉树的存储方法 1)常规四叉树记录这棵树的叶结点外，中间结点，结点之间的联系用指针联系。每个结点需要6个变量: 父结点指针、四个子结点的指针和本结点的属性值。指针不仅增加了数据的存储量，还增加了操作的复杂性:如层次数(分割次数)由从父结点移到根结点的次数来确定，结点所代表的图像块的位置需要从根节点开始逐步推算下来。所以，常规四叉树并不广泛用于存储数据，其价值在于建立索引文件，进行数据检索。 2)线性四叉树记录叶结点的位置，深度(几次分割)和属性。地址码(定位码、Morton码) 四进制、十进制优点: , 存贮量小，只对叶结点编码，节省了大量中间结点的存储，地址码隐含着结点的分割路径和分割次数。 , 线性四叉树可直接寻址，通过其坐标值直接计算其Morton码，而不用建立四叉树。南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) , 定位码容易存储和执行实现集合相加等组合操作。四叉树编码的优点四叉树编码具有可变的分辨率(能够自动地依照图形变化而调整象限尺寸 )，并且有区域性质，压缩数据灵活，许多运算可以在编码数据上直接实现，大大地提高了运算效率，是优秀的栅格压缩编码之一。八叉树编码八叉树结构就是将空间区域不断地分解为八个同样大小的子区域(即将一个六面的立方体再分解为八个相同大小的小立方体)，同—区域的属性相同。八叉树主要用来解决地理信息系统中的三维问题。栅格数据压缩编码总结对数据的压缩是以增加运算时间为代价的。在这里时间与空间是一对矛盾，为了更有效地利用空间资源，减少数据冗余，不得不花费更多的运算时间进行编码，好的压缩编码方法就是要在尽可能减少运算时间的基础上达到最大的数据压缩效率，并且是算法适应性强，易于实现。链码的压缩效率较高，已接近矢量结构，对边界的运算比较方便，但不具有区域的性质，区域运算困难; 游程长度编码既可以在很大程度上压缩数据，又最大限度地保留了原始栅格结构，编码解码十分容易; 块码和四叉树码具有区域性质，又具有可变的分辨率，有较高的压缩效率，四叉树编码可以直接进行大量图形图像运算，效率较高，是很有前途的方法。在此基础上已经开始发展了用于三维数据的八叉树编码等。四、空间数据的重分类南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) ?5-7 空间数据插值通过已知点或多边形分区的数据，推求任意点多多边形数据的方法，成为空间数据的内插。分类: 点的内插、区域内插南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) 3、双三次多项式(样条函数)内插是一种分段函数,每次只用少量的数据点，故内插速度很快;样条函数通过所有的数据点，故可用于精确的内插;可用于平滑处理。将内插点周围的16个点的数据带入多项式，可计算出所有的系数。 3、克里金(Kriging)法: 克里金(Kriging)法:克里格方法的适用范围为区域化变量存在空间相关性，即如果变异函数和结构分析的结果表明区域化变量存在空间相关性，则可以利用克里格方法进行内插或外推;否则反之。其实质是利用区域化变量的原始数据和变异函数的结构特点，对未知样点进行线性无偏、最优估计。无偏是指偏差的数学期望为0，最优是指估计值与实际值之差的平方和最小。也就是说，克里格方法是根据未知样点有限邻域内的若干已知样本点数据，在考虑了样本点的形状、大小和空间方位，与未知样点的相互空间位置关系，以及变异函数提供的结构信息之后，对未知样点进行的一种线性无偏最优估计。 ,相关知识 ,区域化变量:当一个变量呈现一定的空间分布时，称之为区域化变量，它反映了区域内的某种特征或现象。区域化变量与一般的随机变量不同之处在于，一般的随机变量取值符合一定的概率分布，而区域化变量根据区域内位置的不同而取不同的值。而当区域化变量在区域内确定位置取值时，表现为一般的随机变量，也就是说，它是与位置有关的随机变量。南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) ,区域化变量具有两个显著特征:即随机性和结构性。首先，区域化变量是一个随机变量，它具有局部的、随机的、异常的特征;其次，区域化变量具有一定的结构特点，即变量在点x与偏离空间距离为h的点x+h处的值Z(x)和Z(x+h)具有某种程度的相似性，即自相关性，这种自相关性的程度依赖于两点间的距离h及变量特征。除此之外，区域化变量还具有空间局限性(即这种结构性表现为一定范围内)、不同程度的连续性和不同程度的各向异性(即各个方向表现出的自相关性有所区别)等特征。 ,地统计又称地质统计，是在法国著名统计学家G. Matheron大量理论研究的基础上逐渐形成的一门新的统计学分支。它是以区域化变量为基础，借助变异函数，研究既具有随机性又具有结构性，或空间相关性和依赖性的自然现象的一门科学。凡是与空间数据的结构性和随机性，或空间相关性和依赖性，或空间格局与变异有关的研究，并对这些数据进行最优无偏内插估计，或模拟这些数据的离散性、波动性时，皆可应用地统计学的理论与方法。 ,地统计学与经典统计学的共同之处在于:它们都是在大量采样的基础上，通过对样本属性值的频率分布或均值、方差关系及其相应规则的分析，确定其空间分布格局与相关关系。但地统计学区别于经典统计学的最大特点即是:地统计学既考虑到样本值的大小，又重视样本空间位置及样本间的距离，弥补了经典统计学忽略空间方位的缺陷。常用的Kriging方法 , 普通Kriging: 该种方法和反比例加权插值基本相同，只是权重不是一个任意的距离函数，而是基于模型变量图。P102-103 插值的权重之和为1; 表面不太光滑。 , 简单Kriging: 权重之和不等于1; 表面更加平滑。 , 通用Kriging: 离散点的平均值不固定; 应用一个“漂移”项来模拟离散点的平均值; 插值的残差被加到漂移上来计算估计值不同克里格方法适用的条件: ,当数据不服从正态分布时，若服从对数正态分布，则选用对数正态克里格; ,若不服从简单分布时，选用析取克里格。 ,当数据存在主导趋势时，选用泛克里格。 ,当只需了解属性值是否超过某一阈值时，选用指示克里格。 ,当同一事物的两种属性存在相关关系，且一种属性不易获取时，可选用协同克里格方法，借助另一属性实现该属性的空间内插。 ,当假设属性值的期望值为某一已知常数时，选用简单克里格。 ,当假设属性值的期望值是未知的，选用普通克里格。二区域的内插是研究根据一组分区的已知数据来推求同一地区另一组分区未知数据的内插方法。常采用两种方法叠置法:是将目标区叠置在源区上，首先确定两者面积的交集，然后利用公式计算目标区各个分区的值。比重法:原理是根据平滑密度函数的原理，将源区的统计数据从同质性改变为非同质性，而非同质性代表着一般社会经济现象的普遍特点。 1) 在源区上叠加一张格网，格网尺寸的大小应保证具有足够的内插精度 2)将源区各个分区的平均人口数赋予相应分区各个格网点 3)按公式z i，j=(z i-1，j+z i+1，j+z i，j+1+z i，j-1)/4得到相邻的四个格网点的平均值 4)将各个分区的格网点值相加，设为Us’，计算其系数 p= Us/ Us’，并将各个格网点值乘以p，得到调整后的各个分区的格网点值。 5)依此过程继续下去，直到Us与 Us’的值很接近，或者相应分区的格网点值比较一致时，便可以计算目标区的内插值。三、数字高程模型(DEM)的生成 1、DEM的含义: DEM，是国家基础空间数据的重要组成部分，它表示地表区域上地形的三维向量的有限序列，即地表单元上高程的集合DTM:当z为其他二维表面上连续变化的地理特征，如地面温度、降雨、地球磁力、重力、土地利用、土壤类型等其他地面诸特征，此时的DEM成为DTM(Digital Terrain Models)。 2.DEM的表示法 , 1)数学方法用数学方法来表达，可以采用整体拟合方法，即根据区域所有的高程点数据，用傅立叶级数和高次多项式拟合统一的地面高程曲面。也可用局部拟合方法，将地表复杂表面分成正方形规则区域或面积大致相等的不规则区域进行分块搜索，根据有限个点进行拟合形成高程曲面。南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) , 2)图形方法 (1)线模式:等高线是表示地形最常见的形式。其它的地形特征线也是表达地面高程的重要信息源，如山脊线、谷底线、海岸线及坡度变换线等。 (2)点模式:用离散采样数据点建立DEM是DEM建立常用的方法之一。数据采样可以按规则格网采样，可以是密度一致的或不一致的;可以是不规则采样，如不规则三角网、邻近网模型等;也可以有选择性地采样，采集山峰、洼坑、隘口、边界等重要特征点。 3.DEM的主要表示模型 1) 等高线法等高线通常被存储成一个有序的坐标点序列，可以认为是一条带有高程值属性的简单多边形或多边形弧段。由于等高线模型只是表达了区域的部分高程值，往往需要一种插值方法来计算落在等高线以外的其他点的高程，又因为这些点是落在两条等高线包围的区域内，所以，通常只要使用外包的两条等高线的高程进行插值。 2) 规则格网法(Grid) 规则网格，通常是正方形，也可以是矩形、三角形等规则网格。规则网格将区域空间切分为规则的格网单元，每个格网单元对应一个数值。规则格网法是把DEM表示成高程矩阵，此时，DEM来源于直接规则矩形格网采样点或由不规则离散数据点内插产生。结构简单，计算机对矩阵的处理比较方便，高程矩阵已成为DEM最通用的形式。高程矩阵特别有利于各种应用。对于每个格网的数值有两种不同的解释。 , 第一种是格网栅格观点认为该格网单元的数值是其中所有点的高程值，即格网单元对应的地面面积内高程是均一的高度，这种数字高程模型是一个不连续的函数。 , 第二种是点栅格观点，认为该网格单元的数值是网格中心点的高程或该网格单元的平均高程值，这样就需要用一种插值方法来计算每个点的高程。计算任何不是网格中心的数据点的高程值，使用周围4个中心点的高程值，采用距离加权平均方法进行计算，当然也可使用样条函数和克里金插值方法。 Grid系统也有下列缺点: , 地形简单的地区存在大量冗余数据; , 如不改变格网大小,则无法适用于起伏程度不同的地区; , 对于某些特殊计算如视线计算时，格网的轴线方向被夸大; , 由于栅格过于粗略，不能精确表示地形的关键特征,如山峰、洼坑、山脊等; 3)不规则三角网(TIN) 法 TIN表示法利用所有采样点取得的离散数据，按照优化组合的原则，把这些离散点(各三角形的顶点)连接成相互连续的三角面(在连接时，尽可能地确保每个三角形都是锐角三角形或是三边的长度近似相等--Delaunay)。 TIN模型根据区域有限个点集将区域划分为相连的三角面网络，区域中任意点落在三角面的顶点、边上或三角形内。如果某点不在顶点上，该点的高程值通常通过线性插值的方法得到(在边上用边的两个顶点的高程，在三角形内则用三个顶点的高程)。所以TIN是一个三维空间的分段线性模型，在整个区域内连续但不可微。因为TIN可根据地形的复杂程度来确定采样点的密度和位置，能充分表示地形特征点和线，从而减少了地形较平坦地区的数据冗余。不规则点集生成TIN 南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) Delaunay三角网的特点对于给定的初始点集P，有多种三角网剖分方式，而Delaunay三角网有以下特性: 1)其Delaunay三角网是唯一的; 2)三角网的外边界构成了点集P的凸多边形??外壳??; 3)没有任何点在三角形的外接圆内部，反之，如果一个三角网满足此条件，那么它就是Delaunay三角网。 4)如果将三角网中的每个三角形的最小角进行升序排列，则Delaunay三角网的排列得到的数值最大，从这个意义上讲，Delaunay三角网是??最接近于规则化??的三角网。(最小角最大化) TIN的存储 TIN的数据存储方式比格网DEM复杂，它不仅要存储每个点的高程，还要存储其平面坐标、节点连接的拓扑关系，三角形及邻接三角形等关系。TIN模型在概念上类似于多边形网络的矢量拓扑结构，只是TIN模型不需要定义“岛”和“洞”的拓扑关系。、DEM 特点 4 与传统地形图比较，DEM作为地形表面的一种数字表达形式有如下特点: 1)容易以多种形式显示地形信息。地形数据经过计算机软件处理过后，产生多种比例尺的地形图、纵横断面图和立体图。而常规地形图一经制作完成后，比例尺不容易改变或需要人工处理。 2)精度不会损失。常规地图随着时间的推移，图纸将会变形，失掉原有的精度。而DEM采用数字媒介，因而能保持精度不变。另外，由常规的地图用人工的方法制作其他种类的地图，精度会受到损失，而由DEM直接输出，精度可得到控制。 3)容易实现自动化、实时化。常规地图要增加和修改都必须重复相同的工序，劳动强度大而且周期长，而DEM由于是数字形式的，所以增加和修改地形信息只需将修改信息直接输入计算机，经软件处理后即可得各种地形图。 5、DEM应用 1)作为国家地理信息的基础数据; 2)土木工程、景观建筑与矿山工程规划与设计; 3)为军事目的而进行的三维显示;4)景观设计与城市规划; 5)流水线分析、可视性分析; 6)交通路线的规划与大坝选址; 7)不同地表的统计分析与比较; 8)生成坡度图、坡向图、剖面图、辅助地貌分析、估计侵蚀和径流等; 9)作为背景叠加各种专题信息如土壤、土地利用及植被覆盖数据等，以进行显示与分析; 10)与GIS联合进行空间分析; 11)虚拟现实此外，从DEM还能派生以下主要产品:平面等高线图、立体等高线图、等坡度图、晕渲图、通视图、纵横断面图、三维立体透视图、三维立体彩色图等。南阳师范学院地科地理信息系统原理及应用课件及历年考试题(红色为考题) 6.DEM建立 A、数据获取与处理 1)数据采集建立DEM，首先必须量测一些高程点的三维坐标。数据的采集密度和采点的选择决定DEM的精度。 , 采点方式: , 选点采集 , 随机采集 , 沿等高线采集 , 沿断面采集 , 数据来源: , 地面测量 , 地形图数字化采集 , 航空相片采集 , 机载测高仪采集 , 按自动化程度:人工、半自动、自动 2) 数据处理用各种方法采集到得数据需要经过必要的数据处理才能提供应用。数据处理是以数据点作为控制基础，用某一数学模型来模拟地面，进行内插加密计算，确定三角网或格网结点处的特征。数据处理方法: 格式转换坐标系变换数据编辑数据分块数据内插 B.构建DEM 1)人工网格法在地形图上蒙上格网，逐格读取中心点或交点的高程值。 2)三角网法对有限个离散点，每三个邻近点联结成三角形(TIN)，每个三角形代表一个局部平面，再根据每个平面方程，可计算各格网点高程，生成格网DEM。 3)立体像对法 4)曲面拟合法根据有限个离散点的高程，采用多项式或样条函数求得拟合公式，再逐个计算各点的高程，得到拟合的DEM。可反映总的地势，但局部误差较大。可分为: 整体拟合:根据研究区域内所有采样点的观测值建立趋势面模型。特点是不能反映内插区域内的局部特征。局部拟合:利用邻近的数据点估计未知点的值，能反映局部特征。 5)等值线插值法

                    本文档为【南阳师范学院地理信息系统原理及应用课件及考试题四（DOC X页）】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

南阳师范学院地理信息系统原理及应用课件及考试题四（DOC X页）

你可能还喜欢