對當初學習地理信息系統概論時的筆記進行的總結,希望可以給沒有GIS基礎又想學習GIS的同學一點幫助。

如何把有關的空間數據組織到計算機系統中?

客觀的地理系統包括自然環境系統和社會經濟環境系統

1)確定專題領域實際模型;

2)建立表達實際模型的概念模型;

3)建立為實現概念模型的數據結構;

4)確定數據文件在資料庫中的組織方式。

空間實際模型:指在研究區(項目所相關的空間區域)內與某領域有關的實際存在的物質世界,它包含所有能夠被人們直接和不能直接觀察到的各種有關信息。

空間數據模型:對有關真實世界的一種抽象表達,可稱為概念模型。

空間數據結構:把概念模型轉變為計算機系統所能接受的數據結構和邏輯關係。

空間信息特點:1.空間性空間位置:坐標數據 不同坐標之間可以轉換空間位置關係:拓撲關係2.屬性:屬非空間數據3.時間性:空間特徵、屬性特徵獨立地隨時間變化

空間實體的屬性信息分類:

二元型:有、無;是、否。

等級型:地位級、火險等級。

數量型:面積、長度、重量等。

非數量型:坡向、坡位、植被類型等。

空間實體的度量信息:定位信息:點、線、面等用坐標對、坐標串、閉合坐標串描述。

1、拓撲關係概念:

拓撲關係是明確定義空間關係的一種數學方法。在GIS中,用來描述並確定空間的點線面之間的關係及屬性,並可實現相關的查詢和檢索。

2、拓撲關係特點:

1)獨立於坐標系統的幾何關係;2)不隨幾何實體平移 旋轉 縮放而變化

拓撲關係反映了空間實體間的邏輯關係,不需要坐標、距離信息,不受比例尺限制,也不隨投影關係變化。

理解拓撲變換和拓撲屬性時,我們可以設想一塊高質量的橡皮,它的表面是歐幾裏德平面,可被任意拉伸壓縮,但不能扭轉摺疊。表面上有由結點、弧、環和區域組成的圖形。若對該橡皮進行任意拉伸、壓縮,但不扭轉和摺疊,則在橡皮形狀的這些變換中,圖形的一些屬性將得到保留,有些屬性將消失。

拓撲屬性:一個點在一個弧段的端點;一個弧段是一個簡單的弧段;一個點在一個區域的邊界上;一個點在一個區域的內部;一個點在一個區域的外部;一個面是一個簡單的面(無島);一個面的連通性。

非拓撲屬性:兩點之間的距離;一個點指向另一個點的方向;弧段的長度;一個區域的周長;一個區域的面積。

3、空間對象的拓撲空間關係

拓撲元素

點:孤立點、線的端點、面的首尾點、鏈的連接點

線:兩結點之間的有序弧段,包括鏈、弧段和線段

面:若干弧段組成的多邊形

基本拓撲關係:

關聯:不同拓撲元素之間的關係

鄰接:相同拓撲元素之間的關係

包含:面與其他元素之間的關係

層次:相同拓撲元素之間的層次關係

歐拉公式:歐拉公式在GIS中有著重要的意義,主要用來檢查空間拓撲關係的正確性,能發現點、線、面不匹配的情況和多餘、遺漏的圖形元素; Npl=NA+1-ND

拓撲關係的關聯表達是指採用什麼樣的拓撲關聯表來表達空間位置數據之間的關係。

1)全顯式表達

2)半隱式表達

1)全顯式表達既明確表示空間數據多邊形、弧段、結點之間的拓樸關係,同時還明確表達結點、弧段、多邊形之間的拓撲關係。4個表格;

2)半隱式只有一個表格即可,其他的可由此表推出。

確定空間數據模型的基本原則:

1、把所基本空間信息儲存於計算機介質中

2、便於對資料庫信息的復原、查詢、分析和處理等的高效與可能性

一、.規則格網式空間數據模型(柵格數據模型):空間單元人為劃定成大小相等的正方形網格,有著統一的定位參照系。每個空間單元只記錄其屬性值,而不記錄它的坐標值。

(一)柵格數據模型特點:

1.用離散的量化柵格值表示空間實體

2.描述區域位置明確,屬性明顯

3.數據結構簡單,易與遙感結合

4.難以建立地物間拓撲關係

5.圖形質量低,數據量大

每個柵格元素只能取一個值,實際上一個柵格可能對應於實體中幾種不同屬性值,存在柵格數據取值問題,解決方法:

1、面積佔優法:柵格中佔最大面積的屬性值為柵格的屬性值

2、長度佔優法:將網格中心畫一橫線,用橫線所佔最長部分屬性值作為柵格屬性值。

3、中心點法:將柵格中心點的屬性值作為柵格屬性值。

4、重要性法:某些主要屬性,只要在柵格中出現就把該屬性作為柵格屬性值。

(三)柵格數據的獲取

1、目讀法:適用於所選區域範圍小,柵格單元尺寸大的情況。

2、從掃描儀獲取:高精度,快速度,數據格式標準化。

3、從攝像機獲取:柵格元素數固定 512×512 1024×1024

4、從遙感中獲取:週期性,動態性,可自動提取專題信息。

5、從矢量數據轉換成柵格數據

二、面向實體的空間數據模型(矢量數據模型)

把連續的空間按實體集中,每個實體分割成空間單元,記錄描述它們位置的坐標數據。必須有一個參照坐標系和劃分地理實體的分類系統,坐標系決定矢量數據模型的精度。

(一)矢量數據模型的特點

1、用離散的點或線描述地理現象及特徵

2、用拓撲關係描述矢量數據之間關係

3、面向目標的操作

4、數據結構複雜且難以同遙感數據結合

5、難於處理位置關係

(二)矢量數據的獲取

外業測量獲取(如GPS);用跟蹤數字化方法獲取數據;從柵格數據轉換成矢量數據

空間數據結構:

空間數據結構:把概念模型轉變為計算機系統所能接受的數據結構和邏輯關係。

(一)二維矩陣數據結構l

在數據無壓縮的情況下,柵格數據按直接編碼順序進行存儲。

所謂直接編碼,是將柵格數據看成一個數字矩陣,數據存儲按矩陣編碼方式存儲,即把規則格網平面作為一個二維矩陣進行數學表達,每個柵格是具有行、列位置的矩陣元素,該空間實體屬性編碼值賦予矩陣元素。

基本要素包括:行,列,屬性值(N,M,Xij) 其中行、列值隱性,屬性值顯性。

優點:1、易於實現用循環語句編程,實現快速運算

2、易於實現空間屬性的分解與分類,易於實現空間分析中疊加等操作

缺點:數據存儲量大

(二)費爾曼鏈碼 (邊界編碼)

曲線或邊界中有一點(i,j)其相鄰柵格在8個鄰域方向上。

優缺點: 數據壓縮率強,便於計算長度,面積,便於表示圖形凹凸部分,易於儲存。但難於實現疊置運算,不便於合併插入操作。適於對曲線和邊界進行編碼。

(三)遊程(行程)編碼

適於對塊狀地物的柵格數據進行壓縮編碼。

遊程:以行為單位,將柵格數據矩陣中屬性相同的連續柵格視為一遊程。

分為遊程終止編碼和遊程長度編碼

編碼方式:(gk,lk)

gk—柵格屬性值

lk —遊程終止列號或長度

K=1,2,3,4…..m(m<n)

遊程編碼優點:數據壓縮率高,易於實現疊置,檢索運算。

缺點:只考慮水平分解元素之間相關性而未考慮垂直分解元素之間相關性,又稱一維遊程編碼。

(四)塊狀編碼

以正方形區域為單元對塊狀地物的柵格數據進行編碼,實質是把柵格陣列中同一屬性方形區域各元素映射成一個元素系列。

編碼方式:(行號,列號,半徑,代碼)

塊碼特點:1、面狀地物所能包含的正方形越大,多邊形邊界越簡單,塊碼編碼效率超高;2、圖形比較碎,多邊形邊界複雜的圖形,數據壓縮率低;3、利於計算面積、合併插入等操作。

(五)四叉樹編碼(Quadtree Code)

1、常規四叉樹基本思想

把一幅圖像或一幅柵格地圖等分成4部分,逐塊檢查其柵格值,若每個子區都含有相同值,則該子區不再往下分割,否則將該區域再分割4個子區域,如此遞歸分割直到每個子塊都含有相同的灰度或屬性為止。

不能再分的塊構成為樹的葉結點,有值的葉結點為黑結點,沒有值的結點為白結點。N為樹的高度(深度),對一幅2^N ×2^N的柵格陣列,最大深度為N,可能有的層次為0,1,2,…,N,那麼,每層的柵格寬度為:2^(最大深度-當前層次)

2.線性四叉樹

以四叉樹的方式組織數據,但不以四叉樹方式存儲數據。通過編碼四叉樹的葉結點表示數據的層次和空間關係。葉結點具有一個反映位置的關鍵字,亦稱位置碼。實質是把原來大小相等等柵格集合轉換成大小不等的正方形集合,對不同尺寸和位置的正方形集合賦予一個位置碼。

3)基於十進位的線性四叉樹編碼

將二進位的行列號按位交錯排列,可得到四叉樹葉結點的二進位地址碼,進而將二進位碼轉成十進位碼,得到四叉樹編碼。

表a經自下而上歸併得表b。依次檢查表a中四個相鄰葉結點的屬性代碼是否相同。若相同則歸併成一個父結點,記下地址及代碼。否則不予歸併。然後再歸併更高一層父結點,如此循環,直到不能歸併為止。

特點:比四進位節省儲存空間,且前後兩個MD碼之間差代表了葉結點的大小,還可進一步利用遊程編碼對數據進行壓縮。優點:具有可變解析度,能精確表示圖形的細節部分,編碼效率高;具有區域性質,適合於圖形圖像的分析運算;便於島的分析。

四進位線性四叉樹編碼的特點:優點是便於實現行列值及其編碼之間的轉換;缺點是存儲開銷大,且一般軟體都不支持四進位。

二、矢量數據結構

面實體地圖的描述和定義:

(1)從圖論空間來看,一個地圖G=(a , p)被看成是由頂點集(p)被邊集(a)所連接的網,可稱為多邊形網;

(2)每個面實體(稱為多邊形)是由一組點子集或線子集所定義;

(3)每個多邊形是在一定的約束條件下某些線實體所構成的迴路;

(4)線與線實體呈鏈接關係而無交叉關係;

(5)面實體之間有鄰接和疊合包含關係;

(6)疊合包含關係可分半島式及島嶼式;

(7)鄰接多邊形之間至少必有一個公共邊(弧);

(8)一條弧是由若干個點所組成,首、尾端點稱為首結點和尾結點;

(9)在一般情況下,一個結點至少連接三個以上的弧;

(10)島嶼多邊形與半島多邊形首尾結點重合,它們本身只有一條弧,但連接半島多邊形的結點除了引出半島多邊形的弧之外,還至少引出另外兩條以上的弧;

(11)一幅地圖上的多邊形類型除了一般多邊形、島嶼多邊形、半島多邊形之外,還必有一個圖幅邊界多邊形;

12)在由一般多邊形和邊界多邊形構成的地圖情況下(假設沒有島嶼多邊形及半島多邊形)在該幅地圖上多邊形、結點與弧的關係可由下式所定義:

Npl=NA+2-ND

其中, Npl——多邊形的個數; NA——弧數 ;ND——結點數

一)面實體的非拓撲結構簡單表達方法及相應的數據結構

1.面實體簡單的矢量表達方法

逐一對每個多邊形進行表達,把每個多邊形表達成一組邊(弧)上的X與Y坐標。

優點:

數據結構最簡單,一個多邊形是一個閉合的曲線,不被分解成弧段,也用不著考慮島嶼和半島多邊形的問題

缺點:

1)相鄰兩多邊形之間的界線數字化和儲存兩次,公共邊界兩次數字化的數據不可能完全相同,會出現一些空隙

2)該方法不能產生鄰域信息,拓撲信息,空間分析和查詢困難。

3)島作為一個單個圖形,沒有與外界多邊形聯繫。不易檢查拓撲錯誤。 所以,這種結構只用於簡單的製圖系統中,顯示圖形。

2.帶有索引的多邊形矢量表達方法

一幅面實體地圖可以分解成若干個多邊形,一個多邊形可以按邊界相交的結點分解成若干弧段。一個弧段是一組X、Y坐標定義的線段,鄰接多邊形的公共邊界線只被數字化和儲存一次。同時,單獨記錄地圖、多邊形、邊(弧)之間關係的信息。可以構造一種數據結構,把各條弧的坐標及地圖要素之間的關係分開儲存。對所有點的坐標按順序建坐標文件,再建點與邊(線)、線與多邊形的索引文件。

索引式面實體的典型應用:在ArcView中,每個圖形文件包括三個數據文件:

1、.shp文件:存儲各地圖要素的坐標數據和幾何數據;

2、.shx文件:存儲地圖要素間的隸屬關係;

3、.dbf文件:存儲地圖要素的屬性數據。

優點:

1)消除多邊形數據的冗餘和不一致

2)鄰接信息、島信息可通過查找公共弧段號的方式查詢。

缺點:

1)表達拓撲關係較繁瑣

2)給相鄰運算、處理島信息、檢索拓撲關係等帶來困難

3)以人工方式建立編碼表,工作量大,易出錯。

(二)基於面向空間實體數據模型的拓撲向量數據結構

1.表達拓撲向量數據結構的策略:

(1)以弧為基本單元進行數字化,記錄坐標值,形成坐標數據;

(2)由坐標數據提取弧和結點數據;

(3)由結點、弧及坐標數據產生表達面實體拓撲關係的數據。

地理信息系統面狀要素拓撲關係數據文件:

.cor:坐標數據文件 .idx:弧索引文件 .alt:結點文件 .pat:多邊形文件 .lrp:弧的左右多邊形文件 .bnd:圖幅邊界點數據文件 .lab:標註文件.dbf:屬性文件

兩種數據結構的比較

矢量數據:

1.優點:?表示地理數據的精度較高?數據結構嚴謹,數據量小?完整的描述空間拓撲關係圖形輸出精確美觀?圖形數據和屬性數據的恢復、更新、綜合都能實現?面向目標,不僅能表達屬性,而且能方便的記錄每個目標的具體屬性信息

2.2.缺點:?數據結構複雜?矢量疊置較為複雜?數學模擬比較困難?技術複雜,對軟硬體要求高

柵格數據:

1.優點:?數據結構簡單?空間數據的疊置和組合方便?各類空間分析很易於進行?數學模擬方便

2.缺點:?圖形數據量大?降低解析度,精度和信息量受損?地圖輸出不美觀?難以建立網路連接關係?投影變換比較費時

將矢量柵格數據統一起來,建立矢量柵格一體化數據結構,是目前GIS界研究的DTM概念:是對連續變化的地形起伏進行數字表達,是帶有空間位置特徵和地形屬性特徵的數字表達。包括高程、坡度、坡向及其他地貌特徵等。

DEM概念:DTM中的地形屬性為高程時,稱為數字化高程模型(DEM)。

方向之一。

一、數字化高程模型的表達方法

1、高程矩陣模型(DEM)

假定把一個有規則的格點網鋪放在地面上,除了記錄平面位置外,還記錄高程數據。由此可產生一高程矩陣來描述地形變化。矩陣元素反應出各抽樣點的高程,而平面位置暗含於各元素的位置中。在計算機實現中是一個二維數組。

高程數據的獲取:

1、用現存的地形圖進行數字化

2、在航空象片上用攝影測量方法來獲取

3、內插方法

優點:機械布點、取點容易,容易通過該模型提取坡度、坡向、地形結構信息及建立三維透視圖等。

缺點:a.在均勻平緩的地形情況下回有著大量的重複數據;

b.複雜的地形,整體網格的布設密度又可能顯得太粗,不能很好地表達出山脊線谷地線等地貌特徵;

c.柵格式高程矩陣只著重沿兩軸方向做各種數據處理,然而地形變化並不總適合兩軸方向的數據處理。

2、平行剖麵線模型

概念:如果在地形圖上獲得數字化高程時,按一定方向平行的做剖麵線,相當於網格線的縱線或橫線,按這些線於等高線相交設模型點。

高程數據的獲取:地形圖

特點:只保留一維的向量方向,在這方向上可以隨地貌的變化,其抽樣點自然會加密或稀疏其布點;可以使用遊程編碼數據結構。

3、等高線數字模型

概念:布點不遵守行、列規則布點,而是按等高線的彎曲布設,對每條等高線進行數字化。

獲取:地形圖

特點:可以用矢量非拓撲數據結構表示,每條等高線作為一個記錄,記錄高程值、抽樣點數和每個抽樣點的X及Y坐標。該方法易於等高線的輸入和復原。

4、不規則三角網路模型(TIN 模型)Triangulated Irregular Netword

概念:TIN模型是一系列各自具有相同坡面的三角形平面來擬合地形表面。

獲取:地形圖

特點:每個三角形的選取要代表某一斜平面的臨界點。在地形圖上可以人為直接的或按著一定規定確定出三角形,進而建立起不規則三角形網路模型。TIN的模型不受事先規定布點方式的限制,能夠較好的表達地形特點。需要建立拓撲關係時,用兩個數據文件就可以表達出所需要的拓撲關係。即結點文件和三角形文件。

二、地形結構的數學模擬

1.麥特朗(G.MATERAN)假說

任何地理空間變動可以用三個重要成分表示:

1)地形的結構成分,它與固定平均數或固定的趨勢有關;

2)與空間位置有關的隨機成分;

3)一個隨機的噪音或稱殘差項

2.函數表達:

空間位置X的高程值為:

其中:m(x)是決定函數,描述z在x點上的結構成分;

ε來自的非獨立性殘差隨機量;

ε"獨立的高斯噪音項,期望值為0

3、地形結構分類

1) 平面:該平面上高程變化的數學期望值等於零,即:

E [Z(x) - Z(x+h)]=0 , h---區域向量半徑變數。

2)斜面:在區域內,高程特徵值Z沿著切面單調地增加或減少,稱為線性關係即:

Z=b0+b1·x

Z=b0+b1·x+b2·y

3)非線性曲面:區域內地形顯現為更為複雜的曲面,可用二次多項式或高階多項式來表達。

三、地理空間數據的內插方法

四、1、基本概念:

插值:根據一組已知的數據點,構造一個函數,使已知的數據點全部通過該函數,並用該函數求出其它位置數據點值,這種方法稱為插值法,所構造的函數稱為插值函數。

逼近:根據一組已知的數據點,構造一個函數,使已知的數據點整體上接近該函數,但不必通過全部數據點但所構成的函數與已知數據點之間誤差在某種意義上插值最小。

擬合:通常將插值和逼近統稱為擬合。

3、GIS常用的內插函數

1)基本剖面的線性插值

2)距離倒數加權內插函數(INSERT DISTANCE WEIGHTED——IDW)

假定每個輸入點都有著局部影,這種影響隨著距離增加而減弱。

3)移動區域及樣條內插方法(SPLINE FUNCTION )

用一數學函數去擬合指定數量的最近輸入點,使曲面通過這些抽樣點。如果在很短的水平距離內趨勢面有很大的落差,會產生較大的誤差

4)克瑞欽(KRIGING)內插函數

定義:克瑞欽插值是以空間自相關性為基礎,利用原始數據和半方差函數的結構性,對區域化變數的未知採樣點進行無偏估值的插值方法。又稱克里格

克瑞欽內插法與最小二乘法區別:

二者比較類似,也是將空間變化分為趨勢、信號和誤差三部分,求解過程也比較相似。 不同之處在於所採用的相關性計算方法上,最小二乘法採用協方差矩陣,而克瑞欽法採用半方差,或者稱半變異函數

5)趨勢(TREND)內插函數

用最小二乘法(LEAST SQUERES REGRESSION)擬合所有的輸入點,得到趨勢內插函數。所獲得的趨勢面不能通過全部輸入點。

l該方法理論基礎嚴密,但大量實驗結果表明,它未必能在DEM內插中取得良好效果,原因在於:最小二乘法的前提條件是處理對象必須屬於遍歷性平衡隨機過程,但實際地形表面變化複雜,不一定滿足這一條件,而且地形之間的自相關性不僅與距離有關,也與方向有關,即地形具有各向異性。另外最小二乘法的解算是一個循環迭代的過程,計算量較大。

6)區域內插演算法

有些採樣數據不是均勻變化的,有些數據經專業處理後表達為在各個不同分區中同質或線性變化,這就導致區域之間值的變化在相鄰邊界處不連續。這種情況有時既不符合現實情況,也不滿足連續光滑的假設條件。因而,需要對這些數據進行區域內插,使得數據在邊界連續。區域內插包括點在區域內的內插和麪的區域內的內插兩種類型。

(1)點的區域內插演算法

已知某種特徵數據的分佈情況,要求解某待定點的特徵值。首先要確定該點位於哪一分區中,然後根據該分區內特徵值或其變化規律,內插確定待定點的特徵值。所用演算法包括兩部分,一是點在多邊形內的判斷;二是點在區域內的線性插值。

(2)面的區域內插演算法

面區域內插的實質是根據某一地區的一組已知分區(稱為源區,source region)的已知數據,推求同一分區(目標區,target region)的另一組分區的未知數據。這是GIS的一個非常有用的內插方法,在區域統計、數據挖掘方面有廣泛的用途。有兩種方法,即疊置法和比重法。

疊置法

疊置法的前提是認為在源區和目標區內數據是均勻分佈的。求解時,將目標區疊合到源區上,求出源區和目標區之間的交集。

比重法:

比重法是根據平滑密度函數原理,將源區的統計數據從同質性改變成非同質性,然後進行區域插值。更符合實際。

四.由數字化高程模型提取區域信息

1、局部平均高程計算

2、坡度計算:高度的變化率

地表面任一點的坡度是指過該點的切平面與水平地面的夾角。

3.坡向:區域方向,即變化比率最大的方向。

定義:地表面上一點的切平面的法線矢量在水平面的投影與該點的正北方向的夾角。從擬合平面的法線在水平面上的投影方位角確定,然後將方向角進行分級,分成8個區域,合併成陽坡、陰坡、半陽、半陰四個區域。

4、地形起伏度

地形起伏度是指在一個特定的區域內,最高點海拔高度與最低點海拔高度的差值,它是描述一個區域地形的宏觀性指標。

5、地面粗糙度

地面粗糙度是指在一個特定的區域內,地球表面積與其投影面積之比,它是反映地表形態的一個宏觀指標。

6、谷點和脊點計算

谷點和脊點是地面形態的重要特徵,在地面分析中具有重要意義。谷點是地勢的最低點,地勢的相對最低點集合為谷;脊點是地勢的最高點,地勢的相對最高點的集合為脊。

三維表達:

1、透視表達法 2、陰影表達法

(一)透視表達法

利用二維矩陣的數字化高程模型數據,根據柵格點高程進行透視變換,使用縱橫的透視網格線產生人們的立體視覺。

(二)陰影表達法

利用人們對物體陰陽面反差的視覺感應會產生立體的視覺映射。

1975年Pong提出計算機繪圖的照度模型,地表某一點的照度是由地表的鏡面反射、漫反射及環境空間綜合影響三個因子的線性組合。鏡面反射影響,環境空間影響是個常數,只考慮地表漫反射的影響。

朗伯特法則:

其中,I—反射光強;I0 —入射光強;K —常數; θ—入射角

cosθ=N·L

N:---地表特徵的組合向量

L---太陽光源方向的組合向量

太陽方位角:太陽光線在地平面上的投影與當地子午線的夾角,可近似看作豎立在地面上的直線在陽光下的陰影與正南方的夾角。

太陽高度角:從太陽中心直射到當地的光線與當地水平面的夾角。

計算機演算法:

(1)確定太陽高度角和方位角。可估計或查天文年曆;

(2)調入數字化高程模型數據(二維矩陣數據);

(3)設置8鄰域窗口;

(4)提取窗口內南北和東西兩個方向上的坡度(δz/δy和δz/δx)。

(5)按反射光強度模型計算出各求值點的反射光強度的相對值。

(6)把個點的反射光強度值轉換成灰度值,進行計算機繪圖。

元數據是用來描述該數據集的基本特徵和總體內容的數據信息,由4個層次構成:

1)元數據元素:說明地理空間數據某一個方面的特徵,相當於欄位

2)元數據實體:一個或若干個元數據元素組成元數據實體

3)複合實體:由元數據實體、元數據元素和(或)其他複合實體構成

4)元數據子集:有若干元素、實體或複合實體組成的集合。

空間區域框架:就是按區域儲存和表達空間信息的一套規則。

1、分為:自然區域框架,行政區域框架,自然-行政綜合區域框架,和地理網格區域框架。

2、地形圖都是以地理網格區域框架作為儲存和表達空間數據的基礎。一般的專題圖或以所研究的自然區域,或行政區域,或以自然-行政綜合區域框架為基礎。

圖層概念:計算機內二維陣列中的每個單元僅能容納一個數值,為表達不同的地圖數據,必須被分離成不同的二維陣列來儲存,每個儲存層及儲存的數據被稱為圖層 。

圖層結構:不同的圖層組織在一起形成了圖層結構。

資料庫概念: 一個資料庫就是有關事物及其它們彼此之間關係的信息集合,這些信息的集合是按一定的數據模型和邏輯結構被儲存一個或多個適合於計算機的數據文件之中。

計算機對數據的管理

經歷的三個發展階段:

1、程序管理階段:

2、文件管理方式:順序、隨機、索引、倒排文件等

3、資料庫管理系統:層次模型、網狀模型和關係模型等

GIS空間資料庫組織與管理

1)混合式結構

(1)地圖數據(空間數據)採用文件處理方式,應用程序知道每個數據文件的數據結構。

(2)屬性數據採用資料庫管理方式(DBMS),如dbase,foxbase,Oracle等。

(3)圖形數據與屬性數據的連接根據屬性表中的唯一公共標識來連接。

2)一體化空間資料庫

ArcGIS 中的SDE集成方式體現了使用一體化的空間資料庫的結構。

SDE擴展了傳統的關係資料庫只存儲和管理屬性數據的模式,允許把空間數據加入到關係資料庫,提供地理要素的空間位置幾何形狀等信息。

空間數據質量

誤差來源:數據收集、數據錄入、數據存儲、數據處理、數據輸出、數據應用。

質量控制:準確度、精度、不確定性、相容性、一致性、完整性、可得性、現勢性。

準確度:與真值的接近程度;

精度:對象表達的詳細程度

不確定性:不能精確描述的對象

相容性:兩個來源數據在同一應用中的難易程度

一致性:同類現象表達的一致性

完整性:數據的完整性

可得性:數據獲取的容易程度

現勢性:數據反映對象目前的程度

現勢性:數據反映對象目前的程度

由拓撲向量數據結構向網格數據結構變換

要點:

①確定柵格元素的大小,即解析度。如地形起伏大應用高解析度

②瞭解矢量數據和柵格數據的坐標。如矢量數據的坐標是直角坐標系,原點在圖的左下方,柵格數據坐標是行列坐標,原點在圖左上方,轉換時,一般使直角坐標系的x,y軸與柵格數據行列平行

③轉換公式:

△X=(Xmax-Xmin) / J

△Y=(ymax-ymin) / I

其中:xmax xmin ymax ymin 表示矢量坐標中x,y的最大值,最小值。

I,J表示柵格的行數和列數△x△y表示每個柵格單元的邊長

基本要素的轉換

(1)點的轉換

行 i=1+Integer[(ymax-y)/△y]

列 j=1+Integer[(x-xmin)/△x]

Integer---取整

i,j---行,列值

(2)線的轉換

線的轉換實質是完成相鄰兩點間直線的轉換。

設直線AB端點坐標為A(x1,y1),B(x2,y2)則需把A,B兩點矢量坐標轉換成柵格數據,同時求出直線AB經過的中間柵格數據。

1 利用點轉換法,將A,B轉換成柵格數據,求出行列值

2 由上述行列值求出直線所在行列範圍3 確定直線經過的中間柵格點

步驟:求出直線經過的起始行號為i1,終止行號為im,則中間行號為i2,i3……im-1。現在要求相應行號相交於直線的列號

1)求相應i行中心處同直線相交的y值y=ymax-△y(i-1/2)

2)用直線方程求y值對應的x值X=(x2-x1)(y-y1)/(y2-y1)+x1

3)由x,y值求相應i行的列值j

J=1+Integer[(x-xmin)/△x]

如此不斷求直線經過的各行的列值,完成轉換。

例:已知某矢量坐標系,坐標原點為O(0,0),X坐標的最大值為150,Y坐標的最大值為300,其中有兩點P1和P2,坐標分別為P1(51,100)、P2(53,103)試將P1、P2所連成的直線轉為柵格坐標,柵格坐標系的解析度為300 行×150列 。

△X=(Xmax-Xmin) / J =1

△Y=(ymax-ymin) / I =1

P1點的行列值:i=1+Integer(300-100)/1=201;j=1+Integer(51-0)/1=52

P2點的行列值:i=1+Integer(300-103)/1=198;j=1+Integer(53-0)/1=54

直線經過的行範圍:198-201

199行中心處同直線相交的y值:y=300-199*1+1/2=101.5

該行y值對應的x值:x=(53-51)(101.5-100)/(103-100)+51=52

x坐標對應的柵格列值為:j=1+Integer(52-0)/1=53

200行中心處同直線相交的y值:y=300-200*1+1/2=100.5

該行y值對應的x值:x=(53-51)(100.5-100)/(103-100)+51=51.3

x坐標對應的柵格列值為:j=1+Integer(51.3-0)/1=52

P1、P2所連成的直線的柵格坐標為(201,52),(200,52),(199,53),(198,54)

(3)區域填充:射線法,邊界點跟蹤法,邊界代數法,種子法

空間數據配準概念:是對空間數據進行幾何變換,把地面坐標分配給地圖數據進行地理編碼,或對空間數據層(圖層結構)之間進行空間位置的精確配準,以便使它們能夠在空間分析時進行疊加操作。

過程:把不同的數據層配準到一個共同的坐標系統中,或配準到標準的數據層。

分類:共面變換和非共面變換


推薦閱讀:
相關文章