

空間信息分析技術(shù)
- 期刊名字:地理研究
- 文件大?。?12kb
- 論文作者:王勁峰,武繼磊,孫英君,李連發(fā),孟斌
- 作者單位:中國科學(xué)院地理科學(xué)與資源研究所
- 更新時(shí)間:2020-09-25
- 下載次數:次
第24卷第3期地究Vol. 24, No. 32005年5月GEOGRAPHICAL RESEARCHMay, 2005空間信息分析技術(shù)王勁峰,武繼磊,孫英君,李連發(fā),孟斌(中國科學(xué)院地理科學(xué)與資源研究所,北京100101)摘要:在GIS技術(shù)日趨成熟和空間數據極大豐富的今天,通過(guò)分析空間數據探索空間過(guò)程機理正變得日益迫切??臻g信息分析技術(shù)至少包括以下六個(gè)主要方面: (1)空間數據獲取和預處理; (2) 屬性數據空間化和空間尺度轉換; (3) 空間信息探索分析; (4) 地統計; (5) 格數據分析; (6) 復雜信息反演和預報。本文提出了解決具體應用問(wèn)題一般的空間數據分析計算、結果解釋和反饋程序。認為空間過(guò)程的一般共性和作為共同的研究對象,各種不同的方法技術(shù)最終可能導致空間數學(xué)(spatial mathematics)的產(chǎn)生,同時(shí)發(fā)展魯棒的空間分析軟件包對于普及空間數學(xué)是必要的。關(guān)鍵詞: GIS;空間信息;空間過(guò)程;空間分析;機理解釋文章編號: 1000-0585(2005)03-0464-091引言隨著(zhù)對地觀(guān)測、社會(huì )經(jīng)濟調查、計算機網(wǎng)絡(luò )和格網(wǎng)信息處理能力的迅速提高,空間數據正在以指數方式急速增加。通用和專(zhuān)用的(時(shí))空間數據結構1、應用于具體事物的管理信息系統、以及對這些海量空間數據進(jìn)行深加工以獲得高附加值的信息產(chǎn)品的空間信息分析技術(shù)[2]成為空間信息三大領(lǐng)域。數據分析通常用統計學(xué)方法,當今流行軟件包SPSS、MATLAB 等大大地促進(jìn)了數據分析深加工及其在各領(lǐng)域的應用(徐建華,2002)。但是,空間數據通常具有非獨立性,這與經(jīng)典統計學(xué)基本假設相駁。因此,專(zhuān)門(mén)的空間信息分析理論和技術(shù)正在迅速發(fā)展[3~5],已在遙感、生態(tài)環(huán)境、地球科學(xué)、社會(huì )經(jīng)濟等領(lǐng)域得到諸多成功的應用,展現出廣闊的應用潛力。2研究動(dòng)態(tài)統計分析是常規數據分析的主要手段。然而,傳統統計學(xué)在分析空間數據時(shí)存在致命的缺陷,這種缺陷是由空間數據的本質(zhì)特征和傳統的統計學(xué)方法的基本假設共同造成的。傳統的統計學(xué)方法是建立在樣本獨立與大樣本兩個(gè)基本假設之上的,對于空間數據,這兩個(gè)基本假設前提通常都得不到滿(mǎn)足??臻g上分布的對象與事件在空間上的相互依賴(lài)性是普遍存在的,這使大部分空間數據樣本間不獨立,即不滿(mǎn)足傳統統計分析的樣本獨立性前提,因而不適于進(jìn)行經(jīng)典統計分析[°];另一方面,有些空間數據采樣困難,如某些氣象臺站分布在稀疏的山區,導致樣本點(diǎn)太少而不能滿(mǎn)足傳統統計分析方法大樣本的前提;地學(xué)中國煤化工收稿日期: 2004-10-16; 修訂日期: 2005-01-28YHCNMHG基金項目:國家自然科學(xué)基金課題(4071111)、 863 項目(2002AA135230-1) 和973項目(2001CB5103) 支持。作者簡(jiǎn)介:王勁峰(1965-), 上海市人,研究員,博士生導師。主要從事地球信息科學(xué)研究。Email: wangjf@igsnrr. ac. cn3期王勁峰等:空間信息分析技術(shù)465空間數據通常的不可重復性進(jìn)--步造成了空間數據分析的特殊性。因此,專(zhuān)門(mén)的空間信息分析理論、方法和技術(shù)自20世紀60年代末開(kāi)始得到認識并研究??臻g數據大體.上可分為空間離散或連續型數據(可互相轉化),以及多邊形數據兩大.類(lèi)。自然科學(xué)多涉及前者,而社會(huì )經(jīng)濟科學(xué)多涉及后者。隨著(zhù)人地一體化研究趨勢的發(fā)展,對兩類(lèi)數據進(jìn)行綜合分析的趨勢日益顯露。目前空間數據分析軟件包已有不少,主要來(lái)自?xún)纱髮W(xué)科領(lǐng)域:地理學(xué)和地質(zhì)學(xué)。由于地理學(xué)和地質(zhì)學(xué)研究對象不同,所涉及的數據特點(diǎn)和分析方法不同,造成兩大流派在軟件功能、結構、風(fēng)格上的不同。在歐美,60年代經(jīng)歷了地理學(xué)計量革命,其主流是試圖將社會(huì )經(jīng)濟時(shí)空格局和過(guò)程數學(xué)公式化。在GIS趨于成熟和空間數據迅速膨脹的技術(shù)條件下,當時(shí)的學(xué)者成為現今地理信息科學(xué)的主要推動(dòng)者,造成地理學(xué)者所研發(fā)的空間信息分析軟件包多帶有處理多邊形數據(社會(huì )經(jīng)濟統計單元,遙感像元數據亦屬此類(lèi))的特點(diǎn)。相反,源于地質(zhì)學(xué)的空間分析軟件包一般適用于分析離散和連續的數據??臻g信息分析理論和技術(shù)較為復雜,對于一般科研人員而言掌握難度大,耗費精力多。為此,美英兩國都已建立了相應的國家級研發(fā)計劃,更有甚者,全球銷(xiāo)量最大的GIS基礎軟件的研發(fā)者美國環(huán)境系統研究所在A(yíng)RCGIS8.1及以上版本已集成了地統計學(xué)模塊刀,目前正在積極爭取集成美國國家基僉會(huì )資助完成的Lattice數據分析模塊,該功能可以被幾乎所有從事地理信息管理的用戶(hù)所使用,進(jìn)行空間信息的分析和深加工。3技術(shù)體系空間信息分析包括數據獲取和預處理(模塊M1);當進(jìn)行多源異構數據綜合分析時(shí),需要進(jìn)行屬性數據空間化和尺度轉換處理(模塊M2);然后進(jìn)行空間數據探索分析(模塊M3);之后根據屬性數據的空間存在格式(空間連續分布或離散分布、規則或不規則多邊形分布、多源復雜異構信息),分別引導建立地統計模型(模塊M4)、格數據分析模型(模塊M5)、復雜信息分解和預報模型(模塊M6)、以及其他(見(jiàn)圖1)。M1至M3屬數據預處理范疇,M4至M6屬問(wèn)題建模范疇,對建立的模型M4- M6 需要求解,機理解釋及預報。圖中各模塊可獨立或聯(lián)合運行,這取決于所研究的問(wèn)題和對象(所需輸出),以及研究人員當前所處的分析階段(輸人)。 具體研究?jì)热萑缦?模塊1.空間數據獲取和預處理空間數據采集與盡可能完備化是所有工作重要的第一一步,主要利用采樣、插值、缺值方法。(1)空間信息抽樣估計在地學(xué)空間應用領(lǐng)域, 如環(huán)境監測、資源調查、社會(huì )統計等,空間信息抽樣估計問(wèn)題大量存在(8.9]??臻g抽樣針對地學(xué)對象普遍存在的空間關(guān)聯(lián)性和先驗信息,從樣本選取方式、空間關(guān)聯(lián)性及精度衡量三方面對空間信息獲取提供符合統計假設的新的解決思路。全國耕地面積動(dòng)態(tài)調查,原先窮盡總體的方法.中國煤化工既耗時(shí)又花費巨大,報告形成緩慢;而采用Sandwich空間采樣模MHCNMHG信息并輔以少量樣本,就可以同時(shí)形成全國2700多個(gè)縣的分縣報告,既節省大量時(shí)間和開(kāi)支又能滿(mǎn)足精度要求。在此基礎之上建立空間抽樣優(yōu)化決策通用集成模型,解決地學(xué)分析及資源調查466地理研究24卷M1空間數據獲取和預處理:多源異構數據空間覆蓋、采樣,插值.缺值處M3空間數據探索分析M2屬性數據空間(數據性質(zhì)認知→建模引導)化和空間尺度轉換|為數據提出模型類(lèi)型:建|M4地統計(空間離散、連續)模|M5格分析模型( 多邊形、格網(wǎng))M6多源復雜信息自適應模型其他:如空間數據挖掘等選擇參數估計方法選擇數值方法以完成參數估計細化或調整模型|求|解個(gè)診斷統計:殘差和敏感分析評價(jià)擬合度和預報能力擬合/預報是否可接受?是否|機解釋報合,分析、模擬、預報圖1空間數據分 析技術(shù)和計算程序Fig. 1 Spatial data analysis techniques and algorithm中空間抽樣問(wèn)題。軟件實(shí)現上,基于Microsoft Windows 平臺,Visual 系列軟件組件對象方法系統集成11。(2)空間數據插值與缺值根據已 知空間樣本點(diǎn)(例如氣象臺站、野外調查)數據進(jìn)行插值12.18]或推理[4J]來(lái)生成面狀數據或估計未測點(diǎn)數值是地學(xué)研究經(jīng)常遇到的問(wèn)題。理解初始假設和使用的方法是空間插值過(guò)程的一一個(gè)關(guān)鍵,為不同空間過(guò)程選擇不同插值方法[15.16]。缺值問(wèn)題與插值類(lèi)似,有部分交叉,以Bayes先驗概率為其特征。插值有點(diǎn)、面之分,對于面插值,經(jīng)過(guò)預處理(如去除趨勢特征等)可以進(jìn)行缺值分析;對于點(diǎn)插值,經(jīng)過(guò)預處理(如構建泰森多邊形再去除趨勢特征等)也可以使用缺值方法。對于缺值的補整,如果具備某些時(shí)空特征,則完全可以使用插值中國煤化工模塊2.屬性數據空間化與空間轉換fYHCNMHG自然與人文要素結合研究的時(shí)代正在到來(lái)。美國宇航局(NASA)將地表人類(lèi)活動(dòng)模式加入全球變化模型中從本質(zhì)上提高了預報精度。又如,自然災害的災情空間預報需要自3期王勁峰等:空間信息分析技術(shù)467然要素和社會(huì )經(jīng)濟要素相互作用的計算,自然要素可以通過(guò)遙感獲取,社經(jīng)要素需要根據統計數據進(jìn)行空間細化。地球生態(tài)環(huán)境以及社會(huì )經(jīng)濟數據通常是具有不同形狀和尺度的地理空間單元,需要建立屬性數據空間化及空間尺度轉換技術(shù),其核心是非空間信息或更大空間單元的屬性數據在(較小)空間上表達的理論和方法,或稱(chēng)可變面元問(wèn)題(Modifia-ble areal unit problem) (MAUP),包括三類(lèi)技術(shù):GIS方法。實(shí)現地理空間單元間屬性數據的轉化,包括聚集、拆分和空間建模(Spa-tial modeling)。聚集主要解決從小區域(點(diǎn))向大區域(面)轉化問(wèn)題;拆分則考慮從大區域向小區域轉化問(wèn)題。前者可利用空間采樣技術(shù)實(shí)現。尺度轉化理論及方法。不同的時(shí)間和空間尺度限制了信息被觀(guān)測、描述、分析和表達的詳細程度。尺度轉化存在“自上而下scaling down”和“自下而上scaling up”兩種基本方式。不同尺度水平上,尤其是Downscaling的轉化,存在其區域邊界規則與地理邊界規則的差異、數據轉化的控制和實(shí)施形式。小區域統計學(xué)理論及方法。所謂“小區域”,本質(zhì)上是指區域內樣本點(diǎn)較少,因此在統計分析過(guò)程中,需要從相關(guān)區域“借力”來(lái)獲得詳細的信息,其核心是建立相關(guān)區域(數據)的聯(lián)系模型,實(shí)現屬性數據空間表達。以上內容著(zhù)眼點(diǎn)有所不同,但都可歸結為屬性數據從大區域向小區域轉化,最終完成綜合的屬性數據空間化方法和軟件包設計與實(shí)現,并對表達結果的精確性和不確定性做定量分析和解釋。模塊3.空間信息探索分析探索數據分析(Exploratory Data Analysis, EDA)目標是最大化分析者對數據集及其隱含結構的洞察,揭示數據屬性,用以引導選擇合適的數據分析模型。EDA主要采用圖形技術(shù)進(jìn)行以下分析: (1)最大化對數據集的洞察; (2) 揭示數據隱含的結構; (3)提取重要的變量; (4) 檢測異常點(diǎn); (5) 檢驗隱含的假設條件; (6) 發(fā)展精簡(jiǎn)的模型; (7)決定因素的最優(yōu)設置??臻g數據探索分析(Exploratory Spatial Data Analysis, ESDA) 是EDA的擴展,用來(lái)對具有空間定位信息的屬性進(jìn)行分析,包括:探索數據的空間模式[7],對假設數據模型、模型基礎和數據的地理性質(zhì)進(jìn)行闡述,評價(jià)空間模型等。ESDA 技術(shù)同樣要求可視和健壯,強調把數字和圖形技術(shù)與地圖聯(lián)系。對“某些事件在地圖上的什么位置”[18,19]、“這部分地圖的屬性值在概括統計中處于什么位置”、“地圖的哪些區域滿(mǎn)足特定的屬性要求”等問(wèn)題的回答是很重要的。本模塊具體內容包括:探索工具。軟件實(shí)現當前已經(jīng)有ESDA技術(shù),并且實(shí)現表(Table)、 地圖(Map) 和圖形(Figure) 各窗口鏈接,支持同時(shí)打開(kāi)四個(gè)窗口:數據表窗口(顯示 當前數據和在過(guò)程中創(chuàng )建的變量),地圖窗口,圖形窗口和文本輸出窗口(返回ESDA輸出)。區劃(regionalization)。 空間單元有時(shí)很小,比如一個(gè)村或鄉鎮,如果以此進(jìn)行自然災害發(fā)生率或疾病發(fā)生率等小概率事件,統計對這種小的統計單元很敏感。由于空間信息分析要求各空間單元內的信息變差具有相對--致性,因此,經(jīng)常需要對空間單元的大小進(jìn)行調整,通過(guò)模型計算,實(shí)現統計單元的均質(zhì)性中國煤化工(eguality)和空間緊湊性(compactness)。YHCNMHG模塊4.地統計模塊點(diǎn)狀數據或空間連續分布數據(直接獲得或由點(diǎn)狀數據通過(guò)空間插值或趨勢面模擬獲468地理研究24卷得)是空間數據的一-種主要存在形式(例如氣象臺站、地質(zhì)物探、生態(tài)環(huán)境等數據)[0。主要包括以下幾方面:變異函數(variogram)。 變異函數可以說(shuō)是整個(gè)地統計學(xué)的基礎,但以前人們只注重了點(diǎn)的變異函數。隨著(zhù)尺度問(wèn)題的提出,變異函數的正則化( regulization)問(wèn)題提上了日程??死锔穹椒?Kriging)。 以往把Kriging法看成是地統計學(xué)的全部。通過(guò)它人們找到了一種最優(yōu)的、無(wú)偏的估值方法。長(cháng)期以來(lái),人們僅僅把它看作是一種插值方法。其實(shí)不僅僅如此,Kriging還可以給出每一點(diǎn)的不確定性、利用多種附屬信息填補采樣不足的缺陷等。模擬方法(Simulation)。 這是當今地統計領(lǐng)域中最為活躍的一種方法。由于Kriging方法具有平滑作用,即將極大值偏小估計、極小值偏大估計,使得整幅圖像趨于平緩。但有時(shí)人們需要的恰恰正是那種極值,例如在水污染中,就是要通過(guò)污染金屬所表現的極值來(lái)發(fā)現污染源。此外,Simulation通過(guò)多種實(shí)現(realization) 系統的表現,研究問(wèn)題的各種情況,具有較好的統計效用。模塊5.格數據分析模塊多邊形數據(杜 會(huì )經(jīng)濟統計數據格式),包括規則格網(wǎng)數據(遙感), 是空間數據的又-種主要存在形式。通過(guò)空間自相關(guān)和協(xié)相關(guān)模型,找出研究對象在空間布局上的聯(lián)系與差異,以及空間多元解釋變量。例如土地利用變化的環(huán)境和人文經(jīng)濟驅動(dòng)因子識別,環(huán)境污染的空間動(dòng)態(tài)建模,為預報和調控提供科學(xué)依據??臻g局域統計分析技術(shù),則可找出空間熱點(diǎn)(hotspots)問(wèn)題區,應用于疾病、犯罪等空間格局的熱點(diǎn)診斷和預報??臻g回歸模型??臻g回歸分析技術(shù)可以用于探討估計值的空間關(guān)系,地學(xué)對象的空間依賴(lài)性和空間異質(zhì)性使一般回歸方法不適應在空間上的分析??臻g回歸分析有三種特殊形式: (1)聯(lián)立自回歸模型(Simultaneous Autoregressive Model, SAR); (2)空間移動(dòng)平均模型(Spatial Moving Average Model, SMA); (3)條件自回歸模型(Conditional Au-toregressive Model, CAR)。局域統計模型。局域統計分析模型對研究區域內距某一目標單元一定距離的空間范圍內所有點(diǎn)的值進(jìn)行分析。計算指定距離內的空間關(guān)聯(lián)度,從而監測空間內的熱點(diǎn)區域,并通過(guò)G;檢驗。模塊6.多源復雜時(shí)空信息的分解、融合、預報模塊環(huán)境、地學(xué)、社會(huì )、經(jīng)濟、交通、疾病、遙感監測等時(shí)空信息大多是多源復雜因素綜合作用的結果。通過(guò)觀(guān)測信息反演地學(xué)過(guò)程機理是地球科學(xué),特別是地球空間信息科學(xué)的基本任務(wù)之一,目前可用的數學(xué)方法有統計[21]、神經(jīng)網(wǎng)絡(luò )、小波分析、遺傳算法、元胞自動(dòng)機22?等,也是目前數據挖掘的基本手段。但這些方法只能進(jìn)行單一成因要素(團)提取和簡(jiǎn)單過(guò)程預報,要實(shí)現基于時(shí)空信息復合過(guò)程的科學(xué)預報,不僅需要實(shí)現多源復雜因子的分解,更需要將多種分解模式重新組構融合,形成一個(gè)新的整體模式。另外,氣象臺站、生態(tài)網(wǎng)絡(luò )、污染監測、野外采樣、社會(huì )經(jīng)濟調查等等,均是空間分散的點(diǎn)狀數據。根據已知點(diǎn)的值推斷未知點(diǎn)的值,中國煤化工雙域狀況是地學(xué).研究的經(jīng)常性任務(wù)。目前使用的是空間幾何插值、MHCNMHG印新近的考慮全局和局域關(guān)聯(lián)信息的空間統計方法。實(shí)際上,前人的研究已經(jīng)獲得了很多半結構化的地學(xué)機理和規律,這些先驗信息與空間統計的結合有望從本質(zhì)上提高空間估計預報的精度。借3期王勁峰等:空間信息分析技術(shù)469助貝葉斯方法建立統計和機理結合的空間擴展模型是一種可能的新途徑??偠灾?,空間信息分析是指對地球空間信息進(jìn)行分析模擬和預測,以及根據空間信息進(jìn)行時(shí)空運籌的技術(shù)、方法和理論。下表給出了從輸人輸出角度理解什么是空間信息分析模型及其舉例。表1空間信息分析模型的輸入和輸出Tab. 1 Input and output of spatial information analysis model輸出信息屬性舉例空間非空間空間采樣模型熱點(diǎn)探測、插值(Upscaling)輸人信息屬性屬性數據空間化經(jīng)典統計學(xué)(Downscaling)4若干創(chuàng )新和前沿(1)空間抽樣模型目前空間抽樣模型是針對空間連續分布對象(如坡面降水)提出的,對于如大區域耕地問(wèn)題等空間離散分布地物調查,缺乏專(zhuān)門(mén)的離散空間抽樣模型,雖然可以借助面積成數進(jìn)行換算;另外,對小樣本問(wèn)題、流動(dòng)地物(海洋)、多維地物(降雨、溫度、土壤含水量等多要素)聯(lián)合調查和動(dòng)態(tài)空間(植被變化)采樣問(wèn)題需要發(fā)展相應的空間抽樣模型。(2)屬性數據空間化屬性數據空間化的系統研究在國際上剛剛開(kāi)始,有影響的研究成果較少,主要限于GIS的空間分析、尺度變化研究領(lǐng)域。小區域統計學(xué)與GIS的結合最近開(kāi)始得到廣泛的關(guān)注。(3)空間尺度轉換Statistical Downscaling基于不同尺度空間變量的統計關(guān)系來(lái)建立,在全球環(huán)流模型(GCM) 中有廣泛應用。該方法假定變量之間的統計關(guān)系不隨尺度變化而改變。Dynamical Downscaling也集中在GCMs領(lǐng)域。因研究對象不同,需要分別設計模型,在社會(huì )經(jīng)濟數據方面研究則較少。(4)隨機模擬除Kriging法外,現在的地統計學(xué)還可以作為評估未知值不確定性的工具,這主要通過(guò)模擬來(lái)完成。即通過(guò)條件模擬產(chǎn)生多幅模擬圖象用以再現空間依賴(lài)的分布格局等統計特性。模擬圖像是地統計學(xué)領(lǐng)域中最具潛力的領(lǐng)域。(5)格數據模型遙 感和社會(huì )經(jīng)濟屬性信息均以規則和不規則多邊形為其載體。隨著(zhù)計算技術(shù)迅速發(fā)展起來(lái)的格數據分析技術(shù)(Latticedataanalysis)23.24),在美國國家基金支持下,自1999年開(kāi)始也設立了五年的研究計劃,由Sergio Rey和Luc Anselin 牽頭,其核心就是空間計量經(jīng)濟學(xué)模型分析軟件包的構建,在該研究計劃中,設定了軟件包開(kāi)發(fā)計劃,同ESRI公司合作,開(kāi)發(fā)成熟的、具有友好用戶(hù)界面的商業(yè)化空間統計與空間分析軟件包。(6)復合信息模型我們經(jīng)常希望從得到的空聞信息后演地學(xué)過(guò)程的各種影響因子,例如遙感影像的像元值經(jīng)常是地表混合物體以及地H中國煤化工E綜合作用的結.果;全球氣候變暖受自然和人文因子的雙重作用,享CNM!G訂科學(xué)的環(huán)境政策至關(guān)重要;生態(tài)環(huán)境的空間動(dòng)態(tài)變化受溫度、降水、人類(lèi)活動(dòng)空間格局變化的多重影響,準確分解之將有助于對生態(tài)環(huán)境空間動(dòng)態(tài)進(jìn)行預報。470地理研究24卷功率譜和小波可以分解出不同尺度的結構特征;多元回歸通常是全局性的;神經(jīng)網(wǎng)絡(luò )對于短記憶非線(xiàn)性較為有效;遺傳規劃可以對多個(gè)給定模式進(jìn)行優(yōu)化組合。但是,空間數據經(jīng)常受多種因子影響,在缺少對其生成機理了解之前,不應人為地套用某個(gè)單一模式,各種信息都可能隱含在其中,應該建立多模式融合模型,讓數據自己說(shuō)話(huà)。5應用領(lǐng)域舉例(1)災情損失快速準確評估 重大災情快速評估涉及受災地區自然和社會(huì )經(jīng)濟情況的綜合信息[25]。遙感等技術(shù)為獲得受災地區的致災因子信息提供了有效的途徑,但社會(huì )經(jīng)濟統計數據更新周期較長(cháng),不能滿(mǎn)足實(shí)時(shí)需要,并且是以行政單元為存在形式,與災害的地域單元不--致。屬性數據空間化技術(shù)與抽樣技術(shù)結合有望彌補當前災情評估中社會(huì )經(jīng)濟數據難以快速和準確獲得的缺陷,為災情損失評估提供技術(shù)保障。(2)人類(lèi)健康和疾病研究領(lǐng)域通過(guò)遙感和地理信息系統手段對截面數據如疾病分布、空間擴散[26]、時(shí)空演變[C27] 與自然和經(jīng)濟環(huán)境狀況的分布進(jìn)行分析。公眾的健康問(wèn)題很大程度與當地的環(huán)境因素有關(guān),對于某些關(guān)鍵的疾病以及醫療設施的分布研究也可通過(guò)空間數據的分析和處理進(jìn)行。社會(huì )學(xué)家、經(jīng)濟學(xué)家、人類(lèi)學(xué)家以及環(huán)境工作者也將公眾健康安全與有毒廢物、低收入人口乃至少數人種分布聯(lián)系起來(lái)。(3) 公共安全領(lǐng)域犯罪發(fā)生率的分析,開(kāi)始應用空間統計與分析手段,例如,根據美國的犯罪數據分析,盜竊、搶劫以及其他類(lèi)別的暴力犯罪與當地的城市中低收入、高失業(yè)率以及人群混雜的區域高度相關(guān)。利用空間統計和空間分析等手段,可以對犯罪率高發(fā)區集中控制以及進(jìn)行社會(huì )經(jīng)濟調節,維護公共安全。(4)其他統計分析在氣候變化、 環(huán)境退化、區域可持續發(fā)展、人類(lèi)活動(dòng)與環(huán)境及氣候變化的關(guān)系研究、社會(huì )經(jīng)濟空間格局動(dòng)態(tài)變化[8、城市擴張、商業(yè)、遷移、旅游、交通和通訊網(wǎng)絡(luò )分析中廣泛的應用,空間分析技術(shù)有望挖掘更多的信息和知識。由于空間信息分析技術(shù)的復雜性,實(shí)際運用基本限于商業(yè)軟件所提供的功能,因此適應于各種實(shí)際問(wèn)題的空間信息分析理論和軟件的研發(fā)是受歡迎的,例如SpaceStat,GesLib, CrimeStat,和由國家863計劃支持于2004年完成的國產(chǎn)空間分析軟件包原型Simple0. 1[29]。6結論和討論空間信息來(lái)源于地球科學(xué)、社會(huì )經(jīng)濟、生命科學(xué)、資源和能源、軍事等等廣泛領(lǐng)域,亦是認識和調控這些系統的基本根據。數據分析的理論是概率論、數理統計和數學(xué),但是由于空間過(guò)程廣泛存在的相互關(guān)聯(lián)性以及空間信息在空間上特有的多種存在形式與已有經(jīng)典數學(xué)的假設條件常常產(chǎn)生矛盾,或者在理論上沒(méi)有被后者覆蓋,因此產(chǎn)生了專(zhuān)門(mén)用于空間信息分析的理論研究[30]。當今空間信息分析技術(shù)至少包括以下六個(gè)主要方面: (1)空間數據獲取和預處理; (2) 屬性數據空間化和空間尺度轉換; (3) 空間信息探索分析;(4)地統計; (5) 格數據分析; (6) 復雜信息反演和預報模塊應用需求、計算技術(shù)進(jìn)步、空間數據激增、學(xué)科交叉是空間信息分析技術(shù)中國煤化工空間信息分析技術(shù)的目的是建立研究對象的(統計)數學(xué)模型、且MHCNMHG數據挖掘或者機器學(xué)習技術(shù)首先產(chǎn)生于計算機科學(xué)和生物信息分析81],以概率統計為理論根據,迅速被地球信息分析所借鑒,發(fā)展出來(lái)的生物信息科學(xué)和地球信息科學(xué)在數3期王勁峰等:空間信息分析技術(shù)471學(xué)方法上大體有70%的重合,雖然研究對象完全不同。數據挖掘技術(shù)的目的是通過(guò)信息發(fā)現研究對象的知識、規則、關(guān)聯(lián)和模式。當空間過(guò)程的機理比較清楚,并且可以據此建立數學(xué)模型時(shí),例如大氣環(huán)流模式、海洋物理場(chǎng)、地球動(dòng)力學(xué)等,統計類(lèi)理論就降低到次要地位。但是由于真實(shí)世界的復雜性和或多或少的不確定性,需要確定性的數學(xué)模型和不確定性的統計模型的結合。確定性數學(xué)模型、空間信息分析技術(shù)和數據挖掘技術(shù)是分析空間過(guò)程的三種不同的手段。對于傳染病時(shí)空過(guò)程建模,既可以用確定性的微分方程,也可以用不確定的隨機過(guò)程,當后者取極限時(shí)將逼近前者,達到形式統一;空間信息分析技術(shù)用于識別傳染病傳播的影響因子,而數據挖掘技術(shù)被用于反演傳染病參數。三種方法靈活使用,互相補充,可以揭示空間過(guò)程的多方面特征。雖然出發(fā)點(diǎn)不同,但是研究對象都是空間過(guò)程,所以空間過(guò)程數學(xué)模型、空間信息分析技術(shù)和數據挖掘技術(shù)等發(fā)展最終融合形成統一的空間數學(xué)(spatial mathematics)是有可能的。Matlab, SAS, Spss等軟件包的開(kāi)發(fā)大大推動(dòng)了數學(xué)在各領(lǐng)域的廣泛應用,空間信息分析技術(shù)的廣泛使用亦需要開(kāi)發(fā)空間分析軟件包。參考文獻:[1] Buliung R, Kanaroglou P. On design and implementation of an object -relational spatial database for activity/ travelbehavior research. Journal of Geographical System, 2004, 6;237~262.[2] 王勁峰,李連發(fā),葛詠,等.地理信息空間分析的理論體系. 地理學(xué)報,2000, 55(1); 92~ 103[ 3 ] Fischer Manfred , Getis Arthur. Recent Developments in Spatial Analysis. Berlin; Springer, 1997.[4]Haining Robert. Spatial Data Analysis, Theory and Practice. Cambridge University Press, 2003.[5] Anselin Luc. Spatial Econometrics: Methods and Models. Dordrecht: Kuwer Academic, 1988[6] 柏延臣,李新,馮學(xué)智??臻g數據分析與空間模型.地理研究,1999, 18(2): 185~190.[7]ESRI, http://www. esri. com/ software/ arcgis/extensions/ geostatistical/ index html[8]梁進(jìn)社, 張華.土地利用變化遙感監測精度評價(jià)系統--以隨機抽樣 為基礎的方法.地理研究,2004,23(1):29~ 37.[9] 鄭袁明,陳同斌.“北京市土壤和蔬菜重金屬污染與風(fēng)險評價(jià)”取得重要進(jìn)展. 地理研究, 2004, 23(5): 455.[10] Wang J,Liu J,Zhuang D,et al. Spatial sampling design for monitoring cultivated land. International Journal of Re-mote Sensing, 2002,23(2): 263~284.[11]李連 發(fā),王勁峰,劉紀遠。國土澠感調查的空間抽樣優(yōu)化決策.中國科學(xué)D緝,2004 ,34(10) :975~982.[12] 鄭紅星,劉昌明,王中根,等。黃河典型流域分布式水文過(guò)程模擬,地理研究,2004 ,23(4) :447~454.[13]廖順寶, 李澤輝,積溫數據柵格化方法的實(shí)驗。地理研究,2004 ,23(5) :633~640.[14] 周斌,王繁.基于決策樹(shù)模型的土壤性質(zhì)空間推斷.土壤邇報, 2004, 35<4) :385~390.[15] 朱會(huì )義,劉述林,賈紹鳳.自然地理要素空間插值的幾個(gè)問(wèn)題.地理研究,2004 ,23(4) :425 ~ 432.[16] 李新,程國棟,盧玲.空間內插方法比較.地球科學(xué)進(jìn)展,2000,15(3):260~265.[17] 邵全琴,戎愷,馬巍巍,等.西北太平洋柔魚(yú)中心漁場(chǎng)分布模式.地理研究,2004,23(1):1~9.[18] 楊林生,陳如桂,王五一,等。1840年以來(lái)我國鼠疫的時(shí)空分布規律。地理研究, 2000, 19(3): 43~248.[19] WHO. Disease Mapping and Risk Assessment for Public中國煤化工/1CP/EHRO 02 0301,1997.HCNM H G_[20] 朱華忠,羅天祥,Christopher Daly. 中國高分辨率溫度和降水模擬數據的驗讓●吧埋財咒,cU03,22(3) :349~359[21] 徐建華.現代地理學(xué)中的數學(xué)方法(第二版).北京:高等教育出版社,2002.[22]黎夏,葉嘉安 .知識發(fā)現及地理元胞自動(dòng)機.中國科學(xué)D輯,2004,34(9) :865~872.472地研究24卷[23] Ying Longgeng. Understanding China's recent growth experience: a spatial econometric perspective. Ann. Reg.Sci, 2003, 37:613~628.[24] Chen Shupeng, Chenghu Zhou. New generation of grid mapping. In: Proceedings of the International Conferenceon Geoinformatics and Modelling Geographical Systems, Beiing, 2004. 15~ 23.[25] Wang J, Wise s, Haining R. An integrated regionalization of earthquake, flood and drought hazards in China.Transactions in GIS, 1997, 2 (1):25~44.[26] 顏維安,馮建良,杭德榮,等。用地理信息系統評價(jià)垃圾填埋場(chǎng)對環(huán)境污染及危害的研究,中國衛生工程學(xué),2004,3 (3):130~132.[27] Dankmar Bohning,Ekkehart Dietz,Peter Schlattmann. Space time mixture modelling of public health data,Sta-tistics in Medicine , 2000,19; 2333~2344.[28] 劉紀遠,張增祥,莊大方,等。20世紀90年代中國土地利用變化時(shí)空特征及其成因分析.地理研究,2003,22(1):1~12.[29] Simple 0. 1, htp://autoib. homebj. com/[30] Michael F Goodchild, Robert P Haining. GIS and spatial data analysis: converging perspectives ,Papers Reg. Sci,2004 ,83:363~385.[31] Pierre Baldi,Soren Brunak. Bioinformatics: The Machine Learning Approach, MIT, 2001.Techniques of spatial data analysisWANG Jin-feng, WU Ji-lei, SUN Ying-jun, LI Lian-fa, MENG Bin,(State Key Lab of Resources and Environment Information System, Institute of GeographicSciences and Natural Resources Research, CAS, Bejing 100101, China)Abstract:GIS is a geo- referenced data based system for manipulating digital spatial and the-matic data. Because of its unique properties of spatial data (spatial dependence and spatialheterogeneity), there is an urgent need to investigate the mechanisms of spatial processesthrough exploring spatial data. The techniques of spatial analysis can be categorized intosix groups: (1) generation of spatial data and its preliminary treatment; (2) spatializationof attribute data and scale transformation of spatial data; (3) visualization and explorationof spatial data; (4) geo-statistics; (5) analysis of lattice data; and (6) reversing informa-tion from complicated spatial data. To meet the real world solutions, a procedural diagramof spatial data analysis is suggested as below: (1) preliminary data treatment; (2) model-ing; (3) solution; and (4) interpretation. Various techniques are being employed to inves-tigate spatial processes, the identical study objective and some common characteristics ofthe study object may lead to the integration and convergence of the various approaches ,and further the introduction of a general science: spatial mathematics. A same importantissue is to develop robust spatial analysis computer packages for public uses.中國煤化工Key words:GIS; spatial data; spatial process; spat,MYHCNMHGofmechanism
-
C4烯烴制丙烯催化劑 2020-09-25
-
煤基聚乙醇酸技術(shù)進(jìn)展 2020-09-25
-
生物質(zhì)能的應用工程 2020-09-25
-
我國甲醇工業(yè)現狀 2020-09-25
-
JB/T 11699-2013 高處作業(yè)吊籃安裝、拆卸、使用技術(shù)規程 2020-09-25
-
石油化工設備腐蝕與防護參考書(shū)十本免費下載,絕版珍藏 2020-09-25
-
四噴嘴水煤漿氣化爐工業(yè)應用情況簡(jiǎn)介 2020-09-25
-
Lurgi和ICI低壓甲醇合成工藝比較 2020-09-25
-
甲醇制芳烴研究進(jìn)展 2020-09-25
-
精甲醇及MTO級甲醇精餾工藝技術(shù)進(jìn)展 2020-09-25