❶ arc gis10怎麼進行地理信息統計分析比如那QQ正則圖什麼什麼的怎麼弄
1.自定義→拓展模塊,勾選地統計分析(Geostatistical Analyst)
2.菜單欄空白處右鍵,打開這個工具
3.探索數據→選擇圖形類型,後面就根據提示就好了。
❷ 統計學是如何發展的呢
通過SPC系統可以對機械加工的產品零件進行過程分析、控制圖分析、直方圖分析、趨勢圖分析和過程能力分析等。並可以按產品、車間、工序等不同緯度對批次的質量指標(標准偏差、CPK)分析,如:按年度、月度、周進行趨勢圖分析、對比分析。可以直觀的看出產品零件批與批之間的波動情況。在熱處理、成型加工車間使用自動採集的方式獲取工藝過程數據,並可以使用統計分析繪制實際工藝參數圖形,通過與工藝要求參數圖形的對比,用於分析熱處理、成型加工等過程的關鍵參數的執行符合程度。這些分析工具在SPC系統中應用於不同階段,側重於不同方面,保證了SPC系統目標的實現,同時也可以通過對數據的分析來形成和導出分析報告。統計分析是指運用統計方法及與分析對象有關的知識,從定量與定性的結合上進行的研究活動。它是繼統計設計、統計調查、統計整理之後的一項十分重要的工作,是在前幾個階段工作的基礎上通過分析從而達到對研究對象更為深刻的認識。它又是在一定的選題下,集分析方案的設計、資料的搜集和整理而展開的研究活動。系統、完善的資料是統計分析的必要條件。
運用統計方法、定量與定性的結合是統計分析的重要特徵。隨著統計方法的普及,不僅統計工作者可以搞統計分析,各行各業的工作者都可以運用統計方法進行統計分析。只將統計工作者參與的分析活動稱為統計分析的說法嚴格說來是不正確的。提供高質量、准確而又及時的統計數據和高層次、有一定深度、廣度的統計分析報告是統計分析的產品。
❸ 如何運用Matlab進行地理加權回歸分析
地理加權回歸,由英國Newcastle大學地理統計學家A.S Fortheringham及其同事基於空間變系數回歸模型並利用局部多項式光滑的思想提出的模型。模型公式如下:
其中(yi;xi1,xi2,…,xip)為在地理位置(ui,vi)處的因變數y和自變數x1,x2,…,xp的觀測值(i=1,2,…,n).βj(ui,vi)(j=0,1,…,p)為觀測點(ui,vi)處的未知參數,它是(ui,vi)的未知函,εi(i=1,2,…,n)為獨立同分布的隨機誤差,通常假定其服從N(0,σ2).
❹ 統計學上的分析方法有哪些
統計分析方法從根本上說有兩大類,一是邏輯思維方法,二是數量關系分析方法。在統計分析中二者密不可分,應結合運用。
邏輯思維方法是指辯證唯物主義認識論的方法。統計分析必須以馬克思主義哲學作為世界觀和方法論的指導。唯物辯證法對於事物的認識要從簡單到復雜,從特殊到一般,從偶然到必然,從現象到本質。堅持辨證的觀點、發展的觀點,從事物的發展變化中觀察問題,從事物的相互依存、相互制約中來分析問題,對統計分析具有重要的指導意義。
數量關系分析方法是運用統計學中論述的方法對社會經濟現象的數量表現,包括社會經濟現象的規模、水平、速度、結構比例、事物之間的聯系進行分析的方法。如對比分析法、平均和變異分析法、綜合評價分析法、結構分析法、平衡分析法、動態分析法、因素分析法、相關分析法等。
❺ 基於地理統計學的重金屬元素污染解析
3.5.5.1 土壤重金屬元素統計特徵
對研究區15個采樣點按采樣時間分別對7種重金屬元素進行統計性描述,統計特徵見表3.15,其中2010年12月樣品鉻、鉛、鎳、錳平均值分別為42.30mg/kg、18.90mg/kg、28.74mg/kg、477.42mg/kg,均小於寧夏表層土壤重金屬元素背景值,表明這幾種重金屬元素在該區沒有發生明顯的富集或累積作用;砷、銅平均值為 15.71mg/kg、28.56mg/kg,高於自然背景值,表現出一定的富集作用;鎘平均值為0.67mg/kg,遠高於自然背景值0.112mg/kg,超過土壤二級標准0.6mg/kg,表現出強烈的富集作用。鉻元素標准差相對較大,離子含量變化范圍較廣,其他元素含量分布較均一,全區變化不大。對比兩期樣品重金屬元素含量,春季樣品重金屬元素含量低於冬季樣品。首期樣品重金屬元素含量變化范圍大,極差較大,對應的標准差相對也較大,樣品分布分散;二期樣品測得重金屬元素含量變化較小,全區呈現出一定的均一性;表層土壤重金屬元素隨著季節的變換,含量發生變化,冬季由於風沙較大,重金屬元素分布較分散,離散程度相對較高,春季由於引水灌溉,各重金屬含量變化相對平緩。
表3.15 土壤重金屬元素統計特徵值表
註:∗全國土壤背景值中寧夏表層土壤重金屬平均值,∗∗《土壤環境質量標准》(GB 15618—1995)中pH>7.5情況下的二級標准。
對7種重金屬元素的原始數據、對數變換數據和box-cox正態轉換後數據進行偏度、峰度、Shapiro-Wilk正態檢驗,檢驗結果顯示砷、銅、鉛、鎳、錳原始數據均通過0.01顯著性水平上的正態檢驗,經過box-cox轉換後鉻符合正態分布,但鎘仍不符合正態分布規律,據研究表明,天然狀態下各重金屬元素分布符合正態分布。為探索各重金屬元素間的相關性,進行重金屬元素相關系數統計(表3.16),從相關系數可以看出砷、銅、鉛、鎳之間具有顯著正相關性,砷、銅、鉛、鎳與錳、鎘呈現出較強的負相關性,僅鉻與眾元素之間沒有明顯的相關性(表3.17)。簡單的相關性分析難以摒除共同因素對相關系數的影響,有可能造成兩個重金屬元素由於與第三種元素相關性較強或較弱,使該兩種重金屬元素產生相關性或非相關性,因此需進一步描述重金屬元素間的親疏關系,分析重金屬元素空間分布情況。
表3.16 重金屬元素偏度、峰度及正態檢驗統計表
註:∗∗顯著性水平a=0.01。
表3.17 重金屬元素相關性分析表
註:∗∗顯著性水平a=0.01。
3.5.5.2 基於ANN 的土壤重金屬元素分布預測
人工神經網路(ANN)模型是模擬人類大腦處理和分析問題的方式方法來研究實際問題,從本質上說,它是一種黑箱建模工具,它能夠通過「學習」來模擬真實系統中的輸入和輸出之間的定量關系;具有自適應性、自學習性、容錯性和聯想記憶能力等特點,而且魯棒性強、操作簡單、具有真正多輸入多輸出系統的特點,這些都是常規的建模方法所不具備的。為了恰當地表徵一個神經網路模型,至少需要涉及以下3個方面:即網路拓撲、神經元特性以及學習(訓練)方法。
考慮到土壤中各金屬離子含量與空間位置之間存在著高度復雜的非線性映射關系,因此不宜用常規的建模方法來解決此類問題,而適合用ANN模型來對這種關系進行研究,使ANN發揮其能夠處理具有「黑箱」特徵問題的優點,建立各個重金屬元素含量與其空間位置之間關系的映射模型。本書選用反向傳播神經網路(Back-Propa-gation Net-works,以下簡稱BP網路)模型來對以上二者的關系進行研究。
在ANN模型的實際應用中,絕大部分使用的是BP網路模型,它是前向型神經網路的核心部分;它的結構由3部分組成,分別是輸入層、隱層和輸出層。輸入層和輸出層一般只有一個,隱層可能有若干個。各層神經元並行分布,只存在層與層神經元(節點)之間的聯系,層內神經元之間沒有任何聯系。它採用有教師指導的學習訓練演算法,把學習過程分為兩個階段:即正向傳播階段和反向傳播階段。兩個階段反復交替進行,直到網路輸出與期望輸出一致為止。學習訓練完畢後的網路結構和狀態就代表了輸入-輸出之間關系的映射模型,它不是常規的用數學表達式表示出的函數或回歸模型,而是一種黑箱的、智能的模擬模型。模型的輸入端和輸出端分別為各采樣點處的坐標值和該處的7種重金屬元素含量值。原理是通過建立BP網路來對現有的樣本進行學習和訓練,直到網路完全「掌握」了這些輸入-輸出之間的對應關系為止。然後利用訓練好的BP網路的泛化能力來預測選擇的43個插值點上7 種重金屬元素的含量,從而得到各點的重金屬元素含量。利用得到的重金屬元素含量分布進一步分析空間變異情況。
3.5.5.3 富集因子及計算
富集因子(Enrichment Factor,EF)是評價人類活動對土壤及其沉積物中重金屬元素富集程度影響的重要參數。富集因子的基本含義是將樣品中元素的濃度與背景中元素的濃度進行對比,以此來判斷表生環境介質中元素的污染狀況。考慮到減少環境介質、采樣過程以及制備樣品等對元素含量的影響,因此在富集因子的計算中常常引入可參比元素進行標准化,其計算公式可以表示為:
地下水型飲用水水源地保護與管理:以吳忠市金積水源地為例
式中:Ci——元素i的濃度(測試值);
Cn——標准化元素的濃度(測試值);
sample和background分別表示樣品和背景。
選擇遠低於環境背景值的鎳作為標准元素,採用鎳平均值作為背景測試值進行計算。計算結果見表3.18。
表3.18 土壤重金屬富集因子變化范圍
砷、銅、錳、鎳富集因子均小於2,鉻、鉛富集因子均小於1,富集因子級別為1級,受人類活動影響微弱。鎘因子分布范圍為7.01~9.35,為顯著性富集,表明鎘受到強烈的污染與影響。
3.5.5.4 土壤重金屬元素空間分析
土壤重金屬元素常規統計分析描述了土壤重金屬元素的整體特徵,為反映數據間的變化特徵及程度,進一步研究土壤重金屬元素含量的隨機性和結構性,採用地統計法的半方差分析對土壤重金屬元素含量的空間變異結構進行分析和探討。土壤的變異結構包括區域化變數的結構性變異和隨機性變異,結構性變異指由土壤母質、地形、氣候等非人為的因素引起的變異,隨機性變異是由實驗誤差和小於取樣尺度上施肥、作物、管理水平等隨機因素共同引起的變異。利用半方差函數對研究區7種重金屬元素分布及變異進行分析,半方差模型及其參數值如表3.19各重金屬元素均符合高斯模型,砷、鎘、鉻、銅、鉛、錳決定系數均大於0.9,其中鉻殘差大,其他重金屬元素殘差都相對較小(圖3.27)。
表3.19 半方差函數模型表
圖3.27 各重金屬元素半方差函數變異圖
變程也稱之空間最大相關距離,反映了變數空間自相關范圍的大小。土壤中砷、鎘、鉻、銅、鉛、鎳、錳變程分別為6.77km、8.90km、9.15km、6.88km、4.57km、2.13km、5.00km,重金屬元素空間相關性范圍由大到小依次為土壤鉻、鎘、銅、砷、錳、鉛、鎳。塊金方差表示由隨機部分引起的空間異質性,基台值表示系統內總的變異,是結構性變異和隨機性變異之和。土壤各重金屬元素的空間變異性可根據塊金值與基台值的比值大小來劃分(即塊金系數),塊金系數表示由隨機部分引起的空間變異性占總體變異的比例。當C0/(C0+C)<25%時,表明變數的空間變異以結構性變異為主,變數具有強烈的空間相關性;25%~50%時,變數有明顯的空間自相關;50%~75%時,變數為中等程度空間相關;>75%時,以隨機變異為主,變數空間相關性很弱。研究區內塊金系數均小於25%,在空間上表現出強烈的結構性變異,主要受土壤母質影響。
結論:研究區鉻、鉛、鎳、錳平均值均小於自然背景值,沒有發生明顯的富集或累積作用;砷、銅高於寧夏回族自治區自然背景值,通過富集因子計算和空間變異性分析,該兩種元素並未受到強烈的人為干擾,判斷為該區此重金屬元素具有高於寧夏全區平均值的含量;鎘平均值為 0.67mg/kg,遠高於自然背景值 0.112mg/kg,超過土壤二級標准0.6mg/kg,表現出強烈的富集作用,進行半方差模型擬合時擬合殘差較大,模型可靠性降低,從空間分析可以看出各重金屬離子具有較強的空間相關性,主要以結構性變異為主,受土壤母質影響最大,因此,判斷影響鎘含量的原因可能由於長期施用化肥農葯等造成的農業污染。
3.5.5.5 水環境重金屬元素分布特徵
本書檢測的黃河水、工企業排污口污水以及南干溝污水中重金屬鉛未檢出;鎘、鉻、銅、鎳有微量檢出,均低於地下水Ⅰ類標准下限;錳在南干溝入口、出口以及沿途企業都有檢出,南干溝上游錳含量較低,滿足Ⅰ類地下水水質標准,出口處含量達到Ⅳ類水標准;區內地表水以及工企業污水砷普遍檢出,從圖3.28(單位mg/kg)可以看出砷主要沿黃河以及南干溝、清二溝有檢出,濃度較高的點圍繞工企業分布,根據數據顯示沿途化肥廠污水排放砷為Ⅱ類標准,其餘排放含量均滿足Ⅰ類標准。
地下水檢測的重金屬元素主要有砷(As)、鎘(Cd)、鉻(Cr)、銅(Cu)、鉛(Pb)、鎳(Ni)、錳(Mn)7種,檢測限普遍低於地下水水質標准一個數量級。水樣中鉛未檢出;鎘、鉻、銅在個別采樣點有微量檢出,大部分低於檢測限,檢出項含量均低於地下水Ⅰ類標准下限;鎳、錳在全區范圍內廣泛檢出,以符合地下水Ⅰ、Ⅱ類標准為主,從圖3.28中可以看出沿著馬蓮渠與清二溝至清二溝與南干溝交匯段地下水中鎳含量普遍高於全區地下水鎳含量;錳在工業區范圍內地下水含量及排放污水中含量均較低,在水源地中心以及上游黃河沿岸部分地區錳含量較高,屬於Ⅳ類水。
從水體重金屬元素分布可以看出工企業污水以及南干溝污水砷普遍檢出,但沿南干溝地下水砷含量並未表現出波動或富集;錳和鎳濃度在水源地和工業區范圍變化明顯,錳在地下水中普遍檢出且存在大范圍超標,濃度大於0.1mg/L,為地下水水質分類的Ⅳ類水,沿南干溝地下水中錳元素濃度顯著降低,污水中錳含量低於全區平均值;鎳在全區含量分布均勻,在工業區范圍內含量增加。該兩種重金屬元素含量的變化反映了錳、鎳不僅在土壤中存在顯著負相關性,在地下水中也存在相似的此消彼長的規律。在污染物的遷移過程中,土壤以及地下水系統的氧化-還原條件、pH、生物作用以及水化學成分對污染物的遷移轉化有著重大的影響,改變了重金屬元素空間分布及含量。對比分析全區地下水水質檢測結果與污水指標檢測結果,污水pH、化學需氧量(CODcr)含量顯著高於地下水中檢測量,重金屬元素含量的變化主要反映了南干溝地表污水的排放對土壤及地下水中酸鹼度、氧化還原條件的改變。
圖3.28 水環境重金屬元素分布圖
❻ 地理學中的經典統計分析方法有哪些
統計學 - 統計方法
測量的尺度
統計學一共有四種測量的尺度或是四種測量的方式。這四種測量(名目,順序,等距,等比)在統計過程中具有不等的實用性 。等比尺度(Ratio measurements)擁有零值及資料間的距離是相等被定義的,等距尺度(Interval measurements)資料間的距離是相等被定義的但是它的零值並非絕對的無而是自行定義的(如智力或溫度的測量)。( Ordinal measurements)順序尺度的意義並非表現在其值而是在其順序之上。名目尺度(Nominal measurements)的測量值則不具量的意義
❼ 對空間數據進行統計分析的意義是什麼
地理信息系統(GIS)具有很強的空間信息分析功能,這是區別於計算機地圖制圖系統的顯著特徵之一。利用空間信息分析技術,通過對原始數據模型的觀察和實驗,用戶可以獲得新的經驗和知識,並以此作為空間行為的決策依據。 空間信息分析的內涵極為豐富。作為GIS的核心部分之一,空間信息分析在地理數據的應用中發揮著舉足輕重的作用。 疊置分析(Overlay Analysis) 覆蓋疊置分析是將兩層或多層地圖要素進行疊加產生一個新要素層的操作,其結果將原來要素分割生成新的要素,新要素綜合了原來兩層或多層要素所具有的屬性。也就是說,覆蓋疊置分析不僅生成了新的空間關系,還將輸入數據層的屬性聯系起來產生了新的屬性關系。覆蓋疊置分析是對新要素的屬性按一定的數學模型進行計算分析,進而產生用戶需要的結果或回答用戶提出的問題。 1)多邊形疊置 這個過程是將兩層中的多邊形要素疊加,產生輸出層中的新多邊形要素,同時它們的屬性也將聯系起來,以滿足建立分析模型的需要。一般GIS軟體都提供了三種多邊形疊置: (1)多邊形之和(UNION):輸出保留了兩個輸入的所有多邊形。 (2)多邊形之積(INTERSECT):輸出保留了兩個輸入的共同覆蓋區域。 (3)多邊形疊合(IDENTITY):以一個輸入的邊界為准,而將另一個多邊形與之相匹配,輸出內容是第一個多邊形區域內二個輸入層所有多邊形。 多邊形疊置是個非常有用的分析功能,例如,人口普查區和校區圖疊加,結果表示了每一學校及其對應的普查區,由此就可以查到作為校區新屬性的重疊普查區的人口數。 2)點與多邊形疊加 點與多邊形疊加,實質是計算包含關系。疊加的結果是為每點產生一個新的屬性。例如,井位與規劃區疊加,可找到包含每個井的區域。 3)線與多邊形疊加 將多邊形要素層疊加到一個弧段層上,以確定每條弧段(全部或部分)落在哪個多邊形內。 網路分析(Network Analysis) 對地理網路(如交通網路)、城市基礎設施網路(如各種網線、電力線、電話線、供排水管線等)進行地理分析和模型化,是地理信息系統中網路分析功能的主要目的。網路分析是運籌學模型中的一個基本模型,它的根本目的是研究、籌劃一項網路工程如何按排,並使其運行效果最好,如一定資源的最佳分配,從一地到另一地的運輸費用最低等。其基本思想則在於人類活動總是趨向於按一定目標選擇達到最佳效果的空間位置。這類問題在生產、社會、經濟活動中不勝枚舉,因此研究此類問題具有重大意義。 網路中的基本組成部分和屬性如下: (1)鏈(Links),網路中流動的管線,如街道,河流,水管等,其狀態屬性包括阻力(Impedence)和需求(Demand)。 (2)障礙(Barriers),禁止網路中鏈上流動的點。 (3)拐角點(Turns),出現在網路鏈中所有的分割結點上,狀態屬性有阻力,如拐彎的時間和限制(如不允許左拐)。 (4)中心(Centers),是接受或分配資源的位置,如水庫、商業中心、電站等,其狀態屬性包括資源容量,如總的資源量;阻力限額,如中心與鏈之間的最大距離或時間限制。 (5)站點(Stops),在路徑選擇中資源增減的站點,如庫房、汽車站等,其狀態屬性有要被運輸的資源需求,如產品數。 網路中的狀態屬性有阻力和需求兩項,實際的狀態屬性可通過空間屬性和狀態屬性的轉換,根據實際情況賦到網路屬性表中。 1)路徑分析 (1)靜態求最佳路徑:由用戶確定權值關系後,即給定每條弧段的屬性,當需求最佳路徑時,讀出路徑的相關屬性,求最佳路徑。 (2)動態分段技術:給定一條路徑由多段聯系組成,要求標注出這條路上的公里點或要求定位某一公路上的某一點,標注出某條路上從某一公里數到另一公里數的路段。 (3)N條最佳路徑分析:確定起點、終點,求代價較小的N�條路徑,因為在實踐中往往僅求出最佳路徑並不能滿足要求,可能因為某種因素不走最佳路徑,而走近似最佳路徑。 (4)最短路徑:確定起點、終點和所要經過的中間點、中間連線,求最短路徑。 (5)動態最佳路徑分析:實際網路分析中權值是隨著權值關系式變化的,而且可能會臨時出現一些障礙點,所以往往需要動態地計算最佳路徑。 2)地址匹配 地址匹配實質是對地理位置的查詢,它涉及到地址的編碼(Geocode)。地址匹配與其它網路分析功能結合起來,可以滿足實際工作中非常復雜的分析要求。所需輸入的數據,包括地址表和含地址范圍的街道網路及待查詢地址的屬性值。 3)資源分配 資源分配網路模型由中心點(分配中心)及其狀態屬性和網路組成。分配有兩種方式,一種是由分配中心向四周輸出,另一種是由四周向中心集中。這種分配功能可以解決資源的有效流動和合理分配。其在地理網路中的應用與區位論中的中心地理論類似。在資源分配模型中,研究區可以是機能區,根據網路流的阻力等來研究中心的吸引區,為網路中的每一連接尋找最近的中心,以實現最佳的服務。還可以用來指定可能的區域。 資源分配模型可用來計算中心地的等時區,等交通距離區,等費用距離區等。可用來進行城鎮中心,商業中心或港口等地的吸引范圍分析,以用來尋找區域中最近的商業中心,進行各種區劃和港口腹地的模擬等。 緩沖區分析(Buffer Analysis) 緩沖區分析是針對點、線、面實體,自動建立其周圍一定寬度范圍以內的緩沖區多邊形。緩沖區的產生有三種情況:一是基於點要素的緩沖區,通常以點為圓心、以一定距離為半徑的圓;二是基於線要素的緩沖區,通常是以線為中心軸線,距中心軸線一定距離的平行條帶多邊形;三是基於面要素多邊形邊界的緩沖區,向外或向內擴展一定距離以生成新的多邊形。 緩沖區分析是地理信息系統重要的空間分析功能之一,它在交通、林業、資源管理、城市規劃中有著廣泛的應用。例如:湖泊和河流周圍的保護區的定界,汽車服務區的選擇,民宅區遠離街道網路的緩沖區的建立等。 空間統計分析(Spacial Analysis) 1)常規統計分析 常規統計分析主要完成對數據集合的均值、總和、方差、頻數、峰度系數等參數的統計分析。 2)空間自相關分析 空間自相關分析是認識空間分布特徵、選擇適宜的空間尺度來完成空間分析的最常用的方法。目前,普遍使用空間自相關系數—— MoranI指數,其計算公式如下: 其中:N表示空間實體數目;xi表示空間實體的屬性值;x是xi的平均值;Wij=1表示空間實體i與j相鄰,Wij=0表示空間實體i與j不相鄰I的值介於1與I之間,I=1表示空間自正相關,空間實體呈聚合分布;I=1表示空間自負相關,空間實體呈離散分布;I=0則表示空間實體是隨機分布的。Wij表示實體i與j的空間關系,它通過拓撲關系獲得。 3)回歸分析 回歸分析用於分析兩組或多組變數之間的相關關系,常見回歸分析方程有:線性回歸、指數回歸、對數回歸、多元回歸等。 4)趨勢分析 通過數學模型模擬地理特徵的空間分布與時間過程,把地理要素時空分布的實測數據點之間的不足部分內插或預測出來。 5)專家打分模型 專家打分模型將相關的影響因素按其相對重要性排隊,給出各因素所佔的權重值;對每一要素內部進行進一步分析,按其內部的分類進行排隊,按各類對結果的影響給分,從而得到該要素內各類別對結果的影響量,最後系統進行復合,得出排序結果,以表示對結果影響的優劣程度,作為決策的依據。 專家打分模型可分二步實現。第一步——打分:用戶首先在每個feature的屬性表裡增加一個數據項,填入專家賦給的相應的分值;第二步——復合:調用加權符合程序,根據用戶對各個feature給定的權重值進行疊加,得到最後的結果。
❽ 常用統計分析方法
數據分析師針對不同業務問題可以製作各種具體的數據模型去分析問題,運用各種分析方法去探索數據,這里介紹最常用的三種分析方法,希望可以對您的工作有一定的的幫助
文中可視化圖表均使用DataFocus數據分析工具製作。
1.相關分析
相關分析顯示變數如何與另一個變數相關。例如,它顯示了計件工資是否會帶來更高的生產率。
2.回歸分析
回歸分析是對一個變數值與另一個變數值之間差異的定量預測。回歸模擬依賴變數和解釋變數之間的關系,這些變數通常繪制在散點圖上。您還可以使用回歸線來顯示這些關系是強還是弱。
另請注意,散點圖上的異常值非常重要。例如,外圍數據點可能代表公司最關鍵供應商或暢銷產品的輸入。但是,回歸線的性質通常會讓您忽略這些異常值。
3.假設檢驗
假設檢驗是基於某些假設並從樣本到人口的數理統計中的統計分析方法。主要是為了解決問題的需要,對整體研究提出一些假設。通常,比較兩個統計數據集,或者將通過采樣獲得的數據集與來自理想化模型的合成數據集進行比較。提出了兩個數據集之間統計關系的假設,並將其用作理想化零假設的替代方案。建議兩個數據集之間沒有關系。
在掌握了數據分析的基本圖形和分析方法之後,數據分析師認為有一點需要注意:「在沒有確認如何表達你想要解決的問題之前,不要開始進行數據分析。」簡而言之,如果您無法解釋您試圖用數據分析解決的業務問題,那麼沒有數據分析可以解決問題。
❾ 基於地統計學的寧波市區地價空間分布特徵研究
樓立明1 馮秀麗2
(1.寧波市國土資源局鎮海分局,寧波,3151202.寧波大學建工學院,寧波,315120)
摘要:城市地價是一個具有時空性質的多維概念,在空間分布上具有較強的關聯性和特殊性。本文以寧波市中心城區為研究區域,以地價信息為研究對象,探討了如何基於地統計學和 GIS 對地價的空間分布特徵和規律進行研究的原理和方法。
關鍵詞:城市地價;空間分析;地統計學;寧波市區
1 地統計學的基本概念
地統計學(Geostatistics)是由法國著名數學家G·Matheron教授在研究了南非地質工程師 D.G.Krike 等人工作的基礎上,於1963年提出並創立的。地統計學是在地質分析和統計分析的基礎上形成的一套分析空間相關變數的理論和方法,它以區域化變數理論為基礎,以變差函數為主要工具,研究那些在空間分布上既有隨機性又有結構性的自然現象的科學。地統計學能最大限度的利用野外調查所能提供的各種信息,例如樣本位置、樣本值和樣本承載大小等;能利用稀疏的或無規律的空間數據。由於地統計學能夠較准確地描述區域化變數的隨機性和結構性變化,因而越來越受到重視,除成功應用於自然資源方面外,還廣泛應用於環境科學、農林科學、水利科學和土地科學中。
在地價研究領域,地統計學的應用主要體現在三個方面:一是定量區域化變數的空間相關性,二是對調查數據進行空間插值,三是分析空間數據的時空規律性。相對來說,對空間插值應用較多,由於在通常的地價調查中,野外調查所得的數據不能完全覆蓋所要求的區域范圍,需要應用地統計學的方法進行插值,將離散的采樣點數據內插為連續的數據表面。
應用地統計學的最大好處是它能夠在空間相關分析的基礎上,利用稀疏的、無規律的調查數據,最大限度的揭示這些數據所能提供的空間信息。但是,地統計學應用在地價研究中還剛剛開始,還存在著諸如空間與時間的協同分析、樣點數目、取樣位置、方向、大小的設計等等,這些都值得進一步完善和改進。
2 地統計學分析的基本函數
在地統計學上,用於空間相關分析的函數主要是半方差函數(Variograms Function)、協方差函數(Covariance Function)、相關函數(Correlation),其中半方差函數是地統計學最常用的工具。除此之外,還有一般相對方差函數、交叉變差函數、成對相對方差函數、對數方差函數、廣義方差函數、特徵化方差函數(或指示方差函數)及散點圖等,但應用較少,一般不適合對地價進行空間分析。
半方差函數定義為:區域化變數z (xi)和z (xi +h)的增量平方的數學期望,即區域化變數增量的方差。半方差函數既是距離h的函數,又是方向α的函數。其計算公式如下:
土地信息技術的創新與土地科學技術發展:2006年中國土地學會學術年會論文集
式中,γ(h)為半方差函數值,半方差函數曲線圖(Semivariogram)是半方差函數γ(h)對距離 h 的坐標圖形。N (h)是被及分隔的數據對的數量,z (xi)和z (xi +h)分別是在點xi 和 xi + h處樣本的測量值,h是兩分隔樣點的距離。
對於一個典型的空間聚集分布,半方差函數一般隨著距離的增大而增大,亦即區域化變數的空間變異愈來愈大,空間相關性逐漸減小,但增加至某一值時,半方差函數不再增加而是保持穩定,這表示樣點間已不存在空間相關關系。將半方差函數值不再增加時的距離稱為空間依賴范圍(Range of Spatial Dependence),簡稱變程或相關程(Range),用 a表示。此時的半方差函數值稱為基台值(Sill),用C0 +C表示。半方差函數曲線在 Y 軸上的截距稱為區域不連續值,亦稱塊金(Nugget)系數或者核方差,用 C0表示。C0的大小可以反映區域化變數的局部隨機性大小。(基台一塊金)/基台(即 C/(C0 +C))的大小可以反映空間變異在總變異中所佔的比例,或用隨機程度(塊金/基台,即C0/(C0 +C))的大小反映研究范圍內不是由地價的空間自相關引起的那部分變異在總變異中所佔的比率,也就是地價隨機性和結構性所佔成分。
3 寧波市區地價的地統計學分析
3.1 寧波市區地價的地統計學分析范圍及樣點分布
本次寧波市區城鎮土地定級范圍包含了寧波的六個區,從土地利用方式和土地市場發育水平來看,都存在著較大的差異,特別是山區,土地交易現象極少,土地價格樣點稀缺。從地統計學對樣點的要求而言,雖然不要求地價樣點規則取樣,但是大面積內樣點稀缺會對分析結果的可靠性造成很大影響,同時,考慮到寧波市區土地交易主要集中在以市三江片為核心的一個輻射圈內,因此,本次寧波市區地價的地統計學分析的范圍定為寧波市三江片向外擴展的一個區域。分析范圍及范圍內地價樣點情況如圖1~圖3 所示。
圖1 分析范圍內商業地價樣點分布圖
圖2 分析范圍內住宅地價樣點分布圖
圖3 分析范圍內工業地價樣點分布圖
3.2 地價在各向異性條件下的變異分析
地價作為一種區域化變數,在各個方向上都有變化。一個區域化變數如果在不同方向上都有變化,那麼當變異函數r (h)在各個方向上的變化都相同時稱為各向同性,反之稱為各向異性。圖4~圖6為不同地價類型在0°,45°,90°和135°四個方向上的變異曲線圖。
(1)工業地價沒有表現出各向異性結構特徵,在不同的方向上,不同距離的半方差函數值均不能用合適的模型來擬合出半方差曲線,這說明寧波市區工業用地的發展軸向不明確,同時工業用地價格的政策性因素也較大,造成地價規律性較差。
(2)住宅、商業兩種地價均表現出一定的各向異性結構特徵,在不同的方向上,塊金值、基台值和變程均不相同,具有帶狀各向異性特徵。在135°方向(西北—東南)上地價不同距離上的半方差函數值的擬合效果較好,說明近年來鄞州區中心區的建設對寧波城市商業和居住功能的分布格局產生了顯著的影響。寧波市三江片西部和南部大量的居住區建設,形成了好又多、麥德龍等新的商業中心。
3.3 地價在各向同性條件下的變異分析
為了不同地價間的對比和地價擴散情況的分析,往往需要將各向異性結構通過線性變換和矩陣變換轉化為各向同性結構。其原理是通過改變不同方向上的距離h,使 γ(h)在各個方向上具有相同的變化情況。地統計學軟體 GS+提供了這種工具,使得具有各向異性的區域化變數可以轉化為各向同性結構下進行研究。圖7~圖9 為不同地價類型在各向同性下的變異曲線圖,圖10~圖12 為不同地價類經過kriging空間插值後的平面和相應的三維曲面圖。表1 為不同地價類型各向同性下的變異曲線的模擬公式參數。
表1 不同地價類型各向同性下的變異曲線的模擬公式參數
圖4 工業地價在0°,45°,90°,135°四個方向上的變異曲線圖(指數模型)
圖5 住宅地價在0°,45°,90°,135°四個方向上的變異曲線圖(指數模型)
圖6 工業地價在0°,45°,90°,135°四個方向上的變異曲線圖(球狀模型)
工業地價變異曲線模擬方程為:
土地信息技術的創新與土地科學技術發展:2006年中國土地學會學術年會論文集
圖7 工業地價變異曲線圖(球狀模型)
住宅地價變異曲線模擬方程為:
土地信息技術的創新與土地科學技術發展:2006年中國土地學會學術年會論文集
商業地價變異曲線模擬方程為:
土地信息技術的創新與土地科學技術發展:2006年中國土地學會學術年會論文集
圖8 住宅地價變異曲線圖(球狀模型)
圖9 商業地價變異曲線圖(球狀模型)
圖10 工業地價經過kriging 空間插值後的平面和相應的三維曲面圖
圖11 住宅地價經過kriging 空間插值後的平面和相應的三維曲面圖
圖12 商業地價經過kriging 空間插值後的平面和相應的三維曲面圖
4 結論
(1)三種地價在空間一定范圍內均存在著空間相關性,它們的空間相關距離為1810~3925 m。工業地價的空間相關距離最大,為3925 m;住宅次之,為2914 m;商業最小,為1810 m。說明土地價格空間變化的梯度是商業用地大於住宅用地,住宅用地大於工業用地。
(2)在三種地價空間變異的總方差中,均是結構方差(C)所佔的比例要大於塊金效應(C0)所佔比例。這說明確定性因素(交通狀況、基礎設施、環境狀況等)對地價的影響要大於隨機因素引起的地價差異,地價的構成還是比較合理的。
(3)塊金效應(C0),是住宅地價> 商業地價> 工業地價,這說明三種地價中住宅地價最容易受不確定性因素影響,價格變動最大,工業地價相對最穩定。這與寧波市房地產市場中住宅價格明顯提高,近年來政府不時出台宏觀調控政策的情況比較符合。
圖13 寧波市區商業用地價格分布圖
圖14 寧波市區住宅用地價格分布圖
(4)空間變異系數 C/C0 +C,商業地價達到 0.659,住宅為 0.807,工業為 0.874,這說明工業地價的空間變異性最強,受周圍地價的影響最大。而商業地價和住宅地價受到寧波市近年來城市規劃調整的影響,隨著新規劃的城市中心(如東部新城)、副中心(鄞州中心區)的建設,在空間上出現了不連續的、突變性特點。
(5)從通過空間插值得到的寧波市中心城區(三江片)的地價分布圖,加入道路和河流等控制性基礎因素(圖13~圖15),可以看出,寧波市商業地價的地域分異規律明顯,不僅原來的中心城區老的城市建成區地價較高,而且整個城市往東發展和江北區往北發展,海曙區往西發展、鄞州區往西南發展帶來的商業用地地價變化也很明顯。寧波市區住宅用地價格和工業用地價格變化規律也得到了非常直觀的反映。
圖15 寧波市區工業用地價格分布圖
參考文獻
劉衛東等.寧波三江片城市土地價格調查.北京:科學出版社,2002
王政權.地統計學及在生態學中的應用.北京:科學出版社,1999
王瑞萍.GIS 空間分析技術應用研究.油氣田地面工程,2003,22 (6)
陳浮,李滿春等.城市地價空間分布因式的地統計學分析.南京大學學報(自然科學),1999,35 (6)
單衛東,包浩生.城市中空間擴散的各向異性研究.南京大學學報(自然科學),1996,32 (3)
許曉暉.上海市商品住宅價格空間分布特徵分析.經濟地理,1997,17 (3)
❿ 統計學的分析方法有哪些
統計的分析方法主要是歸納,雖然藉助了許多的數學工具,而且統計的確也離不開數學,但統計與數學的本質區別在於統計的思想是從數據入手,歸納總結,提取數據中的信息,並據以對數據所代表的未知總體進行推斷,以一定的准確率或置信度給出推斷結果。這是傳統統計學的基本思想,這一點在參數估計和假設檢驗中體現的很充分。
SPSS軟體很普及了,買一張盜版光碟就可以自己安裝,13.0的功能就不錯了。