A. ARCGIS做地理加權回歸時輸出要素怎麼添加
除回歸殘差之外,輸出要素類包含表示觀...
B. 要進行地理加權回歸分析的數據應該滿足什麼條件
本帖最後由區域經濟愛好者於2013-11-2313:00編輯第一,GWR缺少統一的統計推斷框架。不同區位回歸系數之間的依賴性也沒有在模型中說明。因此,GWR中標准誤是近似的。這是由於不同區位參數估計中,重復使用了數據;還因為應用這些數據線估計了帶寬,然後估計回歸系數。我對這段話只是明白一部分,請大家進一步解釋一下。謝謝。第二,GWR計算每個樣本點的回歸系數。如果樣本數很大,那將導致非常復雜的結果。如何利用並解析這些結果,歸納出一定的規律呢?另一方面,如果樣本很小,又怎麼進行GWR估計呢?所以樣本大了,不容易找規律;樣本小了,又沒法進行回歸分析。這是一個矛盾體。怎麼?
C. 求助用matlab怎麼做地理加權回歸
地理加權回歸(Geographically Weighted Regression,簡稱GWR),由英國Newcastle大學地理統計學家A.S Fortheringham及其同事基於空間變系數回歸模型並利用局部多項式光滑的思想提出的模型。模型公式如下:
其中(yi;xi1,xi2,…,xip)為在地理位置(ui,vi)處的因變數y和自變數x1,x2,…,xp的觀測值(i=1,2,…,n).βj(ui,vi)(j=0,1,…,p)為觀測點(ui,vi)處的未知參數,它是(ui,vi)的未知函,εi(i=1,2,…,n)為獨立同分布的隨機誤差,通常假定其服從N(0,σ2).
D. 地理加權回歸需要考慮多重共線性嗎
需要。1、描述
執行「地理加權回歸 (GWR)」,這是一種用於建模空間變化關系的線性回歸的局部形式。
2、一圖讀懂GWR
GWR 為局部回歸模型。系數可以變化。
3、使用
GWR 為數據集中的各要素構建了一個獨立的方程,用於將各目標要素的帶寬范圍內的要素的因變數和解釋變數進行合並。帶寬的形狀和范圍取決於用戶輸入的核類型、帶寬方法、距離以及相鄰要素數等參數,但也存在一條限制:如果相鄰要素的數目超過 1000,則僅將最相鄰的 1000 個要素合並到各個局部方程中。
GWR 通常被要求用於處理包含數百個要素的數據集,以便獲得最佳結果, GWR 不適用於小型數據集。而且,此工具不能用於處理多點數據。
註:GWR 工具會生成各種輸出。右鍵單擊結果窗口中的消息條目,然後選擇視圖,將顯示 GWR 工具的執行匯總報告。
此外,GWR 工具也會生成一個輸出要素類和一個包含了工具執行匯總報告診斷值的表。會自動將此表以輸出要素類名加上 _supp 作為後綴的形式進行命名。輸出要素類會自動添加至內容列表中,並會對模型殘差應用熱/冷渲染方案。在解釋 GWR 結果中提供了有關各輸出的完整說明。_supp 文件的創建位置始終與輸出要素類相同,除非輸出要素類被創建在一個要素數據集內。當輸出要素類位於要素數據集內時,_supp 表則會創建在該要素數據集所在的地理資料庫中。
建議您使用投影數據。這一點在距離成為分析的一部分時尤其重要,因為在您針對核類型選擇固定時,會對 GWR 使用投影數據。建議您使用投影坐標系(而非地理坐標系)對數據進行投影。
由 GWR 工具執行的某些計算會利用多個 CPU 以提高性能,並會自動使用多達 8 條線程/CPU 進行處理。
應該始終從普通最小二乘法 (OLS) 回歸開始回歸分析。首先獲得一個正確指定的 OLS 模型,然後使用同樣的解釋變數運行 GWR(不包括表示不同空間組織的任何「啞元」解釋變數)。
因變數和解釋變數應該是包含各種值的數值型欄位。線性回歸方法(如 GWR)不適於預測二進制結果(例如,因變數的所有值不是 1 就是 0)。
如果在 GWR 模型中包含名目數據或分類數據,則需謹慎操作。在類別出現空間聚類的地方,存在局部多重共線性的風險。GWR 輸出中包含的條件數指明了局部共線性何時會導致問題(條件數小於零、大於 30 或設置為「空」)。存在局部多重共線性的結果是不穩定的。
請勿使用人工解釋變數來表示 GWR 模型中的不同空間組織(例如,向城鎮中心外的人口普查區賦予值 1,而向其他區域賦予值 0)。由於 GWR 允許解釋變數系數發生變化,這些空間組織解釋變數並不必要,並且如果包含了這些變數,則會產生局部多重共線性問題。
要更好地了解解釋變數系數當中的區域變化,請檢查由 GWR 創建的可選柵格系數表面。將在系數柵格工作空間中創建這些柵格表面。對於面數據,您可以對輸出要素類中的每個系數欄位使用漸變色彩或由冷色到暖色的渲染以檢查整個研究區域的更改。
通過提供預測位置要素類(通常,此要素類與輸入要素類相同)、預測解釋變數和輸出預測要素類,您可以使用 GWR 進行預測。在用來校正回歸模型的欄位(解釋變數欄位的輸入值)與用來預測的欄位(預測解釋變數欄位的輸入值)之間必須是一對一的對應關系。這些變數的順序必須相同。例如,假設您當前正針對交通事故構建一個有關速度限制、道路條件、車道數量以及汽車數量的函數。通過創建一個具有修正後的速度限制和道路條件的新變數,您可以預測更改速度限制或改善道路狀況可能對交通事故產生的影響。現有變數將用於校正回歸模型,並用作解釋變數的參數。修正的變數將用於預測,並可作為預測解釋變數。
如果提供了預測位置要素類,但未指定預測解釋變數,則僅使用各位置的已計算系數創建輸出預測要素類(不進行任何預測)。
如果回歸模型缺少關鍵解釋變數,則會導致回歸模型的指定錯誤。如果回歸殘差的空間自相關具有統計學上的顯著性,或者在一個或多個解釋變數的系數當中發生了非期望的空間變化,則表明錯誤指定了您的模型。您應該盡一切努力(例如,通過 OLS 殘差分析和 GWR 系數變化分析)來查找這些丟失的關鍵變數,以便在模型中包含這些變數。
時刻關註解釋變數的不穩定性是否會出現問題。例如,假設您正將特殊植物種類的密度構建為若干變數(包括 ASPECT)的函數。如果發現在整個研究區域中 ASPECT 變數的系數發生了更改,則可能要查看是否有缺少關鍵解釋變數的跡象(例如,可能存在大量競爭植被)。應該盡一切努力將所有關鍵解釋變數包含到回歸模型中。
為帶寬方法參數選擇 AICc(更正後的 Akaike 信息准則)或 CV(交叉驗證)時,GWR 將查找最佳距離(對於固定核)或最佳相鄰要素的數目(對於自適應核)。但是,局部多重共線性問題將會阻止 AICc 和 CV 帶寬方法解析最佳距離/相鄰要素的數目。如果出現表示模型設計存在嚴重問題的錯誤,則請嘗試指定特殊距離或相鄰要素的數目, 然後檢查輸出要素類中的條件數,以查看哪些要素與局部共線性問題相關聯。
嚴重模型設計錯誤或用於表明局部方程未包含足夠多相鄰要素的錯誤,通常表示回歸存在全局或局部多重共線性問題。要確定出現問題的位置,請使用 OLS 運行模型,然後檢查每個解釋變數的 VIF 值。如果某些 VIF 值較大(例如,大於 7.5),則全局多重共線性會阻止 GWR 解決問題。但是,更有可能是局部多重共線性所導致的問題。請嘗試為各解釋變數創建一個專題地圖。如果在地圖上出現相同值的空間聚類,考慮將這些變數從模型中移除,或將這些變數與其他解釋變數合並以便加大值的變化性。例如,如果要對房屋價格進行建模且具有卧室和浴室兩個變數,則可能需要將其合並以加大值的變化性,或將其表示為浴室/卧室的建築面積。在構造 GWR 模型時,要避免使用空間組織啞元變數、空間聚類名目或數值變數或者幾乎不可能具有值的變數。
GWR 是一種線性模型,其前提條件與 OLS 相同。要確保正確指定您的 GWR 模型,請參閱回歸分析基礎知識中的回歸模型失效方式部分。
E. 用ArcGIS做地理加權回歸總提示模型錯誤
請問解決了嗎?我也是取了對數
F. 地理加權回歸
這些都是統計分布的特徵參數。min就是最小值,max是最大值,mean是平均值,median是中位數,1st quantile是第一分位數,就是排名前25%對應的樣本值,3nd quantile是第三分位數,也就是前75%對應的樣本值。
G. 地理加權回歸需要數據標准化嗎
地理加權回歸是一種探索空間非平穩性的方法。空間非平穩性是指簡單的「全局」回歸模型不能充分解釋一個地理區域內某些變數之間的關系的一種情況。相反,模型的性質應該隨著空間的變化而改變,以反映數據中的結構。例如,在一個地理區域內,與風險因素相關的疾病風險是否保持不變,還是在該區域內的某些點這種關系更強。
Brunsdon等人(1996)開發了地理加權回歸,試圖通過校準多元回歸模型來捕捉這種空間變化,該模型允許變數在空間的不同點之間存在不同的關系。
簡介
地理加權回歸的基本思想是,在數據中的每一點擬合一個回歸模型,根據距離這一點的函數加權所有觀測值。這與這樣一種觀點相一致,即在回歸集中的觀測點附近采樣的觀測結果比在更遠的觀測結果對該點的回歸參數有更大的影響。然後在定義的地理區域的每個點生成一組參數估計。然後可以使用GIS軟體繪制這些參數估計數,以確定變數之間的關系在何處變化,從而提供一種有用的探索性分析形式。利用蒙特卡羅方法可以進行2個假設檢驗:
可以用全局模型而不是非平穩模型來描述數據。
個體回歸系數在地理空間上是否穩定。
我將介紹如何使用ado文件gwr和gwrgrid在Stata中實現這種方法,這兩個文件都將地理加權回歸應用於包含地理參考點的數據集。這兩個ado文件之間的唯一區別是,gwrgrid在地理區域上放置一個網格,並在每個網格中心執行回歸,而gwr在數據的每個點上執行回歸。
這些ado文件中的代碼是基於Brunsdon等人的論文和由Brunsdon等人編寫的FORTRAN程序,並且通過大量依賴Stata中現有的glm函數,已擴展到任何形式的廣義線性模型。
案例:將以Brunsdon等人給出的例子為例進行演示——這是1991年英國人口普查中有關汽車擁有率、社會階層和英格蘭東北部泰恩威爾郡男性失業率的一個數據集。
參考文獻:
Brunsdon, C., A. S. Fotheringham, and M. E. Charlton. 1996.
Geographically weighted regression: A method for exploring spatial nonstationarity. Geographical Analysis 28: 281–298.
操作應用
空間統計目前Stata進行地理加權回歸主要有命令spregxt以及gwr、gwrgrid等,本文主要簡介介紹 gwr、gwrgrid命令的基本應用。
gwr語法格式為:
Geographically weighted regression
----------------------------------
gwr depvar [varlist] [ ifexp] [ inrange] , east(varname)
north(varname) [options]
選項包括
saving(filename) dots reps( #) double eform family(familyname)
link(linkname) [ln]offset(varname) testreplace noconstant
nolog scale(x2|dev| #) disp(#) iterate(#) init(varname)
outfile(filename) comma wide bandwidth( #) mcsave(filename)
sample( #)
其中
familyname選項包括 gaussian | igaussian | binomial [varname| #] | poisson | nbinomial [#] | gamma,即核函數類型
linkname 選項包括如下內容:identify | log| logit | probit | cloglog | opower # | power # | nbinomial
test:要求測試帶寬的重要性。這測試了gwr模型對數據的描述是否明顯優於 全局的回歸模型。
sample( #)指定在帶寬校準過程中使用的觀測值百分比,默認為100%。這是特別對於大型數據集很有用,可以減少校準帶寬所需的時間。如果指定了該選項,將隨機抽取#%的觀測數據並用於校準過程。
bandwidth( #)允許用戶輸入帶寬值,並減少gwr運行所需的時間。
nolog抑制帶寬優化迭代的顯示。
iterate( #)指定在估計帶寬時允許的最大迭代次數。默認值為50。
save (filename)創建一個Stata數據文件,其中包含從計算gwr的每個點估算的參數。
outfile(filename)創建文本文件filename。
replace表示save和/或outfile指定的文件可以 被覆蓋。它也適用於mcsave選項。
reps( #)指定要執行的蒙特卡羅模擬的數量。默認值為1000。
操作案例:
gwr cars class unemp, east(easting) north(northing) test
gwr flag class unemp, east(east) north(north) fam(binomial) link(logit)
gwrgrid y x1, east(east) north(north) fam(b) link(l) square(10) samp(25)
結果為:
. gwr cars class unemp, east(easting) north(northing) test
Global Model
Source | SS df MS Number of obs = 120
-------------+---------------------------------- F(2, 117) = 287.17
Model | 4.51965851 2 2.25982925 Prob > F = 0.0000
Resial | .920700696 117 .007869237 R-squared = 0.8308
-------------+---------------------------------- Adj R-squared = 0.8279
Total | 5.4403592 119 .045717304 Root MSE = .08871
------------------------------------------------------------------------------
cars | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
class | .0188073 .0033449 5.62 0.000 .0121829 .0254316
unemp | -.0182798 .0011238 -16.27 0.000 -.0205054 -.0160543
_cons | .8847704 .0288569 30.66 0.000 .8276208 .94192