A. 關於地理加權回歸模型的問題,有沒有懂統計學的大神解釋一下。
s://blog.csdn.net/allenlu2008/article/details/72870882
地理加權回歸分析完成之後,與OLS不同的是會默認生成
B. 地理加權回歸需要數據標准化嗎
地理加權回歸是一種探索空間非平穩性的方法。空間非平穩性是指簡單的「全局」回歸模型不能充分解釋一個地理區域內某些變數之間的關系的一種情況。相反,模型的性質應該隨著空間的變化而改變,以反映數據中的結構。例如,在一個地理區域內,與風險因素相關的疾病風險是否保持不變,還是在該區域內的某些點這種關系更強。
Brunsdon等人(1996)開發了地理加權回歸,試圖通過校準多元回歸模型來捕捉這種空間變化,該模型允許變數在空間的不同點之間存在不同的關系。
簡介
地理加權回歸的基本思想是,在數據中的每一點擬合一個回歸模型,根據距離這一點的函數加權所有觀測值。這與這樣一種觀點相一致,即在回歸集中的觀測點附近采樣的觀測結果比在更遠的觀測結果對該點的回歸參數有更大的影響。然後在定義的地理區域的每個點生成一組參數估計。然後可以使用GIS軟體繪制這些參數估計數,以確定變數之間的關系在何處變化,從而提供一種有用的探索性分析形式。利用蒙特卡羅方法可以進行2個假設檢驗:
可以用全局模型而不是非平穩模型來描述數據。
個體回歸系數在地理空間上是否穩定。
我將介紹如何使用ado文件gwr和gwrgrid在Stata中實現這種方法,這兩個文件都將地理加權回歸應用於包含地理參考點的數據集。這兩個ado文件之間的唯一區別是,gwrgrid在地理區域上放置一個網格,並在每個網格中心執行回歸,而gwr在數據的每個點上執行回歸。
這些ado文件中的代碼是基於Brunsdon等人的論文和由Brunsdon等人編寫的FORTRAN程序,並且通過大量依賴Stata中現有的glm函數,已擴展到任何形式的廣義線性模型。
案例:將以Brunsdon等人給出的例子為例進行演示——這是1991年英國人口普查中有關汽車擁有率、社會階層和英格蘭東北部泰恩威爾郡男性失業率的一個數據集。
參考文獻:
Brunsdon, C., A. S. Fotheringham, and M. E. Charlton. 1996.
Geographically weighted regression: A method for exploring spatial nonstationarity. Geographical Analysis 28: 281–298.
操作應用
空間統計目前Stata進行地理加權回歸主要有命令spregxt以及gwr、gwrgrid等,本文主要簡介介紹 gwr、gwrgrid命令的基本應用。
gwr語法格式為:
Geographically weighted regression
----------------------------------
gwr depvar [varlist] [ ifexp] [ inrange] , east(varname)
north(varname) [options]
選項包括
saving(filename) dots reps( #) double eform family(familyname)
link(linkname) [ln]offset(varname) testreplace noconstant
nolog scale(x2|dev| #) disp(#) iterate(#) init(varname)
outfile(filename) comma wide bandwidth( #) mcsave(filename)
sample( #)
其中
familyname選項包括 gaussian | igaussian | binomial [varname| #] | poisson | nbinomial [#] | gamma,即核函數類型
linkname 選項包括如下內容:identify | log| logit | probit | cloglog | opower # | power # | nbinomial
test:要求測試帶寬的重要性。這測試了gwr模型對數據的描述是否明顯優於 全局的回歸模型。
sample( #)指定在帶寬校準過程中使用的觀測值百分比,默認為100%。這是特別對於大型數據集很有用,可以減少校準帶寬所需的時間。如果指定了該選項,將隨機抽取#%的觀測數據並用於校準過程。
bandwidth( #)允許用戶輸入帶寬值,並減少gwr運行所需的時間。
nolog抑制帶寬優化迭代的顯示。
iterate( #)指定在估計帶寬時允許的最大迭代次數。默認值為50。
save (filename)創建一個Stata數據文件,其中包含從計算gwr的每個點估算的參數。
outfile(filename)創建文本文件filename。
replace表示save和/或outfile指定的文件可以 被覆蓋。它也適用於mcsave選項。
reps( #)指定要執行的蒙特卡羅模擬的數量。默認值為1000。
操作案例:
gwr cars class unemp, east(easting) north(northing) test
gwr flag class unemp, east(east) north(north) fam(binomial) link(logit)
gwrgrid y x1, east(east) north(north) fam(b) link(l) square(10) samp(25)
結果為:
. gwr cars class unemp, east(easting) north(northing) test
Global Model
Source | SS df MS Number of obs = 120
-------------+---------------------------------- F(2, 117) = 287.17
Model | 4.51965851 2 2.25982925 Prob > F = 0.0000
Resial | .920700696 117 .007869237 R-squared = 0.8308
-------------+---------------------------------- Adj R-squared = 0.8279
Total | 5.4403592 119 .045717304 Root MSE = .08871
------------------------------------------------------------------------------
cars | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
class | .0188073 .0033449 5.62 0.000 .0121829 .0254316
unemp | -.0182798 .0011238 -16.27 0.000 -.0205054 -.0160543
_cons | .8847704 .0288569 30.66 0.000 .8276208 .94192
C. ARCGIS做地理加權回歸時輸出要素怎麼添加
除回歸殘差之外,輸出要素類包含表示觀...
D. 地理加權回歸
這些都是統計分布的特徵參數。min就是最小值,max是最大值,mean是平均值,median是中位數,1st quantile是第一分位數,就是排名前25%對應的樣本值,3nd quantile是第三分位數,也就是前75%對應的樣本值。