導航:首頁 > 地理科目 > 地理加權回歸多少年數據

地理加權回歸多少年數據

發布時間:2023-05-17 13:11:22

Ⅰ 地理加權回歸需要數據標准化嗎

需要。地理加權回歸是源型一種空間分析技術,廣泛應用於地理學及涉及空激鍵間模式分析的相關學科,需要數據標准化,通過建立空間范圍內每個點處的局部回歸方程,來探索研究對象在某一尺度下的空間變化及相關驅動因素,並可用雹鉛猜於對未來結果的預測。

Ⅱ 統計學的知識,有沒有人知道地理加權回歸模型

憤怒的小小剛
LV.7 2019-01-14
s://blog.csdn.net/allenlu2008/article/details/72870882

Ⅲ 關於地理加權回歸模型的問題,有沒有懂統計學的大神解釋一下。

s://blog.csdn.net/allenlu2008/article/details/72870882
地理加權回歸分析完成之後,與OLS不同的是會默認生成

Ⅳ 地理加權回歸分析需要多大的數據量才能做

本帖最後由 區域經濟愛好者 於 2013-11-23 13:00 編輯

第一,GWR缺少統一的統計推斷框架。不同區位回歸系數之間的依賴性也沒有在模型中說明。因此,GWR中標准誤是近似的。這是由於不同區位參數估計中,重復使用了數據;還因為應用這些數據線估計了帶寬,然後估計回歸系數。

我對這段話只是明白一部分,請大家進一步解釋一下。謝謝。

第二,GWR計算每個樣本點的回歸系數。如果樣本數很大,那將導致非常復雜的結果。如何利用並解析這些結果,歸納出一定的規律呢?另一方面,如果樣本很小,又怎麼進行GWR估計呢?所以樣本大了,不容易找規律;樣本小了,又沒法進行回歸分析。這是一個矛盾體。
怎麼辦?

Ⅳ 地理加權回歸難嗎

難,空間回歸模型中的回歸系數不隨空間位置而變化,因此空間回歸模型是全局模型。但是由於空間異質性和空間非平穩性,不同空間子區域中自變數和因變數的關系很可能不同,因此就需要處理空間異質性的局部空間回歸方法,因此就有了地理加權回歸模型(Geographically Weighted Regression, GWR)的提出。地理加權回歸同時考慮了空間的相關性與異質性。
地理加權回歸模型一般形式如下:
第 1 頁
防火板首選福建原時態
A級防火板生產廠家,技術領先品質保障,尺寸齊全,廠家直銷 。可按需定製。詳情歡迎來電咨詢

點擊立即咨詢,了解更多詳情
咨詢
福建原時態建築工程 廣告


其中,與是因變數與自變數在處的觀測值,為第個采樣點的坐標,是第個采樣點上的第個回歸參數,點被稱為回歸點。,當時,。簡便記為:


第 2 頁
地理加權回歸會得出個回歸方程,對應每個回歸點,都會有一個回歸方程。若鄭譽賀,則地理加權回歸模型退化為普通線性回歸模型。
模型回歸參數需要通過局部加權最小二乘進行估計。假設在位置的權重為,(),那麼位置的參數估計為使達到最小的值。
上式中的為權函數,反映其他觀測點的樣本對回歸點的影響。權函數值越大,影響越大。該值通常由對應兩點之間的距離決定。常用的權函數有:
第 3 頁
(1)Gauss函數:

(2)bi-square函數:

以上兩式中的為點到點的距離。被稱為帶寬,是需要人工選擇的參數。這兩個函數中,距離越大,函數值都越小。這說明選擇這兩個函數時,都假設觀測點越遠,影響越小。
第 4 頁
地理加權回歸模型將數據的空間位置嵌入到回歸參數中,因此考慮了空間的異質性。同時,由於不同位置虛告的觀測點對回歸參數的影響大小不同(通常離回歸點越近,影響越大),因此該模型也考慮了空間相關性。地理加權回歸的使用,也當同時以空間相關性與異質性為前提。如果沒有空間相關性,那麼該模型就缺乏合理性。如果沒有空間異質性,那麼該模型就缺乏必要性。
【案例72】
以2011年北京、天津、唐山各縣(區)疾病發病率和同期各縣(區)的人口密度、人均GDP、年平均風速、光照強度
第 5 頁
、相對濕度、年降水量等數據為例,研究社會經濟和氣象因素對該疾病發病率在各地區影響的不穩定性。
本節所用的數據為2011年某地區某疾病的發病率(C:\Example\Data\7.3WGR\地區匯總.csv),命名為「地區匯總.csv」。此處只展示前10條
表 73 2011年某地區的某疾病發病情況
code
precp
relHum
sunShn
wndspd
PopuDen
PerGdp
rate
110101
58.06842
49.82301
206.0755
2.195716
15318.95
0.002438
347.1859
110102
62.59835
52.05048
202.8901
2.169381
14956.04
0.003675
447.7185
110105
57.65938
50.06015
205.5302
2.189571
8528.913
0.00096
1139.069
110106
55.73981
50.20182
205.5477
2.215026
7698.981
0.000419
1759.943
110107
52.39305
50.77886
205.6759
2.255836
8249.254
0.000541
1561.691
110108
52.13075
51.01494
207.5023
2.255693
8524.685
0.001021
1010.973
110109
44.66608
53.70504
218.3655
2.473628
224.6719
0.00038
758.6155
110111
46.62295
52.79277
208.7774
2.333494
532.4592
0.000457
2082.544
110112
55.23023
51.21378
201.2761
2.186171
1454.807
0.00036
2406.252
110113
50.22722
55.34219
195.5819
2.014273
967.6505
0.001211
1643.1
第 6 頁
表 74各變數的含義
變數名稱
變數含義
單位
code
地理編碼

precp
降喊派水量
毫米
relHum
相對濕度
%
sunShn
日照強度
瓦/平方米
wndspd
風速
千米/時
popuDen
人口密度
千人/平方公里
PerGdp
人均國內生產總值
千元
rate
發病率
此外,還需要的數據是包含該地區所有區縣的地圖文件(.dbf文件和.shp文件

從光碟中獲取,C:\Example\Data\Geodata\JJT)。該文件也可以通過arcgis軟體從全國各區縣地圖中選擇生成。
(2)採用R語言建立地理加權回歸模型
第一步,載入如下程序包,代碼如下:
library(spgwr)
第二步,導入所需的數據,代碼如下:
hData <- read.csv("C: /Example/Data/7.3WGR/地區匯總.csv ")#導入發病率和影響因素的數據
dbf <- read.dbf("C: /Example/Data/Ge

odata /JJT.dbf")#導入地圖的數據(dbf格式)
第三步,將導入的兩組數據合並,代碼如下:
Data <- merge(hData,dbf, by.x="code" , by.y = "CNTY_CODE" , all.x =T)
第四步,確定帶寬,採用gwr.sel函數。所使用的參數如下:
formula:模型公式,用於指出因變數與自變數;
data:自變數與因變數取值的數據集;
coords:代表空間觀測值位置的坐標矩陣。

代碼如下:
col.bw <- gwr.sel(rate ~ PopuDen + PerGdp+precp+relHum+sunShn+wndspd, data=data, coords=cbind(data$x, data$y)) #利用交叉驗證選擇最優帶寬
第五步,生成地理加權回歸模型,採用gwr函數,使用的各參數意義如下:
formula:模型公式,用於指出因變數與自變數;
data:自變數與因變數取值的數據集;
coords:代表空間觀測值位置的坐標矩陣;
第 10 頁
bandwidth:帶寬,由上步gwr.sel生成;
gweight:不指定時,默認使用高斯函數確定權重矩陣;
hatmatrix:如果為TRUE,帽子矩陣作為結果的一部分返回。
代碼如下:
col.gauss <- gwr(rate ~ PopuDen + PerGdp+precp+relHum+sunShn+wndspd, data=data, coords=cbind(data$x, data$y), bandwidth=col.bw, hatmatrix=TRUE)
col.gauss
此外,地理加權回歸還經常使用bi-square權函數,該方法和Gauss權函數方法相似,這里只將實現代碼列出,代碼如下:
col.d <- gwr.sel(rate ~ PopuDen + PerGdp+precp+relHum+sunShn+wndspd, data=data, coords=cbind(data$x, data$y), gweight=gwr.bisquare) #確定帶寬
col.bisq <- gwr(rate ~ PopuDen + PerGdp+precp+relHum+sunShn+wndspd, data=data, coords=cbind(data$x, data$y), bandwidth=col.d, gweight=gwr.bisquare, hatmatrix=T) #建立地理加權回歸模型
第 12 頁
col.bisq #結果展示
(3)結果分析
建立的地理加權回歸截距和系數統計如表 75所示:
表 75 加權回歸系數統計表
變數
最小
四分之一分位數
中位數
四分之三分位數
最大值
全局
截距
-3478.00
-2391.00
896.50
4100.00
11420.00
1223.24
PopuDen
-0.05
-0.04
-0.04
-0.03
0.01
-0.04
PerGdp
-191700.00
-106600.00
-24080.00
-1769.00
44410.00
-37167.70
precp
-0.68
-0.34
-0.26
0.28
2.29
-0.08
relHum
-133.90
-72.10
-21.84
32.26
52.46
-31.49
sunShn
-16.88
0.50
0.84
1.45
2.94
0.66
wndspd
-91.81
357.90
625.00
667.20
874.70
775.70

從計算結果可以看出,由於地理加權回歸得出了影響因素在每個地區的影響系數,各個因素對每個地區的影響程度並不相同,若系數的變化范圍較大,說明該影響因素總體上影響程度有很大的不穩定性,若系數的變化范圍較小,說明該影響因素總體上影響比較穩定。從該案例可以看出,當月人均國內生產總值對疾病的發病率影響最大,並且在大部分地區呈負相關關系,即當月人均國內生產總值越高,疾病發病率越低,此外該變數的系數變化范圍十分大,說明該因素在不同地區的影響程度有很大差別,具有不穩定性。其次,風速對該病的發病率影響也較大,但風速與該病的
第 14 頁
發病率大部分呈正相關,即風速越大,該病的發病率越大,可以推斷該病可以通過空間傳染。在6個影響因素中人口密度對疾病的發病率影響最低。
地理加權回歸模型的R2為0.47,即該模型能解釋疾病發病率總變異的47%,比全局普通線性回歸的R2(0.23)大一倍。因此對於存在空間相關性的變數,應該使用地理加權回歸進行計算。
空間回歸與地理加權回歸的比較:
空間回歸與地理加權回歸都是在經典的回歸模型上考慮事物的空間屬性,從而發展出來的。
空間回歸通常只考慮空間相關性,而地

理加權回歸同時考慮了空間相關性與異質性。
從本質上說,兩種模型考慮空間相關性的角度也不同。空間回歸模型實質是考慮值的空間相關性。而地理加權回歸模型考慮的是數量關系或規律的空間相關性。
與只考慮空間相關性的空間回歸模型相比,同時考慮空間相關性與異質性的地理加權回歸模型顯然考慮得更為細致。但是地理加權回歸模型的求解更為復雜,且結果更難解讀。比如需要逐個解讀n個回歸方程。這意味著通過地理加權回歸較難掌握全局的規律。因此,空間回歸模型更善於刻畫全局規律。

Ⅵ 地理加權回歸需要數據標准化嗎

地理加權回歸是一種探索空間非平穩性的方法。空間非平穩性是指簡單的「全局」回歸模型不能充分解釋一個地理區域內某些變數之間的關系的一種情況。相反,模型的性質應該隨著空間的變化而改變,以反映數據中的結構。例如,在一個地理區域內,與風險因素相關的疾病風險是否保持不變,還是在該區域內的某些點這種關系更強。

Brunsdon等人(1996)開發了地理加權回歸,試圖通過校準多元回歸模型來捕捉這種空間變化,該模型允許變數在空間的不同點之間存在不同的關系。

簡介

地理加權回歸的基本思想是,在數據中的每一點擬合一個回歸模型,根據距離這一點的函數加權所有觀測值。這與這樣一種觀點相一致,即在回歸集中的觀測點附近采樣的觀測結果比在更遠的觀測結果對該點的回歸參數有更大的影響。然後在定義的地理區域的每個點生成一組參數估計。然後可以使用GIS軟體繪制這些參數估計數,以確定變數之間的關系在何處變化,從而提供一種有用的探索性分析形式。利用蒙特卡羅方法可以進行2個假設檢驗:

可以用全局模型而不是非平穩模型來描述數據。

個體回歸系數在地理空間上是否穩定。

我將介紹如何使用ado文件gwr和gwrgrid在Stata中實現這種方法,這兩個文件都將地理加權回歸應用於包含地理參考點的數據集。這兩個ado文件之間的唯一區別是,gwrgrid在地理區域上放置一個網格,並在每個網格中心執行回歸,而gwr在數據的每個點上執行回歸。

這些ado文件中的代碼是基於Brunsdon等人的論文和由Brunsdon等人編寫的FORTRAN程序,並且通過大量依賴Stata中現有的glm函數,已擴展到任何形式的廣義線性模型。

案例:將以Brunsdon等人給出的例子為例進行演示——這是1991年英國人口普查中有關汽車擁有率、社會階層和英格蘭東北部泰恩威爾郡男性失業率的一個數據集。

參考文獻:

Brunsdon, C., A. S. Fotheringham, and M. E. Charlton. 1996.

Geographically weighted regression: A method for exploring spatial nonstationarity. Geographical Analysis 28: 281–298.

操作應用

空間統計目前Stata進行地理加權回歸主要有命令spregxt以及gwr、gwrgrid等,本文主要簡介介紹 gwr、gwrgrid命令的基本應用。

gwr語法格式為:

Geographically weighted regression

----------------------------------

gwr depvar [varlist] [ ifexp] [ inrange] , east(varname)

north(varname) [options]

選項包括

saving(filename) dots reps( #) double eform family(familyname)

link(linkname) [ln]offset(varname) testreplace noconstant

nolog scale(x2|dev| #) disp(#) iterate(#) init(varname)

outfile(filename) comma wide bandwidth( #) mcsave(filename)

sample( #)

其中

familyname選項包括 gaussian | igaussian | binomial [varname| #] | poisson | nbinomial [#] | gamma,即核函數類型

linkname 選項包括如下內容:identify | log| logit | probit | cloglog | opower # | power # | nbinomial

test:要求測試帶寬的重要性。這測試了gwr模型對數據的描述是否明顯優於 全局的回歸模型。

sample( #)指定在帶寬校準過程中使用的觀測值百分比,默認為100%。這是特別對於大型數據集很有用,可以減少校準帶寬所需的時間。如果指定了該選項,將隨機抽取#%的觀測數據並用於校準過程。

bandwidth( #)允許用戶輸入帶寬值,並減少gwr運行所需的時間。

nolog抑制帶寬優化迭代的顯示。

iterate( #)指定在估計帶寬時允許的最大迭代次數。默認值為50。

save (filename)創建一個Stata數據文件,其中包含從計算gwr的每個點估算的參數。

outfile(filename)創建文本文件filename。

replace表示save和/或outfile指定的文件可以 被覆蓋。它也適用於mcsave選項。

reps( #)指定要執行的蒙特卡羅模擬的數量。默認值為1000。

操作案例:

gwr cars class unemp, east(easting) north(northing) test

gwr flag class unemp, east(east) north(north) fam(binomial) link(logit)

gwrgrid y x1, east(east) north(north) fam(b) link(l) square(10) samp(25)

結果為:



. gwr cars class unemp, east(easting) north(northing) test

Global Model

Source | SS df MS Number of obs = 120

-------------+---------------------------------- F(2, 117) = 287.17

Model | 4.51965851 2 2.25982925 Prob > F = 0.0000

Resial | .920700696 117 .007869237 R-squared = 0.8308

-------------+---------------------------------- Adj R-squared = 0.8279

Total | 5.4403592 119 .045717304 Root MSE = .08871

------------------------------------------------------------------------------

cars | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

class | .0188073 .0033449 5.62 0.000 .0121829 .0254316

unemp | -.0182798 .0011238 -16.27 0.000 -.0205054 -.0160543

_cons | .8847704 .0288569 30.66 0.000 .8276208 .94192

Ⅶ 求教:地理加權回歸做出來結果(GWR)怎麼檢驗

SAM軟體可以做GWR模型也可以檢驗。輸入多個變數不能計算,估計是因為你的數據有問題。但是把那個有問題的數據刪除了就可以計算。GWR缺少統一的統計推斷框架。不同區位回歸系數之間的依賴性也沒有在模型中說明。因此,GWR中標准誤是近似的。這是由於不同區位參數估計中,重復使用了數據;還因為應用這些數據線估計了帶寬,然後估計回歸系數。求教:地理加權回歸做出來結果(GWR)怎麼檢驗

Ⅷ 求助用matlab怎麼做地理加權回歸

地理加權回歸(Geographically Weighted Regression,簡稱GWR),由英國Newcastle大學地理統計學家A.S Fortheringham及其同事基於空間變系數回歸模型並利用局部多項式光滑的思想提出的模型。模型公式如下:
其中(yi;xi1,xi2,…,xip)為在地理位置(ui,vi)處的因變數y和自變數x1,x2,…,xp的觀測值(i=1,2,…,n).βj(ui,vi)(j=0,1,…,p)為觀測點(ui,vi)處的未知參數,它是(ui,vi)的未知函,εi(i=1,2,…,n)為獨立同分布的隨機誤差,通常假定其服從N(0,σ2).

Ⅸ 地理加權回歸是怎麼一回事(GWR)

1 http://ke..com/view/1189359.html?tp=0_00
2 http://www.cqvip.com/qk/91153A/200803/27235808.html
3 http://www.pinggu.org/bbs/dispbbs.asp?boardid=64&ID=213568
他是空間經濟計量學的一個模型
D.P.McMillen和J.F.McDonald(1997),C.Brunsdon,A.S.Fotheringham;MartinCharlton(1996),提出地理加權回歸模型(簡稱GWR模型)。
軟體:matlab,gauss均可,只是需要相關檢驗的時候,需要自己編程

Ⅹ 地理加權回歸

這些都是統計分布的特徵參數。min就是最小值,max是最大值,mean是平均值,median是中位數,1st quantile是第一分位數,就是排名前25%對應的樣本值,3nd quantile是第三分位數,也就是前75%對應的樣本值。

閱讀全文

與地理加權回歸多少年數據相關的資料

熱點內容
word中化學式的數字怎麼打出來 瀏覽:734
乙酸乙酯化學式怎麼算 瀏覽:1397
沈陽初中的數學是什麼版本的 瀏覽:1343
華為手機家人共享如何查看地理位置 瀏覽:1036
一氧化碳還原氧化鋁化學方程式怎麼配平 瀏覽:877
數學c什麼意思是什麼意思是什麼 瀏覽:1401
中考初中地理如何補 瀏覽:1290
360瀏覽器歷史在哪裡下載迅雷下載 瀏覽:693
數學奧數卡怎麼辦 瀏覽:1380
如何回答地理是什麼 瀏覽:1014
win7如何刪除電腦文件瀏覽歷史 瀏覽:1047
大學物理實驗干什麼用的到 瀏覽:1478
二年級上冊數學框框怎麼填 瀏覽:1691
西安瑞禧生物科技有限公司怎麼樣 瀏覽:947
武大的分析化學怎麼樣 瀏覽:1241
ige電化學發光偏高怎麼辦 瀏覽:1330
學而思初中英語和語文怎麼樣 瀏覽:1641
下列哪個水飛薊素化學結構 瀏覽:1418
化學理學哪些專業好 瀏覽:1479
數學中的棱的意思是什麼 瀏覽:1050