❶ 地理加權回歸需要考慮多重共線性嗎
需要。1、描述
執行「地理加權回歸 (GWR)」,這是一種用於建模空間變化關系的線性回歸的局部形式。
2、一圖讀懂GWR
GWR 為局部回歸模型。系數可以變化。
3、使用
GWR 為數據集中的各要素構建了一個獨立的方程,用於將各目標要素的帶寬范圍內的要素的因變數和解釋變數進行合並。帶寬的形狀和范圍取決於用戶輸入的核類型、帶寬方法、距離以及相鄰要素數等參數,但也存在一條限制:如果相鄰要素的數目超過 1000,則僅將最相鄰的 1000 個要素合並到各個局部方程中。
GWR 通常被要求用於處理包含數百個要素的數據集,以便獲得最佳結果, GWR 不適用於小型數據集。而且,此工具不能用於處理多點數據。
註:GWR 工具會生成各種輸出。右鍵單擊結果窗口中的消息條目,然後選擇視圖,將顯示 GWR 工具的執行匯總報告。
此外,GWR 工具也會生成一個輸出要素類和一個包含了工具執行匯總報告診斷值的表。會自動將此表以輸出要素類名加上 _supp 作為後綴的形式進行命名。輸出要素類會自動添加至內容列表中,並會對模型殘差應用熱/冷渲染方案。在解釋 GWR 結果中提供了有關各輸出的完整說明。_supp 文件的創建位置始終與輸出要素類相同,除非輸出要素類被創建在一個要素數據集內。當輸出要素類位於要素數據集內時,_supp 表則會創建在該要素數據集所在的地理資料庫中。
建議您使用投影數據。這一點在距離成為分析的一部分時尤其重要,因為在您針對核類型選擇固定時,會對 GWR 使用投影數據。建議您使用投影坐標系(而非地理坐標系)對數據進行投影。
由 GWR 工具執行的某些計算會利用多個 CPU 以提高性能,並會自動使用多達 8 條線程/CPU 進行處理。
應該始終從普通最小二乘法 (OLS) 回歸開始回歸分析。首先獲得一個正確指定的 OLS 模型,然後使用同樣的解釋變數運行 GWR(不包括表示不同空間組織的任何「啞元」解釋變數)。
因變數和解釋變數應該是包含各種值的數值型欄位。線性回歸方法(如 GWR)不適於預測二進制結果(例如,因變數的所有值不是 1 就是 0)。
如果在 GWR 模型中包含名目數據或分類數據,則需謹慎操作。在類別出現空間聚類的地方,存在局部多重共線性的風險。GWR 輸出中包含的條件數指明了局部共線性何時會導致問題(條件數小於零、大於 30 或設置為「空」)。存在局部多重共線性的結果是不穩定的。
請勿使用人工解釋變數來表示 GWR 模型中的不同空間組織(例如,向城鎮中心外的人口普查區賦予值 1,而向其他區域賦予值 0)。由於 GWR 允許解釋變數系數發生變化,這些空間組織解釋變數並不必要,並且如果包含了這些變數,則會產生局部多重共線性問題。
要更好地了解解釋變數系數當中的區域變化,請檢查由 GWR 創建的可選柵格系數表面。將在系數柵格工作空間中創建這些柵格表面。對於面數據,您可以對輸出要素類中的每個系數欄位使用漸變色彩或由冷色到暖色的渲染以檢查整個研究區域的更改。
通過提供預測位置要素類(通常,此要素類與輸入要素類相同)、預測解釋變數和輸出預測要素類,您可以使用 GWR 進行預測。在用來校正回歸模型的欄位(解釋變數欄位的輸入值)與用來預測的欄位(預測解釋變數欄位的輸入值)之間必須是一對一的對應關系。這些變數的順序必須相同。例如,假設您當前正針對交通事故構建一個有關速度限制、道路條件、車道數量以及汽車數量的函數。通過創建一個具有修正後的速度限制和道路條件的新變數,您可以預測更改速度限制或改善道路狀況可能對交通事故產生的影響。現有變數將用於校正回歸模型,並用作解釋變數的參數。修正的變數將用於預測,並可作為預測解釋變數。
如果提供了預測位置要素類,但未指定預測解釋變數,則僅使用各位置的已計算系數創建輸出預測要素類(不進行任何預測)。
如果回歸模型缺少關鍵解釋變數,則會導致回歸模型的指定錯誤。如果回歸殘差的空間自相關具有統計學上的顯著性,或者在一個或多個解釋變數的系數當中發生了非期望的空間變化,則表明錯誤指定了您的模型。您應該盡一切努力(例如,通過 OLS 殘差分析和 GWR 系數變化分析)來查找這些丟失的關鍵變數,以便在模型中包含這些變數。
時刻關註解釋變數的不穩定性是否會出現問題。例如,假設您正將特殊植物種類的密度構建為若干變數(包括 ASPECT)的函數。如果發現在整個研究區域中 ASPECT 變數的系數發生了更改,則可能要查看是否有缺少關鍵解釋變數的跡象(例如,可能存在大量競爭植被)。應該盡一切努力將所有關鍵解釋變數包含到回歸模型中。
為帶寬方法參數選擇 AICc(更正後的 Akaike 信息准則)或 CV(交叉驗證)時,GWR 將查找最佳距離(對於固定核)或最佳相鄰要素的數目(對於自適應核)。但是,局部多重共線性問題將會阻止 AICc 和 CV 帶寬方法解析最佳距離/相鄰要素的數目。如果出現表示模型設計存在嚴重問題的錯誤,則請嘗試指定特殊距離或相鄰要素的數目, 然後檢查輸出要素類中的條件數,以查看哪些要素與局部共線性問題相關聯。
嚴重模型設計錯誤或用於表明局部方程未包含足夠多相鄰要素的錯誤,通常表示回歸存在全局或局部多重共線性問題。要確定出現問題的位置,請使用 OLS 運行模型,然後檢查每個解釋變數的 VIF 值。如果某些 VIF 值較大(例如,大於 7.5),則全局多重共線性會阻止 GWR 解決問題。但是,更有可能是局部多重共線性所導致的問題。請嘗試為各解釋變數創建一個專題地圖。如果在地圖上出現相同值的空間聚類,考慮將這些變數從模型中移除,或將這些變數與其他解釋變數合並以便加大值的變化性。例如,如果要對房屋價格進行建模且具有卧室和浴室兩個變數,則可能需要將其合並以加大值的變化性,或將其表示為浴室/卧室的建築面積。在構造 GWR 模型時,要避免使用空間組織啞元變數、空間聚類名目或數值變數或者幾乎不可能具有值的變數。
GWR 是一種線性模型,其前提條件與 OLS 相同。要確保正確指定您的 GWR 模型,請參閱回歸分析基礎知識中的回歸模型失效方式部分。
❷ 地理加權回歸
這些都是統計分布的特徵參數。min就是最小值,max是最大值,mean是平均值,median是中位數,1st quantile是第一分位數,就是排名前25%對應的樣本值,3nd quantile是第三分位數,也就是前75%對應的樣本值。
❸ 如何運用Matlab進行地理加權回歸分析
地理加權回歸,由英國Newcastle大學地理統計學家A.S Fortheringham及其同事基於空間變系數回歸模型並利用局部多項式光滑的思想提出的模型。模型公式如下:
其中(yi;xi1,xi2,…,xip)為在地理位置(ui,vi)處的因變數y和自變數x1,x2,…,xp的觀測值(i=1,2,…,n).βj(ui,vi)(j=0,1,…,p)為觀測點(ui,vi)處的未知參數,它是(ui,vi)的未知函,εi(i=1,2,…,n)為獨立同分布的隨機誤差,通常假定其服從N(0,σ2).