❶ 01空間權重矩陣需要標准化么
01空間權重矩陣需要標准化。空間權重矩陣是反映個體在空間中依賴關系的矩陣。
❷ 反距離空間權重矩陣和地理距離空間權重矩陣有什麼區別
反距離空間權重矩陣和地理距離空間權重矩陣的區別:
1、反距離空間權重是最符合人們對空間關系認知的一種模型,也是所謂「地理學第一定律」最經典的解答:相互之間的距離越大,權重就越小。帆敗氏而距離的越近,影響權重就越大。
2、地理距枯喊離空間權重矩陣是基於地理距離的空間權重矩陣,是空間權重矩陣的一種,態散以地理距離為加權。
❸ 參數估計空間權重矩陣要標准化嗎
要。參數空間是總體的碼伍分布函數裡面含有參數,參數能取的所有值成為參數空間陪岩,空間權重遲亂或矩陣要標准化。根據地理學第一定律,任何事物都是緊密相連的,只不過越相鄰的事物連接更緊密,而空間權重矩陣即可描述事物間的關聯程度。
❹ 什麼是權重矩陣
what kind of weight matrix you want?
like you want to use it to do weight least square?
❺ 權值矩陣是什麼意思
權值矩陣:長方陣列排列的復數或實數集合加權平均數中的每個數的頻數。
矩陣(Matrix)是一個按照長方陣列排列的復數或實數集合,最早來自於方程組的系數及常數所構成的方陣。這一概念由19世紀英國數學家凱利首先提出。
在數學領域,權值指加權平均數中的每個數的頻數,也稱為權數或權重。
矩陣是高等代數學中的常見工具,也常見於統計分析等應用數學學科中。在物理學中,矩陣歷配於電路學、力學、光學和量子物理中都有應用;計算機科學中,三維動畫製作也需要用到緩漏矩陣。
矩陣的運算是數值分析領域的重要問題。將矩陣分解為簡單矩陣的組合可以在理論和實際應用上簡化矩陣的運算。對一些應用廣泛而形式特殊的矩陣,例如稀疏矩陣和准對角矩陣,有特定的快速肢哪指運算演算法。關於矩陣相關理論的發展和應用,請參考矩陣理論。在天體物理、量子力學等領域,也會出現無窮維的矩陣,是矩陣的一種推廣。
❻ 空間分析中權重矩陣的缺點是什麼
近年來,國內外學者越來越關注空間權重矩陣的設定方法研究,其原因主要有兩點:其一,空間計量經濟學高速發展並不斷完善,彌補了傳統計量經濟忽視數據間空間依賴性和空間異質性的缺陷;其二,空間權重矩陣可量化觀測個體間的空間位置關系,是現實數據到空間計量模型的映射。目前,學術界有關空間權重矩陣的研究多集中於設定方法的創新以及不同設定結果對模型參數的影響兩方面。在空間計量經濟研究中,空間權重矩陣的選擇至關重要。然而,研究者們對於如何正確選擇空間權重矩陣並未達成共識。本文嘗試基於鄰接關系和距離函數對外生構建的空間權重矩陣進行分類,梳理各種權重矩陣的縱向演化關系並對比多種設定方法的適用范圍和優缺點,以期為研究者設定空間權重矩陣提供理論依據和參考。
一、空間權重矩陣的基本理論
Tobler地理學第一定律指出:「任何事物皆與其他事物相關,且鄰近事物之間的相關性更強。」由於地理鄰近關系、經濟往來、文化淵源等因素的影響,計量經濟模型中的許多變數之間均存在不可忽視的相關關系,即空間依賴性(Spatial Dependence)。
(一)空間權重矩陣的基本設定
空間權重矩陣是空間建模(SpatialModeling)的重要組成部分,也是量化觀測值之間空間依賴關系的重要工具,通常表現為如下所示的n階非負矩陣W:
圖片
其中,n為空間單元的個數;Wij表示區域i和區域j之間的空間依賴關系,權重值越大,則區域間的空間依賴性越強。最初,空間權重矩陣是基於地理鄰接關系構建的。因此,W矩陣主對角線上的元素為零,表示各區域與自身不相鄰,即Wij=0;同時,如果區域i和區域j是鄰接的,那麼區域j和區域i必然也是鄰接的,即Wij=Wji,故由此形成的空間權重矩陣是對稱的。
空間權重矩陣的設定須滿足一個原則:即空間依賴性隨著「距離」的增加而衰減。這里的「距離」既可以指真實的地理距離,也可以指經濟意義上合作關系的遠近,甚至是社會意義上人際關系的親疏。
Stetzer指出在樣本容量較小且數據間存在自相關的情況下,空間權重矩陣的正確設定尤為重要。Florax和Rey認為空間權重矩陣與樣本數據真實的空間結構吻合性越高,模型的擬合度越好,解釋能力越強。由於模型的估計精度在很大程度上取決於空間權重矩陣的設定形式,因此,如何正確認識並選擇空間權重矩陣十分重要。
(二)滑敬空間權重矩陣的研究進展
自空間計量經濟學發展之初,國內外學者有關空間缺御權重矩陣設定方法的理論探索和實證研究就未曾停止。依據信息來源的不同,可將空間權重矩陣的設定方法分為三類:一是外生構建法,二是數據生成法,三是估計法。
外生構建法認為空間權重矩陣產生於先驗結構,且對於任何系統而言都是外生的。此處的先驗結構多是基於地理鄰接關系或距離理論產生的,它既包括簡單的二元鄰接矩陣,又包括突出地理距離作用的K-近鄰權重矩陣、閥值權重矩陣,還包括考慮空間單元大小和形狀的Dacey矩陣、Cliff-Ord矩陣等。例如,劉仲剛等利用閾值法和K-近鄰法構建了常州市8367個地價樣本點間的空間權重矩陣。除地理關系外,經濟和社會因素也是這種先驗結構的來源之一。比如,Conley和Ligon使用國家間的貨物運輸費用和客運機票價格構建了經濟距離空間權重矩陣,以此來衡量由要素流動成本伏讓岩決定的共有市場邊界的規模。
數據生成法是通過已知的數據構建未知的空間權重矩陣,矩陣的內生性是其與外生構建法的本質區別。Getis和Aldstadt通過本地數據集構建的本地統計模型(LSM)在AIC、空間自回歸系數ρ和模型殘差項三方面比幾何權重矩陣和地理統計權重矩陣表現得更好。任英華和游萬海提出利用數據驅動方式選擇與數據特徵最符合的空間權重矩陣,以減少權重矩陣設定的任意性。
由於待估計的權重矩陣元素較多,因而估計法存在計算量大等諸多限制。例如,Bhattacharjee和Jensen-Butler在利用空間誤差模型研究英國的區域住房需求問題時,基於空間自協方差的一致估計量提出了一種估計空間權重矩陣的非參數方法。但是,矩陣的對稱性限制使其脫離了真實的空間結構,最終影響了模型的估計精度。
結合既有研究可發現,外生構建法由於可操作性強、方法成熟且計算量較另兩種設定方法更小,因此在空間計量的理論和實證研究中應用最廣。鑒於此,本文著重探討外生法構建的空間權重矩陣。
二、空間權重矩陣的設定方法
如前所述,外生構建的空間權重矩陣多基於地理鄰接關系或空間距離設定權重;除地理關系的考量外,還可以通過經濟距離進行權數的設定。基於此,本文將空間權重矩陣基於鄰接關系和距離函數進行了區分,見圖1。
圖片
(一)基於鄰接關系的空間權重矩陣
該類矩陣是描述空間單元之間依賴關系的一種較為簡單的形式。本文通過構建如下所示的3×3網格定義鄰接性:
圖片
在上面的網格中,每個數字代表一個區域,並假定其相對位置即為真實的地理分布結構。此時,區域之間的鄰接關系應如何理解?應用中使用較多的是「車步」鄰接(Rook Contiguity)的概念,即如果區域i和區域j擁有共同的邊,則認為兩者存在鄰接關系,空間權重矩陣中的元素Wij=1;否則,Wij=0。在上例中,對於區域5而言,W52=W54=W56=W58=1,其餘元素為零(不考慮對稱的情況)。另一與此對應的情形是「象步」鄰接(Bishop Contiguity),它的含義是如果區域i和區域j擁有共同的頂點但無共同的邊,則認為兩者是鄰接的。此時,W51=W53=W57=W59=1,其餘元素為零。
以上是鄰接關系的兩種基本定義,Kelejian和Robisson對該問題進行了詳細的討論②。實際應用中,應結合具體問題選擇適當的定義方法。例如,假定區域i為居民區,區域j為工作區,且兩者之間通過一條大型公路形成頂點鄰接。顯然,「象步」鄰接更適用於描述這種情形下的鄰接關系。
基於鄰接關系的空間權重矩陣又可進一步分為一階鄰接矩陣(First-order Contiguity Matrix)和高階鄰接矩陣(Higher-order Contiguity Matrix)。
1.一階鄰接矩陣
作為最簡單的二元鄰接矩陣(BinaryContiguity Matrix),一階鄰接矩陣只考慮直接相鄰的空間單元之間的依賴關系,並假定稍遠的空間實體之間不存在相互影響,這顯然與多數情況並不相符。為此,學者們進一步提出了高階鄰接矩陣。
2.高階鄰接矩陣
空間效應除了產生於直接鄰接的空間實體間,也隨著時間的推移擴散到鄰近的區域,繼而擴散至更多的空間單元。這種由鄰域向鄰域不斷擴散的空間效應,可以從「空間滯後」的角度來理解。這是一個與時間滯後相類似的概念,但又更為復雜。
在規則的網格中,「空間滯後」意味著空間單元之間相隔多個單位距離。例如,在前文的3×3網格中,區域1和區域3之間存在二階「車步」鄰接關系,區域1和區域9則為二階「象步」鄰接關系。實際應用中,由於規則網格的缺失,此時的空間滯後意味著對一個鄰近地區的最初影響隨著時間的推移擴散至更多的地區。
無論是一階還是高階鄰接矩陣,都只能通過1或0來簡潔地表示區域間是否存在依賴關系,因此又被稱為二元鄰接或0-1矩陣。相對其他更為復雜的權重矩陣而言,二元鄰接矩陣的優點是簡單直觀、設定方便且計算量小,但同時存在以下幾方面限制:第一,描述能力有限且靈活性差。二元鄰接矩陣不能描述通過社會、經濟往來而建立起密切聯系的不相鄰空間單元之間的相互關系。同時,由於地理鄰接關系的可變性小,基於此建立的鄰接矩陣靈活性差,難以反映經濟關系的變化。第二,具有拓撲不變性(Topological Invariance)。無論空間單元的面積和形狀如何,只要它們之間存在邊鄰接或頂點鄰接,就認為存在鄰接關系,且權重值均為1。因此,不同地理結構的空間實體往往表現為相同的鄰接矩陣,拓撲轉換不敏感。第三,不能描述離散點區域的鄰接關系。鄰接矩陣只能通過共有邊界或頂點來定義多邊形區域的鄰接關系。當空間單元由離散點構成時,這種方法就失效了。在此基礎上,研究者們把距離函數引入到權重矩陣中,一定程度上克服了二元鄰接矩陣的種種缺陷。
(二)基於距離函數的空間權重矩陣
早期,學者多採用歐式距離(EuclideanDistance)或曼哈頓距離(ManhattanDistance)來計算空間單元間的地理距離。
1.地理距離矩陣
(1)二元地理距離矩陣
通常,我們選取閾值距離來表示一定的距離范圍。與二元鄰接矩陣不同的是,閾值地理距離矩陣通過人為設定的距離將並不鄰接的空間單元也納入了考量空間依賴關系的框架中,突破了鄰接區域的束縛。但其簡單的二元思想還不足以描述復雜的經濟地理關系。由此,產生了基於地理距離函數的空間權重矩陣。
(2)地理距離函數矩陣
與之前討論過的矩陣不同,基於距離函數構造的空間權重矩陣並不拘泥於特定的形式。本文列舉兩個較為常見的地理距離函數矩陣。一是Cliff-Ord矩陣。1973年,Cliff和Ord為解決簡單鄰接矩陣的拓撲不變性問題,把空間單元的共有邊界長度引入到距離函數矩陣中,完善了莫蘭指數和吉瑞指數等空間自相關統計量的計算。二是K-近鄰矩陣。該矩陣是基於K-近鄰法(K-Nearest Neighbor,KNN)構建的,除可以用來構建空間權重矩陣外,還可作為非參數識別方法解決數據分類等問題。
2.經濟距離矩陣
真實的地理距離矩陣雖然直觀、可信,但不足以描述空間單元間復雜的經濟、社會關系。區域單元的經濟發展水平、居民的文化素質、社會環境甚至風俗習慣等諸多因素都會使空間單元之間產生交互影響,因此討論經濟因素是十分必要的。為此,研究者們根據區域間的資本流動、人口遷移、商品貿易、通訊通勤量等社會經濟指標,設計出了更符合空間經濟關系的經濟距離權重矩陣,其一是簡單的經濟距離矩陣,其二則是協動空間權重矩陣。
(三)基於多種設定方法的空間權重矩陣
空間權重矩陣的設定方法繁多,但大多是在鄰接關系和距離函數這兩者的基礎上構造的。無論是簡單的二元矩陣還是復雜的函數矩陣,其設定的初衷都是盡可能真實、全面地刻畫空間依賴關系。在實際應用中,研究者常使用鄰接矩陣和距離矩陣、地理距離矩陣和經濟距離矩陣等多種設定方法的交叉來構建更符合研究現實的空間權重矩陣,包括Dacey矩陣、一般可達性矩陣。
(四)基於離散點的空間權重矩陣
鄰接矩陣由於只能通過共有邊界或頂點定義鄰接關系,因而無法描述離散點之間的空間依賴關系。而Cliff-Ord矩陣和Dacey矩陣由於牽涉共有邊界長度,也只能處理多邊形區域。如此一來,對離散點空間單元的處理成了一個難題。
本文接下來將介紹利用Delaunay三角網生成Voronoi圖的方法,可有效劃分離散點空間單元的影響區域,並在MATLAB軟體中實現離散點空間權重矩陣的構建。
1.Delaunay三角網和Voronoi圖
從空間中的離散點出發,根據各點之間的相對位置關系,Delaunay三角網可以將整體空間剖分為無數個三角形(每個三角形盡量滿足等邊特性)。如果兩個離散點同屬一個Delaunay三角形的兩個頂點,則認為兩者之間存在鄰接關系;如果兩個離散點需經過k個Delaunay三角形連通,則稱兩者之間存在k階鄰近關系。在此基礎上,可進一步構造Voronoi圖。
Voronoi圖又稱泰森多邊形,它通過在每個Delaunay三角形的各邊做垂直平分線,得到一組由連續兩鄰點的垂直平分線構成的多邊形。如此構成的不規則多邊形具有以下三個特點:一是每個泰森多邊形內有且只有一個離散點;二是泰森多邊形內的點到相應離散點的距離最近;三是位於泰森多邊形邊上的點到其兩邊的離散點距離相等。
此時,多邊形的邊數即為相鄰離散點空間單元的個數。需要注意的是,這種方法最大的缺陷是多邊形區域的邊界長度和面積的確定具有一定的主觀性。這也使得最終構造的離散點空間權重矩陣與真實的空間關系有時不能很好地契合。
2.應用案例
我們使用上述方法得到了中國31個省份的相鄰情況。首先,以31個省會城市或直轄市的經緯度坐標作為離散點集。其次,使用