導航:首頁 > 數字科學 > 數學標准化如何構造

數學標准化如何構造

發布時間:2022-09-12 23:37:49

『壹』 幾種常見的數據標准化的方法總結!

一、標准化

在進行數據分析時,數據具有單位是非常常見的,比如說GDP可以以億作為單元,也可以以百萬作為單位,那麼此時就會出現由於單位問題導致的數字大小問題;這種情況對於分析可能產生影響,因此需要對其進行處理,但是處理的前提是不能失去數字的相對意義,即之前數字越大代表GDP越高,處理後的數據也不能失去這個特性。

也或者計算距離,數字1和2的距離可以直接相減得到距離值為1; 另外一組數據為10000和20000,兩個數字直接相減得到距離值為10000。如果說距離數字越大代表距離越遠,那麼明顯的10000大於1,但這種情況僅僅是由於數據單位導致的,而並非實際希望如何。類似這些情況要進行數據分析之前,有時候需要先將數據標准化,數據的標准化就是通過一定的數學變換方式,對原始數據進行一定的轉換,使原始數據轉換為無量綱化指標測評值,即各指標值都處於同一個數量級別上,這樣可以進行綜合分析和比較。

二、幾種數據標准化的方法

(1)標准化

標准化 是一種最為常見的量綱化處理方式。其計算公式為:


此種處理方式會讓數據呈現出一種特徵,即數據的平均值一定為0,標准差一定是1。針對數據進行了壓縮大小處理,同時還讓數據具有特殊特徵(平均值為0標准差為1)。

在很多研究演算法中均有使用此種處理,比如聚類分析前一般需要進行標准化處理,也或者因子分析時默認會對數據標准化處理。

比如聚類分析時,其內部演算法原理在於距離大小來衡量數據間的聚集關系,因此默認SPSSAU會選中進行標准化處理。

除此之外,還有一些特殊的研究方法,比如社會學類進行中介作用,或者調節作用研究時,也可能會對數據進行標准化處理。

(2) 歸一化

歸一化 的目的是讓數據壓縮在【0,1】范圍內,包括兩個邊界數字0和數字1;其計算公式為:

當某數據剛好為最小值時,則歸一化後為0;如果數據剛好為最大值時,則歸一化後為1。

歸一化也是一種常見的量綱處理方式,可以讓所有的數據均壓縮在【0,1】范圍內,讓數據之間的數理單位保持一致。

(3)中心化

中心化 這種量綱處理方式可能在社會科學類研究中使用較多,比如進行中介作用,或者調節作用研究。其計算公式為:x-μ。

此種處理方式會讓數據呈現出一種特徵,即數據的平均值一定為0。針對數據進行了壓縮大小處理,同時還讓數據具有特殊特徵(平均值為0)。

平均值為0是一種特殊情況,比如在社會學研究中就偏好此種量綱處理方式,調節作用研究時可能會進行簡單斜率分析,那麼平均值為0表示中間狀態,平均值加上一個標准差表示高水平狀態;也或者平均值減一個標准差表示低水平狀態。

三、使用SPSSAU進行標准化操作

以上提到的幾種數據標准化處理的方法,在 SPSSAU 中的【數據處理】->【生成變數】都有提供,如圖所示:

不同的數據標准化的操作過程都是一樣的,以下以最常用的Z標准化來說明如何對數據進行標准化。

(1)案例數據

下圖是部分案例數據,希望對X變數和Y變數的數據進行標准化處理。

(2)上傳數據到SPSSAU


(3)標准化處理步驟

1、選中SPSSAU【數據處理】-【生成變數】


2、右側選項卡選擇標准化(S)

選中想要進行標准化的數據:


點擊【確認處理】,SPSSAU會生成新的進行標准化處理後的兩個變數,而非原始數據基礎上修改。


這樣就完成了對數據的標准化處理,得出標准化的數據後,就可以進行後續的分析了。

在實際研究時具體應該使用哪一種處理方式,其實並沒有固定的要求,而是結合實際情況或者實際研究進行。比如社會學類的中介作用和調節作用偏好於使用中心化或標准化這種處理方式;聚類分析或者因子分析等使用默認會使用標准化。



『貳』 請問范圍值怎麼進行標准化

在EXCEL中消除量綱,沒有現成的函數,要組合作用,步驟如下:
第一步:求出各變數(指標)的算術平均值(數學期望)xi和標准差si ;
第二步:進行標准化處理:
xij¢=(xij-xi)/si
其中:xij¢為標准化後的變數值;xij為實際變數值。
第三步:將逆指標前的正負號對調。
標准化後的變數值圍繞0上下波動,大於0說明高於平均水平,小於0說明低於平均水平

『叄』 數據標准化的幾種方法是什麼

方法一:規范化方法

也叫離差標准化,是對原始數據的線性變換,使結果映射到[0,1]區間。

方法二:正規化方法

這種方法基於原始數據的均值(mean)和標准差(standard deviation)進行數據的標准化。將A的原始值x使用z-score標准化到x』。
z-score標准化方法適用於屬性A的最大值和最小值未知的情況,或有超出取值范圍的離群數據的情況。
spss默認的標准化方法就是z-score標准化。
用Excel進行z-score標准化的方法:在Excel中沒有現成的函數,需要自己分步計算,其實標准化的公式很簡單。

步驟如下:
1.求出各變數(指標)的算術平均值(數學期望)xi和標准差si ;
2.進行標准化處理:
zij=(xij-xi)/si
其中:zij為標准化後的變數值;xij為實際變數值。
3.將逆指標前的正負號對調。
標准化後的變數值圍繞0上下波動,大於0說明高於平均水平,小於0說明低於平均水平。

『肆』 標准化的數學定義是什麼

標准化在統計學上即計算一組數據中各個數值的標准分數(standard
score),它是計算公式是:變數值與其平均數的離差除以標准差後的值,在你的這個例子里,Ai(i=1,2,3,4)標准化的計算方法就是:
(Ai-A的平均值)/A的標准差
標准化方法測量的是每個數據在改組數據中的相對位置,在對多個具有不同量綱的變數進行處理時,常常需要對各變數數值進行標准化處理。說通俗點就是,變數的單位不同,其絕對值無法比較,但通過標准化後就可以比較了。

『伍』 在數學中,什麼是中心化 標准化 歸一化

中心化:一組數據的每個值減去它們的均值
標准化:一組數據的每個值減去它們的均值再除以它們的標准差
歸一化:一組數據的每個值除以它們的標准差

不同類型的數據均值不同,方差也不同。
比如100米成績和馬拉松成績,沒法相互比較。
進行這種變換後便於比較,也方便製作指標。

『陸』 數據標准化的幾種方法

在數據分析之前,我們通常需要先將數據標准化(normalization),利用標准化後的數據進行數據分析。數據標准化也就是統計數據的指數化。數據標准化處理主要包括數據同趨化處理和無量綱化處理兩個方面。數據同趨化處理主要解決不同性質數據問題,對不同性質指標直接加總不能正確反映不同作用力的綜合結果,須先考慮改變逆指標數據性質,使所有指標對測評方案的作用力同趨化,再加總才能得出正確結果。數據無量綱化處理主要解決數據的可比性。數據標准化的方法有很多種,常用的有「最小—最大標准化」、「Z-score標准化」和「按小數定標標准化」等。經過上述標准化處理,原始數據均轉換為無量綱化指標測評值,即各指標值都處於同一個數量級別上,可以進行綜合測評分析。
一、Min-max 標准化
min-max標准化方法是對原始數據進行線性變換。設minA和maxA分別為屬性A的最小值和最大值,將A的一個原始值x通過min-max標准化映射成在區間[0,1]中的值x',其公式為:
新數據=(原數據-極小值)/(極大值-極小值)
二、z-score 標准化
這種方法基於原始數據的均值(mean)和標准差(standard deviation)進行數據的標准化。將A的原始值x使用z-score標准化到x'。
z-score標准化方法適用於屬性A的最大值和最小值未知的情況,或有超出取值范圍的離群數據的情況。
新數據=(原數據-均值)/標准差
spss默認的標准化方法就是z-score標准化。
用Excel進行z-score標准化的方法:在Excel中沒有現成的函數,需要自己分步計算,其實標准化的公式很簡單。步驟如下:1.求出各變數(指標)的算術平均值(數學期望)xi和標准差si ;2.進行標准化處理:zij=(xij-xi)/si其中:zij為標准化後的變數值;xij為實際變數值。3.將逆指標前的正負號對調。標准化後的變數值圍繞0上下波動,大於0說明高於平均水平,小於0說明低於平均水平。
三、Decimal scaling小數定標標准化
這種方法通過移動數據的小數點位置來進行標准化。小數點移動多少位取決於屬性A的取值中的最大絕對值。將屬性A的原始值x使用decimal scaling標准化到x'的計算方法是:
x'=x/(10^j)
其中,j是滿足條件的最小整數。
例如 假定A的值由-986到917,A的最大絕對值為986,為使用小數定標標准化,我們用1000(即,j=3)除以每個值,這樣,-986被規范化為-0.986。
注意,標准化會對原始數據做出改變,因此需要保存所使用的標准化方法的參數,以便對後續的數據進行統一的標准化。
除了上面提到的數據標准化外還有對數Logistic模式、模糊量化模式等等:
對數Logistic模式:新數據=1/(1+e^(-原數據))
模糊量化模式:新數據=1/2+1/2sin[派3.1415/(極大值-極小值)*(X-(極大值-極小值)/2) ] X為原數據

『柒』 標准化的數學定義是什麼

標准化在統計學上即計算一組數據中各個數值的標准分數(standard score),它是計算公式是:變數值與其平均數的離差除以標准差後的值,在你的這個例子里,Ai(i=1,2,3,4)標准化的計算方法就是:
(Ai-A的平均值)/A的標准差
標准化方法測量的是每個數據在改組數據中的相對位置,在對多個具有不同量綱的變數進行處理時,常常需要對各變數數值進行標准化處理。說通俗點就是,變數的單位不同,其絕對值無法比較,但通過標准化後就可以比較了。

閱讀全文

與數學標准化如何構造相關的資料

熱點內容
word中化學式的數字怎麼打出來 瀏覽:743
乙酸乙酯化學式怎麼算 瀏覽:1408
沈陽初中的數學是什麼版本的 瀏覽:1358
華為手機家人共享如何查看地理位置 瀏覽:1049
一氧化碳還原氧化鋁化學方程式怎麼配平 瀏覽:890
數學c什麼意思是什麼意思是什麼 瀏覽:1416
中考初中地理如何補 瀏覽:1307
360瀏覽器歷史在哪裡下載迅雷下載 瀏覽:706
數學奧數卡怎麼辦 瀏覽:1396
如何回答地理是什麼 瀏覽:1030
win7如何刪除電腦文件瀏覽歷史 瀏覽:1060
大學物理實驗干什麼用的到 瀏覽:1490
二年級上冊數學框框怎麼填 瀏覽:1707
西安瑞禧生物科技有限公司怎麼樣 瀏覽:988
武大的分析化學怎麼樣 瀏覽:1252
ige電化學發光偏高怎麼辦 瀏覽:1341
學而思初中英語和語文怎麼樣 瀏覽:1660
下列哪個水飛薊素化學結構 瀏覽:1427
化學理學哪些專業好 瀏覽:1490
數學中的棱的意思是什麼 瀏覽:1066