① 變異系數怎麼算啊
標准差除以平均值=變異系數
變異系數是衡量資料中各觀測值變異程度的另一個統計量。當進行兩個或多個資料變異程度的比較時,如果度量單位與平均數相同,可以直接利用標准差來比較。如果單位和(或)平均數不同時,比較其變異程度就不能採用標准差,而需採用標准差與平均數的比值(相對值)來比較。
比起標准差來,變異系數的好處是不需要參照數據的平均值。變異系數是一個無量綱量,因此在比較兩組量綱不同或均值不同的數據時,應該用變異系數而不是標准差來作為比較的參考。
(1)地球化學變異系數怎麼算擴展閱讀:
變異系數越小,變異程度越小。
原因:變異系數為不同單拍者位的跡拍幾個指標之間比較變異程度時的參考指標,變異系數越大,表示變異程度越大。
變異系數當需要比較兩組數據離散程度大小的襲州薯時候,如果兩來組數據的測量尺度相差太大,或者數據量綱的不同,直接使用標准差來進行比較不合適,此時就應當消除測量尺度和量綱的影響。
② 變異系數計算公式是怎樣的
變異系數是衡量資料中各觀測值變異程度的另一個統計量。當進行兩個或多個資料變異程度的比較時,如果度量單仔陪位與平均數相同,可以直接利念羨蠢用標准差來比較。如果單位和(或)平均數不同時,比派旁較其變異程度就不能採用標准差,而需採用標准差與平均數的比值(相對值)來比較。標准差與平均數的比值稱為變異系數,記為C·V。變異系數可以消除單位和(或)平均數不同對兩個或多個資料變異程度比較的影響。
變異系數的計算公式為:變異系數 C·V =( 標准偏差 SD / 平均值Mean )× 100%。
在進行數據統計分析時,如果變異系數大於15%,則要考慮該數據可能不正常,應該剔除。
③ 分析化學中變異系數怎麼算
分析化學中變異系數(cv),就是 相對標准偏差。
具體演算法要點是:漏團拍
1)有一組數據,例如,n=6個數據。按照公式,計算返羨出其算或敗術平均值(D),和標准偏差s 值;
2)計算變異系數:cv=s/D x100%
④ 變異系數的計算公式
變異系數的計算公式為:變異系數=(標准偏差÷平均值)×100%。變搭搜異系數,又稱「離散系數」,是概率分布離散程度的一個歸一化量度,其定義為標准差與平均值之渣枝歷比。
變異系數與極差、標准差和方差一樣,都是反映數據離散程度的絕對值,其數據大小不僅受到變數值離散程度的影響,還受到變數值平均水平大小的影響,一般來說,變數值平均水平高,其離散程度的測度值如搜越大,反之越小。在進行數據統計分析時,如果變異系數大於15%,則要考慮該數據有不正常的可能性,應當剔除。
⑤ 變異系數怎麼計算
變異系數C·V=(標准偏差SD/平均值Mean)×100%。
變異系數是概率分布離散程度的一個歸一化量度,其定義為標准差與平均值之比,變數值平均水平高。
在進行喊好數據統計分析時,如果變異系數大帶滲晌於15%,則要考慮該數據可能不正常,應蠢鋒該剔除,變異系數只在平均值不為零時有定義,而且一般適用於平均值大於零的情況。
⑥ 變異系數計算公式是什麼
變異系數的計算答帶公式為:變異系數 C·V =( 標准偏差 SD / 平均值Mean )× 100%變異系數只在平均值不為零時有戚鋒定義,而且一般適用於平均值大高舉晌於零的情況。變異系數也被稱為標准離差率或單位風險。
⑦ 地球化學參數統計
(一)統計參數的理論基礎
在進行地球化學統計時,一般採用2類統計參數:一類反映屬性數據集中特性,包括頻數、平均數、中數、眾數;另一類反映數據離散程度,包括極差、方差、標准差、變異系數等。其相應的數學模型如下所述(張文彤,2002;余建英等,2003)。
(1)頻數
將變數xi(i=1,2,…,n)按大小順序排列,並按一定的間距分組。變數在各組出現或發生的次數稱為頻數,一般用ƒi 表示。各組頻數與總頻數之比叫做頻率,按如下公式計算:
浙江省農業地質環境GIS設計與實現
根據大大改顫數定理,當n相當大時,頻率可近似地表示事件的概率。
計算出各組變數的頻率後,若以縱軸表示頻率,橫軸表示分組,就可做出頻率直方圖,用以表示事件發生的頻率和分布狀況。變數的頻數分析可以使人們非常清楚地了解變數值的分布情況,而在進行數理統計時,通常要求數據呈正態分布。因此,在針對地球化學元素的基準值統計之前,進行頻數分析可以展現區域內各個元素的數據分布狀態,符合正態分布的可以進行後續統計分析,不符合正態分布的要剔除異常值,使之符合正態分布。
(2)平均數
平均數反映了數據取值的集中位置,常以
浙江省農業地質環境GIS設計與實現
加權算術平均數的計算公式為
浙江省農業地質環境GIS設計與實現
式中:Pi 為數據Xi 的權值。
(3)眾數
眾數是具有最大可能出現殲納的數值。如果數據X是離散的,則稱X中出現最大可能性的值x為眾數;如果X是連續的,則以X分布的概率密度P(x)取最大值的x為X的眾數。顯然,眾數可能不是唯一的。
地球化學元素基準值統計中針對某元素求得的眾數表明該元素在此含量水平上的取值最多,也反映了區域內元素含量的基本水平。
(4)中數
對於有序數據集X,如果有一個數x,能同時滿足以下2式:
浙江省農業地質環境GIS設計與實現
則稱x為數據集X的中數,記為xMe。
若X的總項數為奇數,則中數為
浙江省農業地質環境GIS設計與實現
若X的總項數為偶數,則中數為
浙江省農業地質環境GIS設計與實現
可見,頻數(率)、平均數、眾數、中數都反映了數據的總體取值水平,當數據分布狀態最佳時,平均數、眾數、中數在理論上應該是相等的,但是這種理想狀態在實際中很少出現。在地球化學統計工作中,採用以上4個參數就足以反映區域內元素的集中含量水平。
(5)極差
極差是一組數據中最大值與最小值之差,即
R=max{x1,x2,…,xn} -min{x1,x2,…,xn}
(6)方差與標准差
方差是均方差的簡稱,是以離差平方和除以變數個數求得的,記為s2,即
浙江省農業地質環境GIS設計與實現
標准差是方差的平方根,記為
浙江省農業地質環境GIS設計與實現
極差、方差與標准差是反映數據離散程度的參數,這幾個參數的統計結果表明區域內地球化學元素在不同采樣點的含量水平差距,其值越大,說明樣點間的含量水平差異越大;反之說明各個樣點的元素含量較為均勻。
由於元素在土壤中的地球化學分布與分配受多種環境條件的限制,如地質作用、成礦作用、表生作用及人為活動等,因此尋找地球化學異常是較為重要的一項工作。從統計學角度來看,通常認為地球化學異常是在一定置信度下相對於背景的偏離。浙江省農業地質環境調查工作中,以元素背景值的平均數加2倍標准差作為元素含量的異常上限,以元素背景值的平均數減2倍標准差作為元素含量的異常下限,經過參數統計找到元素的地球化學異常,就可以從地質因素、人為影響等方面入手,進一步分析其導致異常的原因。
(7)變異系數
在衡量區域內地球化學元素滾敗的含量水平差距時,如果在元素間進行比較,經常會遇到不同元素含量相差比較大的情況,有時甚至相差幾個數量級,這時使用方差或是標准差來衡量很不方便。因此採用另一個參數——變異系數。
變異系數用來衡量數據在時間和空間上的相對變化的程度,記為C:
浙江省農業地質環境GIS設計與實現
式中:s為標准差;
可以看出變異系數是無量綱的量,它消除了不同化學元素含量在數量級上的差異,反映的也是數據取值的離散程度,值越大,含量差異越大;值越小,含量取值越均勻。
(二)基於GIS的參數統計
地球化學參數統計常規方法是先根據獲取的數據源,使用電子表格的計算功能進行半自動化統計。但在實際生產過程中,往往要求按專業分類、行政區劃進行參數統計,如統計某縣市范圍內按土壤類型的變異系數時會變得很困難。不僅統計的速度慢、效率低,而且統計的結果容易出錯。因此,採用基於GIS的參數統計十分適合復雜的生產要求。
圖7-1 基於GIS的參數統計流程圖
1.實現思路
要實現縣(市)范圍內按土壤類型的地球化學參數統計,首先要整理測試分析數據,通過測試分析數據的經緯度投影成區域測試數據點點陣圖,要求與行政區劃圖層的格式、坐標系一致。實現屬性表(測試分析表數據)向空間數據(區域地球化學分析測試點點陣圖層)的轉換。
為獲取統計范圍內的數據,可採用行政區劃作為裁剪框與地球化學分析測試點點陣圖層進行圖形裁剪,並以土壤分布類型作為統計單元,再將裁剪後的結果點數據圖層與土壤類型分布區圖層再進行點與區相交分析,同時測試點點陣圖層與土壤類型分布圖層的屬性也會相應地分類合並,在此基礎上再選擇需統計的欄位(元素)進行地球化學的參數統計,形成地球化學參數統計報表。具體流程如圖7-1所示。
2.關鍵代碼
(1)點與區相交分析
Private Sub分析_點_區()
Dim lyr1 As MapObjects2.maplayer,lyr2 As MapObjects2.maplayer,lyr3 As MapOb⁃jects2.maplayer
Setlyr1=m_map.Layers(Comb_1)'點圖層
Setlyr2=m_map.Layers(Comb_2)'區圖層
Dim rd1 As MapObjects2.RecordSet,rd2 As MapObjects2.RecordSet
Dim tagrd As MapObjects2.RecordSet
Dim shp1 As MapObjects2.point,newshp As MapObjects2.point
Dim i As Long
Dim nums As Long
Screen.MousePointer=vbHourglass
If m_判別方法=相減Then
CreateNewLyr lyr1,lyr2,點,False
Else
CreateNewLyr lyr1,lyr2,點,True
End If
Set tagrd=m_tagerlyr.Records
tagrd.AutoFlush=False
Set rd1=lyr1.Records
nums=ReturnNums(rd1)
i=0
Do Until rd1.EOF
Setshp1=rd1.Fields("shape").Value
Select Case m_判別方法
Case判別
Add點區相交 tagrd,rd1,lyr2,shp1
Add點區相減 tagrd,rd1,lyr2,shp1
Case相交
Add點區相交 tagrd,rd1,lyr2,shp1
Case相減
Add點區相減 tagrd,rd1,lyr2,shp1
End Select
i=i + 1
ProgressBar1.Value=i/nums*100#
ProgressBar1.Refresh
rd1.MoveNext
Loop
tagrd.AutoFlush=True
ProgressBar1.Value=0
ProgressBar1.Refresh
Screen.MousePointer=vbDefault
End Sub
'*********************點對區相交分析****************************
PrivateSubAdd點區相交(TagerRdAsMapObjects2.RecordSet,srdAsMapObjects2.RecordSet,lyr2 AsMapObjects2.maplayer,tshp AsMapObjects2.point)
Dim rd2 As MapObjects2.RecordSet
Dim flds As MapObjects2.Fields,fld As MapObjects2.Field
Dim tfldstr As String
Setrd2=lyr2.SearchShape(tshp,moAreaIntersect,"")
Dim t_Id As Long
If returnRdEof(rd2)= False Then
With TagerRd
.AddNew'相應屬性合並
t_Id=t_Id + 1
.Fields("objectid").Value=t_Id
Set flds=srd.Fields
For Each fld In GetSortFld(srd)
tfldstr=fld.name
If Not .Fields(tfldstr)Is Nothing Then
.Fields(tfldstr).Value=fld.Value
End If
Next
Set flds=rd2.Fields
For Each fld In GetSortFld(rd2)
tfldstr=newfldname(fld.name,TagerRd.Fields)
If Not .Fields(tfldstr)Is Nothing Then
.Fields(tfldstr).Value=fld.Value
End If
Next
.Fields("shape").Value=tshp
.Update
End With
End If
End Sub
(2)參數統計
Public Function dataEDIT(t數據類別As String,t數據表單As String,t元素欄位As String,trd As ADODB.RecordSet,mrd As MapObjects2.RecordSet,sField As String,Is去處離散數據As Boolean)As Boolean
dataEDIT=False
Dim lstrSQL As String
Dim Dcount As Integer
Dim i As Long,j As Long
Dim TempData()As Double
Dim dbname As String
Dim str As String
Dim FV(13)As String
Dim tt As Integer
Dim Avg,s,ss,cv,Dsum As Double
Dim k,n,m As Integer
On Error GoTo ErrCl
Dim TNums As Long
Dcount=ReturnNums(mrd)
ReDim TempData(2,Dcount)
i=0
Do Until mrd.EOF
If mrd.Fields(sField).Value>0 Then
TempData(0,i)= mrd.Fields(sField).Value
i=i + 1
End If
mrd.MoveNext
Loop
If i<2 Then
Exit Function
End If
'開始數據統計
dbname="test"
FV(0)="深層數據"
FV(2)=""
FV(3)= sField
FV(8)= TempData(0,Dcount 1)
FV(9)= TempData(0,0)
FV(12)=""
Dsum=0#
For i=0 To Dcount 1
Dsum=Dsum + TempData(0,i)
Next
If TempData(k,i)<(Avg+2 s)And TempData(k,i)>(Avg 2 s)Then
Avg=Dsum/Dcount '**第一次平均值μ**
Dsum=0#
For i=0 To Dcount 1
Dsum=Dsum +(TempData(0,i)Avg)^2
Next
s=Sqr(Dsum/(Dcount 1))'**第一次離差'=**
k=0
j=1
m=Dcount 1
Do While True
'**去除離散數據**
If Is去處離散數據 Then
n=0
For i=0 To m
TempData(j,n)= TempData(k,i)
n=n + 1
End If
Next
TNums=n
Else
n=0
For i=0 To m
TempData(j,n)= TempData(k,i)
n=n + 1
Next
TNums=n
End If
m=n - 1
'**求樣品數、平均值、離差
Dsum=0#
For i=0 To m
Dsum=Dsum + TempData(j,i)
Next
Avg=Dsum /(m + 1)
Dsum=0#
For i=0 To m
Dsum=Dsum +(TempData(j,i)Avg)^2
Next
If Dsum=0 Then
GoTo allok
Else
ss=Sqr(Dsum/m)
End If
If Abs(ss s)<=0.0001 Then GoTo allok
s=ss
tt=k
k=j
j=tt
Loop
allok:
m=m + 1
FV(4)= m
FV(5)= Avg
FV(6)= ss
FV(7)= ss/Avg
If(m 2*(m/2))=0Then'求中位數
i=m/2 1
FV(11)= TempData(j,i)
i=i + 1
FV(11)=(FV(11)+ TempData(j,i))/2#
Else
i =(m + 1)/2 1
FV(11)= TempData(j,i)
End If
m=m 1
Dimzzmax(2,5000)AsDouble'求眾數
k=0
zzmax(0,k)= TempData(j,0)
zzmax(1,k)= 0
For i=1 To m
If TempData(j,i)= zzmax(0,k)Then
zzmax(1,k)= zzmax(1,k)+ 1#
Else
k=k + 1
zzmax(0,k)= TempData(j,i)
End If
Next
tt=zzmax(1,0)
s=zzmax(0,0)
For i=1 To k
If zzmax(1,i)>tt Then
tt=zzmax(1,i)
s=zzmax(0,i)
End If
Next
If tt>0 Then
FV(10)= s
Else
'*****************************存入資料庫******************************
trd!平均值=Format(FV(5),"#.###")
trd!統計樣品數=TNums
trd!標准離差=Format(FV(6),"#.###")
trd!變異系數=Format(FV(7),"#.###")
trd!極大值=Format(FV(8),"#.###")
trd!極小值=Format(FV(9),"#.###")
trd!眾值=Format(FV(10),"#.###")
FV(10)=""
End If
Dim InsertSQL As String
trd.AddNew
trd!數據類別=t數據類別
trd!數據表單=t數據表單
trd!元素欄位=t元素欄位
trd!原始樣品數=FV(4)
trd!中位數=Format(FV(11),"#.###")
dataEDIT=True
trd.Update
ErrCl:
End Function
(三)實例
農業地質環境調查工作獲取了大量的樣品分析數據針對不同調查目的、不同樣品,所測試的項目各有不同,但無論是何種測試數據,其分析統計方法是相同的。對於地球化學元素基準值,通常都是統計以上介紹的幾個常用參數,用以分析其數據特徵。下面以「蕭山區農業地質環境調查」子項目中,表層土壤的環境地球化學背景值統計分析為例,展示AGEIS系統的地球化學參數統計功能。
選蕭山區不同的土壤類型為統計單元,調取表層土壤單點樣分析數據,共計227件樣品,分析測試項目為8項元素全量,對其背景值進行剔除離差後的參數統計。統計結果見表7-1。
⑧ 變異系數怎麼計算
變異系數的計算公式為:變異系數C·V=(標准偏差SD/平均值Mean)×100%。
(標准偏差SD、平均值MN)。
變異系數(Coefficient of Variation):當需要比較兩組數據離散程度大小的時候,如果兩組數據的測量尺度相差太大,或者數據量綱的不同,直接使用標准差來進行比較不合適,此時就應當消除測量尺度和量綱的影響,而變異系數可以做到這一點。
它是原始數據標准差與原始數據平均數的比。CV沒有量綱,這樣就可以進行客觀比較了。事實上,可以認為變異系數和極差、標准差和方差一樣,都是反映數據離散程度的絕對值。其數據大小不僅受變數值離散程度的影響,而且還受變數值平均水平大小的影響。
舉例:
已知某良種豬場長白成年母豬平均體重為190kg,標准差為10.5kg,而大約克成年母豬平均體重為196kg,標准差為8.5kg,試問兩個品種的成年母豬,那一個體重變異程度大。
此例觀測值雖然都是體重,單位相同,但它們的平均數不相同,只能用變異系數來比較其變異程度的大小。
由於,長白成年母豬體重的變異系數:C.V = 10.5 / 190 * 100% = 5.53%。
大約克成年母豬體重的變異系數:C.V = 8.5 / 196 * 100% = 4.34%。
所以,長白成年母豬體重的變異程度大於大約克成年母豬。
注意,變異系數的大小,同時受平均數和標准差兩個統計量的影響,因而在利用變異系數表示資料的變異程度時,最好將平均數和標准差也列出。