導航:首頁 > 化學知識 > 地球化學的聚類分析圖怎麼看

地球化學的聚類分析圖怎麼看

發布時間:2022-09-03 10:10:23

❶ DEG聚類分析熱圖怎麼看

對於一般的統計分析,基於傻瓜式操作的SPSS(PASW)軟體已經足夠,但在涉及個性化要求很高的復雜數據處理時,SPSS就開始顯得力不從心,這時必須依賴功能更為強大的SAS等軟體。以前在自己的科研過程中分析數據多用SPSS、SAS等。在統計遺傳和基因組學領域,SAS可以處理很多問題,但與此同時,SAS實現復雜問題過於麻煩,很多問題SAS也不是首選。後來開始運用R環境中的各種免費統計包,特別是Bioconctor的系列分析包,我發覺非常適合生命科學領域的研究者。R有很多優點:

(1)免費,不需要去尋找破解版,不用擔心版權問題,使用非常方便;

(2)功能非常強大,單個包的功能比較有限,但多個包組合起來使用則功能無比強大,遠勝於SPSS、SAS等;

(3)源代碼開放,稍作修改後就能滿足個性化的復雜統計分析,滿足個性化需求是R的最大特點之一;

(4)程序閱讀容易,再加上參考學習資料很多,上手比較容易,提高也不是很難,根據個人經驗,要比SAS高級階段的進階容易許多;

(5)國際同行高度認同R,我發現很多專用軟體都開發了軟體的R版,今後R將是數據分析的主流發展方向。

R軟體的安裝、基本使用等初級教程就不談了,隨便在官方網站找個學習資料就搞定了。「R系列」專輯擬推出中級、高級分析教程。今天推出基因表達譜晶元的聚類分析專題。

本專題示例晶元數據來自GEO資料庫中檢索號為GSE11787的Affymetrix晶元的CEL文件,共6個CEL文件,3個正常對照組,3個HPS刺激組,為免疫器官脾臟的表達數據。

(一)原始數據的讀入、RNA降解評估和標准化

> pd <-read.AnnotatedDataFrame("Target.txt",header=TRUE,row.names=1,as.is=TRUE)
>rawAffyData <- ReadAffy(filenames=pData(pd)$FileName, phenoData=pd)
> summary(exprs(rawAffyData))
> deg <- AffyRNAdeg(rawAffyData)
> plotAffyRNAdeg(deg,col=c(1,2,3,4,5,6))



> eset <-rma(rawAffyData)
> summary(exprs(eset))



> op <-par(mfrow=c(1,2))
>cols <- brewer.pal(6, "Set3")
>boxplot(rawAffyData,col=cols,names=1:6, main ="unnormalized.data")
>boxplot(data.frame(exprs(eset)) ,names=1:6, main ="normalization.data", col="blue", border="brown")
>par(op)



(二)聚類分析

原始數據讀入,經AffyBatch目標轉成ExpressionSet目標後,為提高後續分析(如差異表達基因的檢測)的統計功效,往往需要進一步經過Detection CallFilter和IQR filter等過濾(「基因晶元數據的特異性過濾與非特異性過濾」將在另一專題里專門討論)。

需要說明的是,常規做法是先篩選出差異表達基因,然後只用差異表達基因進行聚類分析(本示例直接用了過濾後的數據集,聚類圖的效果稍差一點)。

(1)樣本聚類

>dd <-dist2(log2(exprs(eset2)))
>diag(dd) <- 0
>dd.row <- as.dendrogram(hclust(as.dist(dd)))
>row.ord <- order.dendrogram(dd.row)
>library("latticeExtra")
>legend <- list(top = list(fun = dendrogramGrob,
args = list(x = dd.row, side = "top")))
>lp <- levelplot(dd[row.ord, row.ord],
scales = list(x = list(rot = 90)),
xlab = "", ylab = "", legend = legend)
>plot(lp)



(2)二維聚類

>source("http://faculty.ucr.e/~tgirke/Documents/R_BioCond/My_R_Scripts/my.colorFct.R")
>mydata<-exprs(eset2)
>mydatascale <- t(scale(t(mydata)))
>hr <- hclust(as.dist(1-cor(t(mydatascale), method="pearson")),method="complete")

>hc <-hclust(as.dist(1-cor(mydatascale, method="spearman")),method="complete")
>heatmap.2(mydata,Rowv=as.dendrogram(hr), Colv=as.dendrogram(hc), col=redgreen(75),scale="row", ColSideColors=heat.colors(length(hclabels)),RowSideColors=heat.colors(length(hr labels)), trace="none", key=T)



上述聚類圖一般和論文里的聚類圖有點不同,聚類的模式不太直觀,你也可以用下面的語句進行更直觀的作圖:

>mycl <-cutree(hr, h=max(hr$height)/1.5);

>mycolhc<- sample(rainbow(256)); mycolhc <- mycolhc[as.vector(mycl)]
>myc2 <- cutree(hc, h=max(hc$height)/1.5); mycolhr <-sample(rainbow(256)); mycolhr <- mycolhr[as.vector(myc2)]
>heatmap(mydatascale, Rowv=as.dendrogram(hr), Colv=as.dendrogram(hc),col=my.colorFct(), scale="row", ColSideColors=mycolhr,RowSideColors=mycolhc)



(3)MantelCorrs聚類程序

>kmeans.result<- GetClusters(eset2, 500, 100)
>x=exprs(eset2)
>DistMatrices.result <- DistMatrices(x, kmeans.resultclusters)>MantelCorrs.result<−MantelCorrs(DistMatrices.result Dfull,DistMatrices.resultDsubsets)>permuted.pval<−PermutationTest(DistMatrices.result Dfull, DistMatrices.resultDsubsets,100,16,0.05)>ClusterLists<−ClusterList(permuted.pval,kmeans.result cluster.sizes,MantelCorrs.result)
>ClusterGenes <- ClusterGeneList(kmeans.resultclusters,ClusterLists SignificantClusters,eset2)
>h=hclust(dist(MantelCorrs.result))
>plot(h)

❷ 聚類分析樹狀圖,怎麼看分幾類最合適

是系統聚類,選的組件連接法和歐氏距離

❸ 聚類分析樹狀圖怎麼看

從右往左看,最右邊,你可以看成是左邊有開口的矩形,它有上下兩條橫線,就是說把樣本分為兩類,一類是寧夏,一類是其它地區
再往左走,出現了一個節點,再往左一點,原來的一條橫線分成了兩條,加上原來的那條,一共是三條,就是說分為三類,是寧夏,甘肅,其它地區
再往左,有四條,就是分四類,寧夏是第一類,甘肅是第二類,海南和新疆是第三類,其它是第四類
再往左,就是分五類,分別是寧夏,甘肅,新疆,海南,其它地區
就是這樣以此類推,你想要分幾類,就找幾條橫線,這個往左到最後就是每個樣本歸為一類。

❹ 聚類分析樹狀圖如何分析,怎麼判斷分成幾類

從右邊開始看,分為兩類;然後從右往左看每個分叉就多分出一類。
換個方式說:就是把圖逆時針轉90度,你就能看明白了,就像一個樹狀圖。
應該是分2到4類比較好,分類的間距越大效果越好。

❺ 地球化學分區

決定區域地球化學特點的基本因素是該區域所處的大地構造位置、區內各地質體的化學性質與分布狀況以及區域成礦的特點。結合本區大地構造環境演化和不同地質環境內地層、岩漿岩、地質構造的分布特徵,以區域主要斷裂構造為參考邊界,將工作區劃分為4個地球化學分區,其中Ⅲ分區,Ⅳ分區又各自分為2個亞區(圖3.2),各分區主要特徵是:

圖3.2 工作區地球化學分區圖(底圖據中國地質調查局1∶50萬地質圖資料庫,2000)

3.1.4.1 地球化學Ⅰ區

南以漳縣-武山-唐藏深大斷裂(商-丹縫合帶部分)為界,構造位置屬於北秦嶺成礦帶。該區與金礦相關的地層主要為秦嶺群(Pt1-2)長英質片麻岩夾細碎屑岩和李子園群(Pz1)變質火山噴發沉積岩以及舒家壩群(D2)海相細碎屑岩。該區已發現李子園金礦、柴家莊金礦等數個中小型金礦床(點)。

根據1∶20萬區域化探掃面數據,對20個元素進行分析處理可知,本區趨於富集的元素是:Ag、As、B、Co、Cr、Ni、Pb、Sb、V、Zn,表現為元素的高背景區;趨於貧化的元素是:Hg、Mo、Sn、Sr、Au等元素集散特徵不明顯。從本區元素的變異系數和異常襯度來看,變異系數(Cv)>1的有Au、Bi、Mo、Sb,屬於強分異型元素,Sn、W屬於弱分異型元素,其他屬於原生均值型元素。從元素組合特徵分析(圖3.3)Au元素與Pb、Zn、Ag、As、Sb相關性較好,成為本區金礦找礦的指示性元素組合。

3.1.4.2 地球化學Ⅱ區

南以臨潭-宕昌-鳳鎮深大斷裂為界,對應於岷縣-禮縣-柞水海西褶皺帶,夾持在山陽區域大斷裂之間。區內已發現李壩、羅壩、八卦廟、金山、馬泉等金礦床和廠壩、李家溝、鄧家山、畢家山、洛壩、頁水河等鉛鋅礦。本區趨於富集的元素是:Ag、As、Bi、Co、Ni、Ti,趨於貧化的元素有Hg、Mo、Sn、Sr,Au等,其他元素的集散不明顯。從本區元素變異系數和異常襯度來看,變異系數(Cv)>1的有Bi、Sb、Mo,屬強分異型元素。從元素組合特徵分析(圖3.4)Au與As、Sb、Hg相關性好,組成典型的前緣暈元素組合。

圖3.3 Ⅰ區R型聚類分析圖

圖3.4 Ⅱ區R型聚類分析圖

3.1.4.3 地球化學Ⅲ區

夾持在臨潭-宕昌-鳳鎮深大斷裂和瑪曲-迭部-武都-略陽斷裂(勉略縫合帶部分)之間,又據岩層明顯不同,沿迭山-鳳縣深大斷裂又細化為兩個亞區。Ⅲ-1亞區地層為一套晚三疊世隆務河群(T1-2L)灰岩,該區已發現鹿兒壩金礦等幾個大中型金礦床和一些小型金礦(點)。分析1∶20萬區域化探掃面數據分析可知,本區趨於富集的元素是:Ag、As、Au、Bi、Co、Cr、Ni、Pb、V、Zn、Sb,表現為元素的高背景區;趨於貧化的元素有:Hg、Mn、Sn、Sr,其他元素集散特徵不明顯。從變異系數和異常襯度來看,變異系數(Cv)>1的有Au、Bi、Mo、Sb,屬強分異型元素。從元素組合特徵分析(圖3.5)Au-Ag-Cu-Pb-Zn組合相關性較好,成為本區典型的淺成低溫熱液礦床的找礦組合;Ⅲ-2亞區主要為一套晚白堊世地層,岩性主要是砂岩、粉砂岩和灰岩,該區已發現有九源、坪定、洛地坪等幾個大中型金礦床和一些小型金礦點。分析1∶20萬區域化探掃面數據分析可知,本區趨於富集的元素是:Ag、As、Bi、Co、Cr、Ni、Pb、Sb、Sr、V、Zn,表現為元素的高背景區;趨於貧化的元素有:Hg、Mo、Sn、Sr,其他元素集散特徵不明顯。從變異系數和異常襯度來看,變異系數(Cv)>1的有Au、Bi、Mo、Sb,屬強分異型元素。從元素組合特徵分析(圖3.6)Au與其他元素相關性較差,顯示出單獨成礦的特點。

3.1.4.4 地球化學Ⅳ區

以瑪曲-迭部-武都-略陽斷裂(勉略縫合帶部分)為界劃分本區,又據地層明顯不同以哲波山-岷江斷裂為界劃分出兩個亞區。Ⅳ-1亞區位於工作區西南角,大地構造位置屬於松潘-甘孜構造帶的一部分。該區已發現有巴西、團結、馬腦殼等金礦床。岩性主要為晚三疊世雜谷腦組的石英砂岩與碳質板岩互層。分析1∶20萬區域化探掃面數據分析可知,本區趨於富集的元素是:Ag、As、Bi、Cr、Ni、Sb、Ti,其他元素集散特徵不明顯。從變異系數和異常襯度來看,變異系數(Cv)>1的有Au、Bi、Mo、Sb,屬強分異型元素。從元素組合特徵分析(圖3.7),Au元素與As、Sb、Hg相關性好,是典型的前緣暈元素組合。Ⅳ-2亞區位於工作區東南角。大地構造位置屬於摩天嶺成礦帶的一部分。該區已發現有陽山金礦、石雞壩、甲勿寺、聯合村、鏵廠溝金礦,含少量太古代花崗岩-綠岩,大面積分布元古代碧口群,同時發育加里東-早華力西海槽型復理石建造,晚華力西-早印支期台地型碳酸岩建造及晚印支期海槽復理石建造;分析1∶20萬區域化探掃面數據分析可知,本區趨於富集的元素是:Ag、As、Bi、Cr、Cu、Mn、Ni、Pb、Ti、V、Zn,趨於貧化的元素有Hg、Mo、Sn、Sr、Au,其他元素集散特徵不明顯。從變異系數和異常襯度來看,變異系數(Cv)>1的有Bi、Mo、Pb,屬強分異型元素,Au的Cv為0.93,屬分異型元素;其他為原生均值型元素。從元素組合特徵分析(圖3.8),Au元素與As、Sb、Hg相關性好,是典型的前緣暈元素組合。

圖3.5 Ⅲ-1區R型聚類分析圖

圖3.6 Ⅲ-2區R型聚類分析圖

圖3.7 Ⅳ-1區R型聚類分析圖

圖3.8 Ⅳ-2區R型聚類分析圖

❻ 聚類結果怎麼看

聚類結果可以通過降維圖來可視化分析,還可以通過各種聚類指標來看

❼ 系統聚類圖怎麼看不懂

SPSSAU可直接生成分層聚類圖,配合幫助手冊說明可更快速進行解讀。

比如分兩類的情況下:(6,10,7)是一類,剩下的是一類;

分三類的情況下:(6,10,7)一類,(5)一類,剩下的是一類;

四類的情況下:(6,10,7)一類,(5)一類,(2,3,9)一類,(1,3,4)一類。

(7)地球化學的聚類分析圖怎麼看擴展閱讀:

聚類結構形成的原則中若兩個樣品在已經分好的組中都未出現過,周把們形成一個獨立的新組,

若兩個樣品中有一個是在已經分好的組中出現過,則把另一個樣品也加人到該組中1若選出一對樣品,都分別出現在已經分好的組中,這就把兩組聯結在一起。

若選出的一對樣品都出現在同一組中,則這一對樣品就不再分組了,在具體進行分類時,要依這四條原則反復進行,直到把所有樣品都分類聚合完畢為止。

❽ 聚類分析樹狀圖如何看

看懂聚類分析樹狀圖需要一把尺子,與從左向右的橫線垂直90度放下。此時,橫線(一條線就是一個類別)被尺子截斷,這些端點的個數就是該相對距離下的類別數目。

❾ 地球化學異常信息的提取

(一)研究區地球化學背景概述

資料表明,研究區泥盆系尤其是康布鐵堡組和石炭系,如紅山嘴組,稀有元素鋰、鈹、鈮總體均以富集、強富集為主,富集系數最高達到2。而老地層,如元古宇的克木齊群和富蘊群,鋰、鈹、鈮卻以分散或虧損為主;尤其是下古生界志留系的庫爾木圖群,鋰、鈹、鈮均為虧損狀態。說明老地層經受多期次的變質—構造—岩漿作用後,稀有元素鋰、鈹、鈮逐漸轉移,局部在深變質相或混合岩化、花崗岩化過程中得到富集。

圖4—8 研究區構造中心對稱度等值線圖與礦點疊加圖

圖4—9 工作區斷裂250m緩沖區與礦點疊加圖

(二)地球化學數據分析與預處理

本書收集到研究區主要成礦元素Be、Li、Cr、Ni、Cu、Zn六種元素的水系沉積物化驗數據進行區域的地球化學背景分析。

由於在化驗分析與化探取樣過程中,系統誤差或偶然誤差因素的影響,分析結果中含有個別異常點的奇異值,而這種奇異值會對元素的異常特徵尤其是對元素分布的趨勢面形態產生較大影響。因此,在研究元素統計分布特徵之前,首先將原始觀測值進行了處理。另外,地球化學家基本認為元素在地球化學場中的的分布接近正態分布或對數正態分布。因此,傳統地球化學異常下限的確定是統計勘查地球化學數據,檢驗其是否符合正態分布或對數正態分布,如果不符合,則需剔除部分奇異值,直到數據符合正態分布或對數正態分布。本文採用的特異值的識別方法為:下限為樣品均值加3倍標准差,即μ+3σ。

(三)單元素化探異常提取及分析

根據地球化學找礦理論,絕大多數的化探數據呈正態分布或對數正態分布,化探異常的分析、解釋和評價也都是建立在元素在地質體中呈正態分布或對數正態分布的基礎上進行的。經過分析,本書所涉及的六種元素在經過特異值的處理後均呈比較典型的正態分布,如圖4—10所示。

圖4—10 去除特高值後Be、Li、Cr、Ni、Cu、Zn六種元素分布圖

同時,本文還考慮到在進一步的分析中可能涉及各種元素之間的比較和計算(比如說判別分析、因子分析、聚類分析等),而各種元素之間很明顯的存在度量和指標差異,所以這里也對上一步得到的數據進行標准調平:標准化或是正規化。

標准化:把原始數據按下式變換

新疆可可托海稀有金屬礦床三維立體定量預測研究

標准化後,變數均值為0,標准差為1,且每個變數處於同一度量。

正規化:把原始數據按下式變換

新疆可可托海稀有金屬礦床三維立體定量預測研究

正規化後,變數最大值為1,最小值為0,且每個變數處於同一度量。

本書所採用的是正規化方法,對正規化的數據進行異常提取,我們採取的方法是平均值與1倍標准差之和(μ+σ)作為地球化學異常下限,圈定六種元素的異常區域(圖4—11~圖4—16)。

圖4—11 Be元素異常分布圖

圖4—12 Li元素異常分布圖

圖4—13 Cr元素異常分布圖

圖4—14 Ni元素異常分布圖

圖4—15 Cu元素異常分布圖

圖4—16 Zn元素異常分布圖

(四)化探綜合異常的提取和分析

化探綜合異常就是對單元素進行異常特徵的疊加,用以反映研究區內的所有異常特徵分布情況。為了將所有元素的信息真正融合起來,本書採用了聚類分析的方法。聚類分析的基本思想是:假定研究對象存在不同的相似性(親密程度),根據觀測樣找出並計算一些能夠度量樣品間相似程度的統計量(如相似系數、相關系數等),按相似性統計量的大小,將相似程度大的聚合到一類,關系疏遠的聚合到另一類,直到把所有樣品都聚合完畢,形成一個由小到大的分類系統,最後將分類系統直觀的用圖形表示出來,得到譜系圖。

本書利用經過標准化的化探數據,統計各元素間的相關系數進行聚類分析,聚類分析得到的結果如圖4—17所示。

圖4—17 Be、Li、Cr、Ni、Cu、Zn六元素聚類分析圖譜

其中,p1=0.91,p2=0.52,p3=0.51,p4=0.52,p5=0.24(P表示元素之間的相關系數)。為方便討論,先作以下假設。假設鈹、鋰、鉻、鎳、銅、鋅各元素水系沉積物化探取樣值分別表示為:DBe,DLi,DCr,DNi,DCu,DZn

從數據所含信息的角度來考慮,變數V1、V2之間的相關系數P實際上可以看作是變數之間所提供相同信息的百分比。相關系數越大,則重復信息量越大,反之亦然。當相關系數達到最大值即P等於1時,則兩個變數提供的是重復的信息,計算綜合信息I時應該作為一個變數處理,即I=V1或I=V2

當相關系數達到最小值即P等於0時,則兩個變數完全獨立,計算綜合信息時應各自作為一個變數處理,即I=V1+V2

當為中間的情況時,我們可以按圖4—18理解:

圖4—18 相關變數之間重復信息示意圖

顯然,相交的相同信息I2=P×V1=P×V2=(V1+V2)×P/2,則總信息為:

新疆可可托海稀有金屬礦床三維立體定量預測研究

根據以上公式,下面來具體推算不同元素組合的綜合化探異常值。

新疆可可托海稀有金屬礦床三維立體定量預測研究

從元素聚類分析圖中可以看出,元素Cr和Ni的相關系數最大,達到了0.91,元素Be和Li的相關系數為0.52。當相關系數大於0.5時,以上六種金屬元素可分為兩組,根據該元素聚類分析圖,本書按照相關系數的大小將以上六種元素分為稀有金屬元素和其他金屬元素兩類分別討論其化探綜合異常。

1.稀有金屬元素(Be、Li)化探綜合異常

稀有金屬元素Be和Li的綜合信息量值可通過Group4計算得到,其綜合異常信息數據統計特徵:μ=0.42,σ=0.15,取異常下限為0.57,處理結果如圖4—19所示。

2.其他金屬元素(Cr、Ni、Cu、Zn)化探綜合異常

根據前面的元素聚類分析圖譜以及前文所述計算化探綜合異常信息量的公式,本文將金屬元素Cr、Ni、Cu、Zn歸為一類,計算這四種元素的綜合化探異常。計算Group1、Group2、Group3得到Cr、Ni、Cu、Zn的綜合異常信息數據統計特徵:μ=0.41,σ=0.16,取異常下限為0.50,處理結果如圖4—20所示。

圖4—19 稀有金屬元素Be、Li綜合化探異常與礦體分布圖

圖4—20 Cr、Ni、Cu、Zn綜合化探異常與礦體分布圖

閱讀全文

與地球化學的聚類分析圖怎麼看相關的資料

熱點內容
word中化學式的數字怎麼打出來 瀏覽:666
乙酸乙酯化學式怎麼算 瀏覽:1338
沈陽初中的數學是什麼版本的 瀏覽:1275
華為手機家人共享如何查看地理位置 瀏覽:959
一氧化碳還原氧化鋁化學方程式怎麼配平 瀏覽:812
數學c什麼意思是什麼意思是什麼 瀏覽:1328
中考初中地理如何補 瀏覽:1224
360瀏覽器歷史在哪裡下載迅雷下載 瀏覽:634
數學奧數卡怎麼辦 瀏覽:1306
如何回答地理是什麼 瀏覽:955
win7如何刪除電腦文件瀏覽歷史 瀏覽:986
大學物理實驗干什麼用的到 瀏覽:1408
二年級上冊數學框框怎麼填 瀏覽:1619
西安瑞禧生物科技有限公司怎麼樣 瀏覽:760
武大的分析化學怎麼樣 瀏覽:1176
ige電化學發光偏高怎麼辦 瀏覽:1265
學而思初中英語和語文怎麼樣 瀏覽:1561
下列哪個水飛薊素化學結構 瀏覽:1356
化學理學哪些專業好 瀏覽:1420
數學中的棱的意思是什麼 瀏覽:977