① 物理重復和生物學重復都必須要嗎
可以都要
如果你的高通量的數據是要放到文章裡面去的,甚至有人僅僅晶元的數據就發一篇文章,那一定要有n>=3的生物學重復。如果只是自己看一看,找個方向,那可以不做重復。但是,問題來了,如果是組織樣,組內差異很大,不做重復也沒意義。如果是細胞株,可能好一些。生物學重復是必要的,就是樣本和總體的關系,樣本越大越能代表總體
② 生物學重復與技術重復
在利用基因晶元或者RNA-seq做 基因表達 分析的時候,經常聽說生物學重復和技術重復,這篇文章我們就來簡單介紹二者的含義。
首先利用一張示意圖對二者做一個簡單介紹:
使用同一個抽提的RNA重復進行晶元雜交稱為 技術重復 。取重復點的平均值,由於平均值與組分本身相比變異較小臘碰, 所得到的表達評價更可靠。由於抽提具有可重復的特點, 與生物學重復相比, 技術重復的測量變異程度較小。但是技術重復不是完全獨立的,取平均值不能去除共有的系統偏差(Yang and Speed, 2002)。重復分析來自同一個抽提物的RNA,通過減少實驗中的技術變異, 將對特定的樣本產生高可信度的測量結果, 但是並不能給出同一群體的另一個樣本的任何信息。這就如同通過重復多次測量同一個男人和女人的身高,是無法得出男性和女性身高差異的結論一樣。如果我們要預測並推測整個人群,測量幾個不同的男人和幾個不同的女人是必要的,即我們需要生物學重復伍緩。
文中提及的相關文獻鏈接:
Yee Hwa Yang &腔局模 Terry Speed. Design issues for cDNA microarray experiments. Nature Reviews Genetics 3, 579-588 (August 2002) http://www.nature.com/nrg/journal/v3/n8/full/nrg863.html
Draghici S., Kuklin A., Hoff B. Shams S. - Experimental Design, Analysis of Variance and Slide Quality Assessment in Gene Expression Arrays, Current Opinion in Drug Discovery & Development, vol. 4, no. 3, 2001. http://www.eng.wayne.e/user_files/551/file/Quick_Upload/Experimental%20design,%20analysis%20of%20variance%20and%20slide%20quality%20assessment%20in.pdf
③ 生物學重復必須同一時間去做嗎
實驗設計原則的正確把握:重復原則及其作用
重復原則通常有三層含義,即「重復取樣」、「重復測量」和「重復實驗」,實驗設計中所講的重復原則指的是「重復實驗」。本文本文以實例的方式說明一下臨床實驗中違背重復原則和重復原則使用不當的常見情況。
重復原則及作用
重復原則的概念
重復通常有三層含義,即「重復取樣」、「重復測量」和「重復實驗」。從同一個樣品中多次取樣,測量某定量指標的數值,稱為「重復取樣」;對接受某種處理的個體,隨著時間的推移,對其進行多次觀測稱為「重復測量」。實驗設計中所講的重復原則指的是「重復實驗」,即在相同的實驗條件下,做兩次或兩次以上的獨立實驗。這里的「獨立」是指要用不同的個體或樣品做實驗,而不是在同一個體或樣品上做多次實驗。整個實驗設計所包括的各組內重復實驗次數之和,稱為樣本大小或樣本含量。
重復原則的作用
同一個實驗條件下為何要做多次獨立的重復實驗呢?只做一次不更節省時間柏費用嗎?
關鍵在於觀測的結果是否具有變異性,若對每一個正常人觀測其有多少個手指,只需觀測一個人即可,因為每個正常人的手指都有10個,它是一個不具有變異性的定量指標。若對每一個正常入觀測其血小板的含量是多少,僅觀測一個人就作出關於正常人血小板含量為多少的結論顯然是可笑的,因為每個正常人血小板含量是不盡相同的。只有觀測了大量正常人血小板的含量後,其取值規律性才有可能表現出來,初步的印象是取值接近該組被觀測的全部受試者算術平均值的人較多,取值偏離此均值較遠的人較少,取值特別小和特別大的人就吏少了。即便這樣一種非常簡單的規律,也只有在進行了大量重復實驗之後才能夠表現出來。
由此可如重復原則的作用就在於它有利於使隨機變數的統計規律性充分地顯露出來。
96孔板的實驗,比如MTT,luciferase reporter等實驗室,單次至少3個復孔,需要至少3次獨立重復實驗(肯定不是一天做的)。
WB實驗,收樣的時候可以不用做復孔,分裝蛋白的時候可以分幾份跑膠,也可以就跑一次。但是結果至少重復3次(三批的樣本)保證重現性。
PCR實驗,收樣的時候不需要復孔,但是p的時候至少設置3個復孔,且至少3次獨立重復實驗,也就是說你等收三批以上的RNA樣本。
染色實驗,組織樣本,至少來源於3隻以上的動物,這個具體看你用什麼模式生物,小鼠得6隻,大鼠3隻。每個組織至少有3-5張切片進行染色。最後分析的時候如果是掃描圖片可以是一張整圖,如果是放大的截取的圖片,那至少觀察5個以上的視野。細胞樣本染色,6孔板或者比6孔板大的染色,我一般做1-2個復孔,其實一個也可以。96孔這種,至少也需要3個復孔.且都需要做3批以上。
CoIP, IP pulldown因為最後處理相當於WB,參考WB即可。
ChIP參考PCR即可。
RNA-seq, ChIP-seq,>3個重復樣本。
注意:文章中的n=5,動物實驗的話是指有5隻動物,細胞實驗是指5個獨立實驗,也就是5批實驗的結果,不是5個復孔的意思。
④ 【一文讀懂生物學重復與技術重復】
在RNA-Seq等測序設計中,生物學重復和技術重復,是非常需要注意的問題。
那麼問題就來了,生物學重復和技術重復,到底是什麼?它們是如何影響我們的實驗設計的。
生物學重復 (biological replicate):可以理解為我們對一個群體進行研究,但是我們不會對整個群體進行檢測(考慮到成本和工作量的問題,我們肯定也不會採取這種地毯式的方法),只是抽取群體中的一部分進行檢測,用樣本來代表總體。
這邊樣本個數,實際上就是生物學重復數。
技術重復 (technical replicate):對一個樣本的數值進行多次測定。
下表給出常見實驗對應重復類型:
Replication這篇文章以測定小鼠肝臟細胞中的某一個gene的表達量為例,展示了什麼是生物學重復和技術重復以及如何權衡這兩者之間的關系。
分別給出3種類型的重復,分別為:
(1)animal水平的重復
(2)cell水平的重復
(3)技術重復
由上圖可以得到,3種不同種類的重復,所計算出來的表達量方差是不一樣的,但gene表達量的總方差,可以有下列公式計算得到:
接下來,將總體的重復次數限定,即在滿足 的前提條件下,對Var(X)進行計算。
1、當 和 均為1, 為48的情況下,計算出來的Var(X)如下圖標記:
這種情況下,只反映了由於cell樣品重復和技術重復所引起的基因表達量誤差。當n_{A}=1(動物樣品數為1),即無法計算由於animal樣品數變化,所帶來的基因表達量誤差。
因此在上述情況下, 就被低估了。
2、當 和 均為1, 為48的情況下
計算得到的基因表達量誤差完全是由於技術重復所引起的。因此,如果我們將這種情況下的誤差,認定為由生物重復所引起的,就造成了假陽性。
同樣地,每一種重復對於真實基因表達量的方差貢獻也不是相同的。
因為cell重復和測定技術重復,並是一個獨立變數。技術重復本質上是對同一份樣品進行測定,數據在這種情況下的變異,完全是由於人為或機器造成的,而cell重復在本質上可以認為與animal樣品之間存在相關性,因此也不是獨立的。
3、從 的角度,來選擇replicate
【標注】 越小,代表對 估計越准確
可以看到的是,當增大animal重復數時, 趨於一個穩定值,該樣本對總體的估計達到了一個較為准確的水平,同時 的值也接近於0。
4、從統計檢驗的角度,來選擇replicate
使用two-sample t檢驗,來判斷cell樣品的gene表達量方差、動物樣品表達量均值之間是否存在顯著差異。
下圖很明顯的一個結果就是,隨著 的增加,統計檢驗的效能得到提升,假陽性也在降低(同時也得權衡 和 )
對於一組數據來說, 研究對象的生物重復比技術重復更能夠反映總體 ,因此在進行實驗設計時,最好將實驗/測序資源傾向這邊,而不是技術重復(除非對技術重復所誘發的影響感興趣)
[1] 劉小樂老師-哈佛計算生物學與生物信息學
[2] Blainey P, Krzywinski M, Altman N. Points of significance: replication[J]. Nature methods, 2014, 11(9): 879.
⑤ 生物遺傳學中的重復,錯位等是什麼意思
簡單通俗地說
缺失和運姿,是染色體上喚絕有一段悄巧沒了,變少了
重復,是同源染色體上的基因到這條染色體上,使基因重復,變多了
倒位,是一條染色體上基因的位置變了,但不多也不少
易位,是其它非同源染色體上的基因接在了這條染色體上,變多了,可不是重復
⑥ 如何來設定轉錄組測序中的生物學重復
如何來設定轉錄組測序中的生物學重復
1.區分生物學重復與技術重復
生物學重復:指樣本重復,比如3隻小鼠,同時做一種處理,就是三個生物學重復。
技術重復:一般是三次實驗,比如對一塊組織,提了三次RNA,做三次real time。
2.設置生物學重復的意義
由於新一代測序技術的優越性以及高成本,曾一度忽略了「生物學重復」的重要性。但生物學重復對於測序實驗的設計以及實驗數據的解讀和分析都非常重要。
設置生物學重復:
能夠消除組內誤差:生物學重復可以測量變異程度
增強結果的可靠性:測序的樣本數越多,越能夠降低背景差異
檢測離群樣本:異常樣本的存在,會嚴重影響測序結果的准確性,通過計算樣本間的相關性可以發現異常樣本,將其排除。
案例一:
註:COX4NB和RASGRP1基因在生物學重復樣本中表達值的散點圖:
左邊紅色,COX4NB基因表達值的散點圖
右邊藍色,RASGRP1基因達值的散點圖
上面一行,測序數據的散點圖
下面一行:晶元數據的散點圖
COX4NB在生物學重復樣本中表達差異非常小;但在同樣情況下,RASGRP1的生物學差異很大。結果意味著:不同實驗組間 COX4NB的表達水平的變化存在研究意義;而同樣情況下RASGRP1的檢測數據可能不能說明問題。
由此可知,設計的實驗如果沒有生物學重復,或者生物學重復的數量不夠,就不能得到有統計意義的實驗結果;獲得的差異表達的基因很可能僅僅是少數個體差異的表現,並不能反映疾病或者某種特定生理狀態的群體本質特徵。
3.生物學重復設置幾個合適?
您是不是有同樣的問題:轉錄組測序是否必須進行生物學重復啊,是否要3個重復,是否可以用3個樣品的RNA等量混合代替生物學重復,如果不重復能否發文章…..?一方面是有限的經費,一方面是編輯的質疑;實在很難抉擇呀~~~
目前沒有生物學重復的實驗發文章比較困難,尤其是IF≥5的雜志。如果確實受限於研究經費,無法設置生物學重復。文章投出之後,遭編輯質疑。那就得結合強有力的實驗數據做支撐,比如定量實驗,FISH熒光原位雜交,或者是northern 雜交等,用實驗數據說服編輯。重復設置原則上越多越好,然而考慮到現實條件,重復設置≥3。一般不建議設置兩個重復,因為如果兩者結果不一致,我們無法確定以哪個數據為參考。
註:3個生物學重復,不等同於將3個樣品的RNA等量混合後測序。3個樣品等量混合測序,相當於將3個樣本的基因表達量取了平均值,其實就是相當於取了一個樣本,由此得到的差異基因同樣不可信,不能反應群體生物學現象。
4.生物學重復分析結果展示
以公司做項目的經驗來看,原核生物以及真菌生物學重復的效果>植物>動物,這是由於動植物個體差異較大所導致。所以動植物在選取生物學重復時,應按照嚴格的篩選條件進行取樣,方可得到理想結果。
⑦ 由生物學重復引發出來的思考
太長不看系列
技術重復:一個樣本重復多次
生物學重復:同一批次每個生物重復一次(多次)
當生物學重復之間存在相關性,需要考慮有效樣本數(effective sample size)
effective genome size和effective sample size不一樣,不要混為一談
廢話超多系列
首先我們區分一下生物學重復和技術重復,有的人可能不屑一顧,和我的反應一樣。但是別著急,答應我先區分下面兩種情況屬於什麼重復,答對了再嘲諷我好么?
現在有一隻小鼠A,我們對它的肌肉組織取樣,連續三次檢測其基因表達水平
現在有一隻小鼠A,我們連續三次對它的肌肉組織取樣,然後分別對該樣品進行測序
文字不方便理解的話,可以看下面的圖示:
事實上,這兩種重復都是屬於技術重復,因為它們都是針對的一隻小鼠做的實驗(一個生物)。但是這兩種技術重復的側重點有些許不同。
第一種技術重復,重點是RNA-seq檢測方法的准確度。比如當你發現了一個新的檢測基因表達量的方法,就需要用這種重復 來驗證該方法的准確度
第二種技術重復,重點是檢測這個 小鼠本身的基因表達水平, 而非檢測方法。
那麼,什麼是生物學重復呢?比如我有一群小鼠,我挑選其中三隻,做相同處理,然後分別取樣檢測基因表達水平:
這是因為,我們的每一次測量都來自於不同的小鼠(生物)。除此之外,我們還可以知道,生物學重復研究的重點從個體轉移到了這類群體。
既然有了重復(有了不同的樣本),我們接下來需要考慮的就是樣本數的問題:
如果我們對檢測基因表達水平的方法感興趣,那我們的樣本數與技術重復相關:
下面的情況,樣本數為3(三個技術重復):凱拍搜
假如我們對於藍色小鼠這一族群感興趣:
下面的情況,樣本數為3:
下面的情況,樣本數依然為3,這是因為技術重復不影響我們關注的重點(技術重復關注的是個體或者是方法的准確度)
假如我們對小鼠的某一族群感興趣,我們對三種顏色的小鼠都檢測一下基因表達:
但是,如果藍色小鼠有一個雙胞胎弟弟,那麼此時的樣本數是多少呢?是3還是4呢?
事實上,樣本數介於3和4之間。這個時候,樣本數不再是簡單的加和,而是要考慮有效樣本數(effective sample size)。計算公式如下:
此時我們需要關注這兩只藍色小鼠的相關性,若相關系數為0.7,則這倆雙胞胎所代表的樣本數為2/(1+(2-1)*0.7)=2/(1+0.7)=1.18
若相關系數為0.1,則這倆雙胞胎所代表的樣本數為2/(1+(2-1)*0.1)=2/(1+0.1)=1.82
由此可知,兩個雙胞胎小鼠的相關性越低,所代表的樣本數越大。相關性越大,則所代表的樣本數越小。甚至若二者完全相同,我們可以把盯歷他們看作是一個(把他們看作是技術重復,不影響樣本數)
寫在後面的話
需要注意的是,很多人使用過deeptools,裡面涉及到一個effectiv genome size的定義。該定義賀兆與effective sample size完全不同,千萬不要混淆。
effective genome size 相當於是去除了基因組中為N的那些鹼基之後的長度。
⑧ 生物醫學研究中的重復性,可以理解為下述哪些項
那麼這只能是一個站不住腳的生物實驗原則中可重復性原則怎麼理解我認為生物學實驗的可重復性並不差。原則上, Nature。 如果一個實驗結果,片面的實驗,需要特定的人在特定的時間和地點來重復。 但是,幾乎一切現象都可以套用因果關系來解釋。只要因果關系是成立的,那麼實驗就應該是可重復的,這個數據的權威性就要受到質疑。因果關系沒有搞清楚,能夠發表的數據。重復不出來只有兩種可能,即使是CNS級別(Cell, Science三大期刊)的文章,要麼操作有問題,也會有很多實驗結果是重復不出來的,都應該是可以重復的,要麼數據是不成立的。當我們純粹的談論科學時
⑨ 閑聊生物學重復
從涉足生命科學實驗那一刻,就會聽到兆餘正這樣一句話「生物學實驗至少要三個生物學重復,要嚴格設立對照實驗」。隨著時間的流逝,記憶變得模糊,依稀記得「三個生物學重復」、「對照」。
所以在後來乃至研究生階段,都銘記著這樣的話並始終踐行著。
什麼時候開始,實驗只有三個生物學重復,對照無所謂陰陽;
有時候出現詭異的結果,可能真的忘記了生物體的差異性。
生物體個體差異究竟有多大?
你看看著萬千世界:
同等大小的種子,在同樣的環境溫濕度下,毀拆萌芽有先後,開花結果有大小之別;
同樣的胚胎,在相同的飼養環境下,發育歷期不同,最後成長為不同大小的個體;
同等大小的果蠅,在飢餓條件下,並不是集中在某一時間點集體死亡,而是逐步死去;
同樣的取食實驗,取食相同劑量的物質,在基因層面表現出不一樣的應激反應;
……
所以醒醒吧,
三個生物學重復,只是能讓你採用統計學方法進行統計分析;
更多的生物學重復,才能讓你的實驗結果更加穩健、可靠;
更為嚴格的陰性、陽性對照,能夠判定你的方法是否嚴謹、可靠;
FAQ: 我的實驗生物學重復比較差,統計分析無差異,如何解決?
A: 主要辦法由3:
1. 加大生物學重復。可以有效監測異常值,而進行統計分析。這個方法更有科研意義,但是一般課題實驗難以如此,加之樣本稀少等原因,這種做法更為少見。
2. 改單一取樣為混合取樣。族悔混合取樣可以避免個別異常樣本對測定的影響,是最為常用的實驗取養方法。
3. 提高處理劑量或時間。如果是處理樣本,可以更改處理參數來達到對其作用的效果,使得呈現出顯著差異。
⑩ 【轉載】生物學重復與技術重復
生物重復和技術重復分別是什麼?在一個實驗中應該如何安排生物重復和技術重復?
重復是實驗設計的重要原則之一,實驗重復無論對於實驗結果的可重復性,還是對於最終實驗結論的可靠性,都起著起決定性的作用。
實驗重復還可以進一步細分為生物重復(biological replicates)和技術重復(technical replicates),那麼生物重復和技術重復分別是什麼?在一個實驗中應該如何安排生物重復和技術重復?
生物重復和技術重復分別是什麼?
生物重復:指對同一個處理組中獨立來源的重復樣本分別進行獨立分析,是整個實驗的完全重復,如將具有同一基因型的多個細胞株進行獨立地測定。由於遺傳和環境等因素的影響會引起有機體的個體差異,因此需要採用生物重復的實驗設計方法來消除該差異。目前都以3次生物學重復實驗設計為主,要求嚴格的實驗可以做5次重復。
技術重復:指對同一樣本進行重復地檢測分析,例如同一份細胞中抽提的蛋白質進行三次質譜檢測,或者對同一RNA-seq樣本測序3次。與生物學重復相比,技術重復的測量變異程度較小,從而可以減少實驗中的分析變異,將對同一份樣本產生高重復性的測量結果 。
簡單來講,生物重復是生物級別的重復,一般都是生物樣本的重復。而技術重復,更多的是參數測定環節的重復,一般是對同一生物樣本進行多次測定。
進一步分析,其實可以發現生物重復是衡量實驗的總波動的(處理組間的差異不列入此處的波動,他們應該稱為效應),它包括樣本個體間差異和技術重復差異,而技術重復更多的是單純的衡量參數測量時的波動,如實驗操作嫻熟程度、儀器穩定性等等。
在一個實驗中應該如何安排生物重復和技術重復?
如此說來,對於一個實驗來說,如果條件允許的話,最好把生物重復和技術重復做全了?
然而StatQuest推薦的策略是只需要生物重復即可,不需要技術重復。為什麼?
只做生物重復
以小鼠的RNA-seq實驗為例,先看一下生物偏差(biological variation)和技術偏差(technical variation )。
下圖代表小鼠的RNA-seq數據,虛線μ是總體小鼠的Read Counts,藍色條代表5個樣本小鼠的Read Counts。那那麼樣本小鼠的Read和總體μ是存在一定的差異的,我們將5個樣本小鼠的Read取平均:
average = [(μ+5)+(μ-1)+(μ+4)+(μ+2)+(μ-5)] / 5 = μ + (5-1+4+2-5)/5
隨著生物重復的增多,(5-1+4+2-5)/5會逐漸趨向於0,這個平均數也會趨近於總體搜咐均值μ。
剛才只考慮了生物生物偏差,沒有考慮技術偏差,下圖中添加悄灶了技術偏差,棕色條為生物偏差,綠色箭頭為技術偏差,那麼此時依然可以取5個樣本小鼠的Read平均:
average = μ + (5-1+4+2-5)/5 + (-2+5+2-2-1)/5
隨著生物重復的增多,生物偏差(5-1+4+2-5)/5 逐漸趨向於0,技術偏差也會逐漸趨向於0,這個平均數也會趨近於總體均值μ。
所以只做生物重復就可以很好的使用樣本代表總體。
只做技術重復
繼續進行實驗,下圖代表對1#小鼠測定了5次RNA-seq數據。那麼同樣方法取5個RNA-seq數據的平均:
average = μ + 5 + (-2+5+2-2-1)/5
隨著技術重復數的增加,技術偏差(-2+5+2-2-1)/5會逐漸趨近於0,而這個平均數會逐漸趨近於μ + 5,永遠也不會等於總體均值μ,因此做再多的技術重復,最終的RNA-seq數據也無法很好的代表總體。
同時做生物重復和技術重復
以下圖為例,1#小鼠做了2個技術重復,2#小鼠做了3個技術重復,此時的生物偏差為5、5、-1、-1、-1,而技術偏差不變(技術偏差是參數測定時的偏差,不會因樣本而異,而且因樣本而已的偏差肯定是樣本偏差),所以樣本均值為:
average = μ + (5+5-1-1-1)/5 + (-2+5+2-2-1)/5
隨著樣本量啟漏扮的增加,技術偏差(-2+5+2-2-1)/5會逐漸趨向於零。
但生物偏差(5+5-1-1-1)/5雖然也會收斂到0,但是此時所需要的樣本量比『只做生物重復』時大大增加,也就是說生物偏差的收斂速度變慢了。
這個生物偏差收斂變慢的速度有多慢呢?
假如多了3個技術重復,那麼就需要3倍的樣本量才能抵得上『只做生物重復』時的收斂速度。說白了,就是多做的技術重復最多不過和『只做生物重復』的效果持平而已。
做一下總結:
只做生物重復:最佳的實驗設計,可以很好的代表總體;
只做技術重復,沒有生物重復:不要使用這種實驗設計,永遠只會得到總體的有偏估計。
生物重復和技術重復:不推薦做,並不能很好的提高樣本的代表性,要麼獲得一個有偏的估計,要麼需要更多的樣本。