⑴ 生物統計學主要學的是啥啊
生物統計學是一門探討如何從不完整的信息中獲取科學可靠的結論從而進一步進行生物學實驗研究的設計,取樣,分析,資料整理與推論的科學.
⑵ 生物統計平行是什麼意思
意思是數量統計時,等級相同,並沒有隸屬關系。
生物統計,應用於中的數理統計方法。即用數理統計的原理和方法,分析和解釋生物界的種種現象和數據資料,以求把握其本質和規律性。最早提出生物統計思想的是比利時數學家L.A.J.凱特萊,他試圖把統計學的理論應用於解決生物學、醫學和社會學中的問題。
⑶ 什麼是生物統計學
生物統計學在我國又稱衛生統計學,在學科分類中屬於預防醫學下的一個二級學科——流行病與衛生統計學。現階段,我國共有25所大學具有流行病與衛生統計學博士學位授予權,61所大學具有流行病與衛生統計學碩士學位授予權。
但只有南方醫科大學一所大學設有生物統計學本科專業。而且流行病與衛生統計學專業的研究生中從事生物統計學的只有1/3,全國每年只有不到200名碩士、50名博士畢業。
近年來,生物醫學研究中統計學的應用越來越廣泛,理論統計學家不斷尋求與生物醫學研究者的合作,醫學領域的生物統計學者也期待得到來自理論統計學家的幫助。
生物統計學家絕不僅僅是分析數據而已,他們不但要有良好的溝通技巧,深刻理解醫學倫理及文化背景對研究帶來的影響,還要熟悉政府政策以及法律法規體系,用全球化視野來審視自己所從事的研究。
(3)生物統計什麼是水平擴展閱讀:
生物統計學是生物數學中最早形成的一大分支,它是在用統計學的原理和方法研究生物學的客觀現象及問題的過程中形成的,生物學中的問題又促使生物統計學中大部分基本方法進一步發展。
生物統計學是應用統計學的分支,它將統計方法應用到醫學及生物學領域,在此,數理統計學和應用統計學有些重疊。
⑷ 求《生物統計附實驗設計》明道緒第四版 課後習題答案
《生物統計附實驗設計》(課後習題答案)
第一章 緒論
一、名詞解釋
1、總體:根據研究目的確定的研究對象的全體稱為總體。
2、個體:總體中的一個研究單位稱為個體。
3、樣本:總體的一部分稱為樣本。
4、樣本含量:樣本中所包含的個體數目稱為樣本含量(容量)或大小。
5、隨機樣本:從總體中隨機抽取的樣本稱為隨機樣本,而隨機抽取是指總體中的每一個個體都有同等的機會被抽取組成樣本。
6、參數:由總體計算的特徵數叫參數。
7、統計量:由樣本計算的特徵數叫統計量。
8、隨機誤差:也叫抽樣誤差,是由於許多無法控制的內在和外在的偶然因素所造成,帶有偶然性質,影響試驗的精確性。
9、系統誤差:也叫片面誤差,是由於一些能控制但未加控制的因素造成的,其影響試驗的准確性。
10、准確性:也叫准確度,指在調查或試驗中某一試驗指標或性狀的觀測值與真值接近的程度。
11、精確性:也叫精確度,指調查或試驗研究中同一試驗指標或性狀的重復觀測值彼此接近的程度。
二、簡答題
1、什麼是生物統計?它在畜牧、水產科學研究中有何作用?
答:(1)生物統計是數理統計的原理和方法在生物科學研究中的應用,是一門應用數學。
(2)生物統計在畜牧、水產科學研究中的作用主要體現在兩個方面:一是提供試驗或調查設計的方法,二是提供整理、分析資料的方法。
2、統計分析的兩個特點是什麼?
答:統計分析的兩個特點是:①通過樣本來推斷總體。②有很大的可靠性但也有一定的錯誤率。
3、如何提高試驗的准確性與精確性?
答:在調查或試驗中應嚴格按照調查或試驗計劃進行,准確地進行觀察記載,力求避免認為差錯,特別要注意試驗條件的一致性,即除所研究的各個處理外,供試畜禽的初始條件如品種、性別、年齡、健康狀況、飼養條件、管理措施等盡量控制一致,並通過合理的調查或試驗設計,努力提高試驗的准確性和精確性。
4、如何控制、降低隨機誤差,避免系統誤差?
答:隨機誤差是由於一些無法控制的偶然因素造成的,難以消除,只能盡量控制和降低;主要是試驗動物的初始條件、飼養條件、管理措施等在試驗中要力求一致,盡量降低差異。系統誤差是由於一些可以控制但未加控制的因素造成的,一般只要試驗工作做得精細是可以消除的。避免系統誤差的主要措施有:盡量保證試驗動物初始條件的一致(年齡、初始重、性別、健康狀況等),盡量控制飼料種類、品質、數量、飼養條件等,測量儀器要准確,標准試劑要校正,要避免觀測、記載、抄錄、計算中的錯誤。
第二章 資料的整理
一、名詞解釋
1、數量性狀資料:數量性狀是指能夠以量測或記數的方式表示其特徵的象狀,觀察測定數量性狀而獲得的數據稱為數量性狀資料。
2、質量性狀資料:質量性狀是指能觀察到而不能直接測量的性狀,觀察質量性狀而獲得的資料稱為質量性狀資料。
3、半定量(等級)資料:是指將觀察單位按所考察的性狀或指標的等級順序分組,然後清點各組觀察單位的次數而得到的資料。
4、計數資料:指用計數方式獲得的數量性狀資料。
5、計量資料:指用量測手段得到的數量性狀資料,即用度、量、衡等計量工具直接測定的數量性狀資料。
6、全距(極差):是資料中最大值與最小值之差。
7、組中值:分組後每一組的中點值稱為組中值,是該組的代表值。
二、簡答題
1、資料可以分為哪幾類?它們有何區別與聯系?
答:資料一般可以分為數量性狀資料、質量性狀資料、半定量資料三大類,其中數量性狀資料又包括計量資料和計數資料。區別:數量性狀資料是能夠以量測或計數的方式獲得的資料,質量性狀資料是只能觀察而不能直接測量的資料,半定量資料既有計數資料的特點又有程度或量的不同。聯系:三種不同類型的資料有時可根據研究目的和統計方法的要求將一種類型資料轉化成另一種類型的資料。
2、為什麼要對資料進行整理?對於計量資料,整理的基本步驟怎樣?
答:(1)由調查或試驗收集來的原始資料往往是零亂的,無規律可循。只有通過統計整理,才能發現其內部的聯系和規律性,從而揭示事物的本質。資料整理是進行統計分析的基礎。
(2)計量資料整理的基本步驟包括:①求全距,全距即為資料中最大值與最小值之差。②確定組數,一般根據樣本含量及資料的變動范圍大小確定組數。③確定組距,通常根據等距離分組的原則,組距等於全距除以組數。④確定組限和組中值,各組的最大值為組上限,最小值為組下限;每一組的中點值稱為組中值。⑤歸組劃線計數,作次數分布表。
3、在對計量資料進行整理時,為什麼第一組的組中值以接近或等於資料中的最小值為好?
答:在對計量資料進行整理時,第一組的組中值以接近或等於資料中的最小值可以避免第一組中觀察值過多的情況,同時也確保資料中最小值不會遺漏。
4、統計表與統計圖有何用途?常用統計圖有哪些?常用統計表有哪些?列統計表、繪統計圖時,應注意什麼?
答:(1)統計表用表格形式來表示數量關系;統計圖用幾何圖形來表示數量關 系。用統計表和統計圖可以把研究對象的特徵、內部構成、相互關系等簡明、形象地表達出來,便於比較分析。
(2)常用的統計圖有長條圖、圓圖、線圖、直方圖和折線圖等。
(3)常用的統計表有簡單表和復合表兩大類。
(4)列統計表的注意事項:①標題要簡明扼要、准確地說明表的內容,有時須註明時間、地點。②標目分橫標目和縱標目兩項,橫標目列在表的左側,用以表示被說明事物的主要標志;縱標目列在表的上端,說明橫標目各統計指標內容,並註明計算單位。③數字一律用阿拉伯數字,數字小數點對齊,小數位數一致,無數字的用「—」表示,數字是「0」的須寫「0」。④表的上下兩條邊線略粗,縱、橫標目間及合計用細線分開,表的左右邊線可以省去,表的左上角一般不用斜線。
(5)繪統計圖的注意事項:①標題簡明扼要並列於圖的下方。②縱、橫兩軸應有刻度,註明單位。③橫軸由左至右,縱軸由上而下,數值由小到大;圖形長寬比例約為5:4或6:5。④圖中需用不同顏色或線條表示不同事物時應有圖例說明。
第三章 平均數、標准差與變異系數
一、名詞解釋
1、算術平均數:是指資料中各觀測值的總和除以觀測值個數所得的商,簡稱平均數或均數。
2、無偏估計:當一個統計量的數學期望等於所估計的總體參數時,則稱此統計量為該總體參數的無偏估計。
3、幾何均數:n個觀測值相乘之積開n次方所得的方根稱為幾何均數,記為G。
4、中位數:將資料內所有觀測值從小到大依次排列,位於中間的那個觀測值稱為中位數,記為Md。
5、眾數:資料中出現次數最多的那個觀測值或次數最多一組的組中值稱為眾數,記為Mo。
6、調和平均數:資料中各觀測值倒數的算術平均數的倒數稱為調和平均數,記為H。
7、標准差:統計學上把樣本方差S2的平方根叫做樣本標准差,記做S。
8、方差:統計量Σ(x - )2/(n - 1)稱為均方,又稱樣本方差,記為S2。
9、離均差平方和(平方和):各個觀測值與平均數的離差(x - )稱為離均差,各個離均差平方再求和即為離均差平方和,簡稱平方和,記為SS。
10、變異系數:標准差與平均數的比值稱為變異系數,是衡量資料中各觀測值變異程度的另一個統計量,記做C.V。
二、簡答題
1、生物統計中常用的平均數有幾種?各在什麼情況下應用?
答:生物統計中常用的平均數有算術平均數、幾何平均數、調和平均數、中位數和眾數。算術平均數較常用,簡稱平均數,當資料呈正態分布時可用算術平均數描述其中心位置。幾何均數主要應用於畜牧、水產業的動態分析,畜禽疾病及葯物效價的統計分析,如畜禽、水產養殖的增長率,抗體的滴度,葯物的效價,畜禽疾病的潛伏期等。調和均數主要用於反映畜群不同階段的平均增長率或畜群不同規模的平均規模。當所獲得的數據資料呈偏態分布時中位數的代表性優於算術平均數。眾數也適用於資料呈偏態分布的情況。
2、算術平均數有哪些基本性質?
答:算術平均數的兩個基本性質是:①離均差之和等於零。
②離均差平方和最小。
3、標准差有哪些特性?
答:標准差的特性主要表現在四個方面:
①標准差的大小受資料中每個觀測值的影響,若觀測值間變異大求得的標准差也大,反之則小。
②在計算標准差時,在各觀測值加上或減去一個常數,其數值不變。
③當每個觀測值乘以或除以一個常數a,則所得的標准差是原來標准差的a倍或1/a倍。
④在資料服從正態分布的條件下,資料中約有68.26%的觀測值在平均數左右1倍標准差 ( ±S)范圍內;約有95.43%的觀測值在平均數左右2倍標准差 ( ±2S)范圍內;約有99.73%的觀測值在平均數左右3倍標准差 ( ±3S)范圍內。
4、為什麼變異系數要與平均數、標准差配合使用?
答:變異系數是標准差與平均數的比值,是衡量資料中各觀測值變異程度的另一個統計量。當進行兩個或多個資料變異程度的比較時,若度量單位與平均數相同,可以直接利用標准差來比較;若單位和(或)平均數不同時,比較其變異程度就不能採用標准差,而要用變異系數。變異系數可以消除單位和(或)平均數不同對兩個或多個資料變異程度比較的影響。
第四章 常用概率分布
一、名詞解釋
1、必然現象:某類現象是可預言其結果的,即在保持條件不變的情況下,重復進行試驗,其結果總是確定的,這類現象稱為必然現象。
2、隨機現象:某類現象事前不可預言其結果的,即在保持條件不變的情況下,重復進行試驗,其結果未必相同,這類現象稱為隨機現象。
3、隨機試驗:一個試驗若滿足下述三個特性則稱為隨機試驗,簡稱試驗:①試驗可以在相同條件下多次重復進行。②每次試驗的可能結果不止一個,並且事先知道會有哪些可能的結果。③每次試驗總是恰好出現這些可能結果中的一個,但在一次試驗之前卻不能肯定這次試驗會出現哪個結果。
4、隨機事件:隨機試驗的每一種可能結果,在一定條件下可能發生,也可能不發生,稱為隨機事件,簡稱事件。
5、概率的統計定義:在相同條件下進行n次重復試驗,若隨機事件A發生的次數為m,那麼m/n稱為隨機事件A的頻率;當試驗重復數n逐漸增大時,隨機事件A的頻率越來越穩定地接近某一數值P,那麼就把P稱為隨機事件A的概率。這樣定義的概率稱為統計概率,也叫後驗概率。
6、小概率原理:若隨機事件的概率很小,例如小於0.05、0.01、0.001,稱之為小概率事件;在統計學上,把小概率事件在一次試驗中看成是實際不可能發生的事件稱為小概率事件實際不可能性原理,簡稱小概率原理。
7、隨機變數:作一次試驗,其結果有多種可能,每一種可能結果都可以用一個數來表示,把這些數作為變數x的取值范圍,則試驗結果可用隨機變數x來表示。
8、離散型隨機變數:如果表示試驗結果的變數x,其可能取值至多為可數個,且以各種確定的概率取這些不同的值,則稱x為離散型隨機變數。
9、連續型隨機變數:如果表示試驗結果的變數x,其可能取值為某范圍內的任何數值,且x在其取值范圍內的任一區間中取值時,其概率是確定的,則稱x為連續型隨機變數。
9、標准正態分布:μ = 0,δ2 = 1 的正態分布稱為標准正態分布。
10、標准正態變數(標准正態離差):任何一個服從正態分布N(μ,δ2)的隨機變數x,都可以通過標准化變換:u = (x –μ)/δ,將其變換為服從標准正態分布的隨機變數u,u稱為標准正態變數。
11、雙側概率(兩尾概率):隨機變數x落在平均數μ加減不同倍數標准差δ區間之外的概率稱為雙側概率。
12、單側概率(一尾概率):隨即變數x小於μ-kδ或大於μ+kδ的概率稱為單側概率。
13、貝努利試驗:對於n次獨立的試驗,如果每次試驗結果出現且只出現對立事件A與A之一,在每次試驗中出現A的概率是常數p(0
14、返置抽樣:由總體隨即抽樣時,每次抽出一個個體後,這個個體還返置回原總體,則稱為返置抽樣。
15、不返置抽樣:由總體隨即抽樣時,每次抽出的個體不返置回原總體,則稱為不返置抽樣。
16標准誤:即平均數抽樣總體的標准差,其大小反映樣本平均數 的抽樣誤差的大小,即精確性的高低。
17、樣本平均數的抽樣總體:樣本平均數也是一個隨機變數,其概率分布叫做樣本平均數的抽樣分布,由樣本平均數 構成的總體稱為樣本平均數的抽樣總體。
18、中心極限定理:若隨機變數x服從正態分布N(μ,δ2),x1,x2,……,xn是由總體得來的隨機樣本,則統計量 = Σx/n的概率分布也是正態分布,且有μ = μ,δ =δ/ n ,即 服從正態分布N(μ,δ2/n);若隨機變數服從平均數是μ,方差是δ2的分布(不是正態分布),x1,x2,……,xn是由總體得來的隨機樣本,則統計量 = Σx/n的概率分布,當n相當大時逼近正態分布N(μ,δ2/n)。
二、簡答題
1、事件的概率具有那些基本性質?
答:事件的概率一般具有以下三個基本性質:
①對於任何事件A,有0≤ P(A) ≤1
②必然事件的概率為1,即P(Ω)=1
③不可能事件的概率為0,即P(Ф)=0
2、離散型隨機變數概率分布與連續型隨機變數概率分布有何區別?
答:離散型隨機變數概率分布常用分布列來表示,其具有Pi ≥0和ΣPi = 1兩個基本性質。連續型隨機變數的概率分布不能用分布列來表示,其可能取的值是不可數的,一般用隨機變數x在某個區間內取值的概率P(a ≤x )
3、標准誤與標准差有何聯系與區別?
答:樣本標准差與樣本標准誤是既有聯系又有區別的兩個統計量,二者的聯系是:樣本標准誤等於樣本標准差除以根號下樣本含量。二者的區別在於:樣本標准差是反映樣本中各觀測值x1,x2,……,xn變異程度大小的一個指標,它的大小說明了 對該樣本代表性的強弱。樣本標准誤是樣本平均數 1, 2,…… k的標准差,它是 抽樣誤差的估計值,其大小說明了樣本間變異程度的大小及 精確性的高低。
4、樣本平均數抽樣總體與原始總體的兩個參數間有何聯系?
答:①樣本平均數抽樣總體的平均數等於原始總體的平均數。
②樣本平均數抽樣總體的標准差等於與原始總體的標准差除以根號下樣本含量。
5、t分布與標准正態分布有何區別與聯系?
答:t分布與標准正態分布曲線均以縱軸為對稱軸,左右對稱。與標准正態分布曲線相比t分布曲線頂部略低,兩尾部稍高而平;df越小這種趨勢越明顯。df越大,t分布越趨近於標准正態分布,當n>30時,t分布與標准正態分布的區別很小;n>100時,t分布基本與標准正態分布相同;n→∞時,t分布與標准正態分布完全一致。
第五章 t檢驗
一、名詞解釋
1、假設檢驗(顯著性檢驗):主要包括提出無效假設和備擇假設,再根據小概率實際不可能性原理來否定或接受無效假設,實際上是應用「概率性質的反證法」對試驗樣本所屬總體所做的無效假設的統計推斷。
2、無效假設:是顯著性檢驗中被檢驗的假設,其意義是試驗的表面效應是試驗誤差,處理無效,記作H0。
3、備擇假設:顯著性檢驗時在無效假設被否定時准備接受的假設,其意義是試驗的表面效應是處理效應,處理有效,記做HA。
4、顯著水平:顯著性檢驗中用來確定否定或接受無效假設的概率標准叫顯著水平,記做α,在生物學研究中常取α=0.05或α=0.01。
5、Ⅰ型錯誤:真實情況是H0成立卻否定了它,犯了「棄真」錯誤,稱為Ⅰ型錯誤。
6、Ⅱ型錯誤:真實情況是H0不成立卻接受了它,犯了「納偽」錯誤,稱為Ⅱ型錯誤。
7、檢驗功效(檢驗力、把握度):犯Ⅱ型錯誤的概率用β表示,而1-β稱為檢驗功效,其意義是當兩總體確有差別(即HA成立)時,按α水平能發現它們有差別的能力。
8、雙側檢驗(雙尾檢驗):利用兩尾概率進行的檢驗叫雙側檢驗,tα為雙側檢驗的臨界t值。
9、單側檢驗(單尾檢驗):利用一尾概率進行的檢驗叫單側檢驗,此時tα為單側檢驗的臨界t值;顯然單側檢驗的tα=雙側檢驗的t2α。
10、非配對設計(成組設計):是指當進行只有兩個處理的試驗時,將試驗單位完全隨機地分成兩組,然後對兩組隨機施加一個處理,兩組的試驗單位相互獨立,所得的兩個樣本相互獨立,其含量不一定相等。
11、配對設計:是指先根據配對的要求將試驗單位兩兩配對,然後將配成對子的兩個試驗單位隨機地分配到兩個處理組中去;配對的要求是配成對子的兩個試驗單位的初始條件盡量一致,不同對子間試驗單位的初始條件允許有差別。
12、自身配對:指同一試驗單位在兩個不同時間上分別接受前後兩次處理,用其前後兩次的觀測值進行自身對照比較;或同一試驗單位的不同部位的觀測值或不同方法的觀測值進行自身對照比較。
13、同源配對:指將來源相同、性質相同的兩個個體配成一對,如將畜別、品種、窩別、性別、年齡、體重相同的兩個試驗動物配成一對,然後將配對的兩個個體隨機地實施不同處理。
14、參數估計:是統計推斷的一個重要內容,就是用樣本統計量來估計總體參數。
15、點估計:將樣本統計量直接作為總體相應參數的估計值叫點估計。
16、區間估計:在一定概率的保證下指出總體參數的可能范圍叫區間估計。
17、置信區間:區間估計時所給出的可能范圍叫置信區間。
18、置信度(置信概率):區間估計時給出的概率保證稱為置信度。
二、簡答題
1、為什麼在分析試驗結果時需要進行顯著性檢驗?檢驗的目的是什麼?
答:通過樣本來推斷總體是生物統計的基本特點,即通過抽樣研究用樣本信息來推斷總體的特徵。由一個樣本平均數來估計總體平均數時,樣本平均數包含抽樣誤差,用包含抽樣誤差的樣本平均數來推斷總體,其結論並不是絕對正確的。所以在分析試驗結果時需要進行顯著性檢驗。顯著性檢驗的目的是通過樣本對其所在的總體作出符合實際的推斷,即分析試驗的表面效應是由試驗處理效應還是由試驗誤差引起的,推斷試驗的處理效應是否存在。
2、什麼是統計假設?統計假設有哪幾種?各有何含義?
答:統計假設(統計推斷)是根據樣本和假定模型對總體作出的以概率形式表述的推斷。統計假設主要包括假設檢驗(顯著性檢驗)和參數估計兩個內容。假設檢驗(顯著性檢驗)的含義:提出無效假設和備擇假設,再根據小概率實際不可能性原理來否定或接受無效假設,實際上是應用「概率性質的反證法」對試驗樣本所屬總體所做的無效假設的統計推斷。參數估計的含義:用樣本統計量來估計總體參數。
3、顯著性檢驗的基本步驟是什麼?根據什麼確定顯著水平?
答:1、顯著性檢驗的基本步驟:
(1)首先對試驗樣本所在的總體作假設。
(2)在無效假設成立的前提下,構成合適的統計量,並研究試驗所得統計量的抽樣分布,計算無效假設正確的概率。
(3)根據「小概率實際不可能性原理」否定或接受無效假設。
2、確定顯著水平的標准通常採用小概率事件的標准,即0.05和0.01。選擇顯著水平應根據試驗的要求或試驗結論的重要性而定。若試驗中難以控制的因素較多,試驗誤差可能較大,則顯著水平標准可選低些,即α值取大些;反之若試驗耗費較大,對精確度的要求較高,不容許反復,或者試驗結論的應用事關重大,則所選顯著水平標准應高些,即α值取小些。
4、什麼是統計推斷?為什麼統計推斷的結論有可能發生錯誤?有哪兩類錯誤?如何降低兩類錯誤?
答:(1)統計推斷是根據樣本和假定模型對總體作出以概率形式表述的推斷。
(2)統計推斷是根據「小概率實際不可能性原理」來否定或接受無效假設的,所以不論是接受還是否定無效假設都沒有100%的把握,會發生錯誤。
(3)在檢驗無效假設H0時可能犯兩種錯誤,其中真實情況是H0成立卻否定了它,犯了「棄真」錯誤,稱為Ⅰ型錯誤;真實情況是H0不成立卻接受了它,犯了「納偽」錯誤,稱為Ⅱ型錯誤。
(4)犯Ⅰ型錯誤的概率用α表示,犯Ⅱ型錯誤的概率用β表示。α即是顯著水平,β的大小與α值的大小有關,所以在選用檢驗的顯著水平時應考慮犯Ⅰ、Ⅱ型錯誤所產生後果嚴重性的大小,還應考慮到試驗的難以及試驗結果的重要程度。降低α值可降低犯Ⅰ型錯誤的概率但會加大犯Ⅱ型錯誤的概率(在其他因素確定時,α值越小β值越大)。若一個試驗耗費大,可靠性要求高,不允許反復,或試驗結論的使用事關重大,容易產生嚴重後果,α值應取小些;對於一些試驗條件不易控制、試驗誤差較大的試驗α值取大些。同時,在提高顯著水平即減小α值時,為了減小犯Ⅱ型錯誤的概率可適當增大樣本含量。
5、雙側檢驗、單側檢驗各在什麼條件下應用?二者有何關系?
答:(1)選用雙側檢驗還是單側檢驗應根據專業知識及問題的要求在試驗設計時確定。一般若事先不知道所比較的兩個處理效果誰好誰壞,分析的目的在於推斷兩個處理效果有無差別,則選用雙側檢驗;若根據理論知識或試驗經驗判斷甲處理的效果不會比乙處理的效果差(或相反),分析的目的在於推斷甲處理是否比乙處理好(或差),則用單側檢驗。一般情況下不做特殊說明均用雙側檢驗。
(2)二者的關系:單側檢驗的tα=雙側檢驗的t2α,可見雙側檢驗顯著單側檢驗一定顯著,單側檢驗顯著雙側檢驗未必顯著。
6、進行顯著性檢驗應注意什麼問題?如何理解顯著性檢驗結論中的「差異不顯著」、「差異顯著」、「差異極顯著」?
答:(1)顯著性檢驗中應注意的問題:
①為了保證試驗結果的可靠及正確,要有嚴密合理的試驗或抽樣設計,保證各樣本是從相應同質總體中隨機抽取的,並且處理要有可比性,即除比較的處理外,其他影響因素應盡可能控制相同或基本接近。
②選用的顯著性檢驗方法應符合其應用條件。
③要正確理解差異顯著或極顯著的統計意義。
④合理建立統計假設,正確計算檢驗統計量。
⑤結論不能絕對化。
⑥報告結論時應列出,由樣本算得的檢驗統計量值,註明是單側檢驗還是雙側檢驗,並寫出P值的確切范圍,如0.01
(2)顯著性檢驗結論中的「差異不顯著」表示P>0.05,接受H0,否認HA,處理無效,記作「ns」;「差異顯著」表示0.010,接受HA,處理有效,記作「*」;「差異極顯著」表示P≤0.01,更加否認H0,接受HA,處理有效,嘉作「**」。
7、配對試驗設計與非配對試驗設計有何區別?
答:非配對設計(成組設計)是指當進行只有兩個處理的試驗時,將試驗單位完全隨機地分成兩組,然後對兩組隨機施加一個處理,兩組的試驗單位相互獨立,所得的兩個樣本相互獨立,其含量不一定相等。配對設計是指先根據配對的要求將試驗單位兩兩配對,然後將配成對子的兩個試驗單位隨機地分配到兩個處理組中去。非配對設計要求試驗單位盡可能一致,配對設計要求配成對子的兩個試驗單位的初始條件盡量一致,不同對子間試驗單位的初始條件允許有差別。一般說來,相對於非配對設計,配對設計能夠提高試驗的精確性。
⑸ 什麼是生物統計
生物統計(shengwu tongji,biostatistics,biometry,biometrics)含義 應用於中的數理統計方法。即用數理統計的原理和方法,分析和解釋生物界的種種現象和數據資料,以求把握其本質和規律性。
發展簡況
最早提出生物統計思想的是比利時數學家L.A.J.凱特萊,他試圖把統計學的理論應用於解決生物學、醫學和社會學中的問題。1866年,揭示了遺傳的基本規律,這是最早運用數理統計於生物實驗的一個成功的範例(見)。1889年,在《自然的遺傳》一書中,通過對人體身高的研究指出,子代的身高不僅與親代的身高相關,而且有向平均值「回歸」的趨勢,由此提出了「回歸」和「相關」的概念和演算法,從而奠定了生物統計的基礎。高爾頓的學生K.皮爾遜進一步把統計學應用於生物研究,提出了實際測定數與理論預期數之間的偏離度指數即卡方差()的概念和演算法,這在屬性的統計分析上起了重要作用。1899年,他創辦了《生物統計》雜志,還建立了一所數理統計學校。他的學生W.S.戈塞特對樣本標准差作了許多研究,並於1908年以「Student」的筆名將t-檢驗法發表於《生物統計》雜志上。此後,t-檢驗法就成了生物統計學中的基本工具之一。英國數學家指出,只注意事後的數據分析是不夠的,事先必須作好實驗設計。他使實驗設計成了生物統計的一個分支。他的學生G.W.斯奈迪格把變異來源不同的均方比值稱為F值,並指出當值大於理論上 5%概率水準的值時,該項變異來源的必然性效應就從偶然性變數中分析出來了,這就是「方差分析法」。上述這些方法對於農業科學、生物學特別是的研究,起了重大的推動作用,20世紀20年代以來,各種數理統計方法陸續創立,它們在實驗室、田間、飼養和臨床實驗中得到廣泛應用並日益擴大到整個工業界。70年代,隨著計算機的普及,使本來由於計算量過大而不得不放棄的統計方法又獲得了新的生命力,應用更為廣泛,並在現代科技中佔有十分重要的地位。
⑹ 生物統計中***p 代表什麼
P 值即概率,反映某一事件發生的可能性大小,即一種在原假設為真的前提下出現觀察樣本以及更極端情況的概率。
⑺ 生物統計的參數
一個觀測對象(如一個7歲男孩)的某些性狀(如身高等)的量度結果,稱為一個個體。來源相同的各個個體(如各個 7歲男孩的身高值)之間的差異稱為個體變異。總體是通過統計所欲了解的對象,其中的個體可以是有限的也可以是無限的。觀測數據可以是計數的(離散的)(如單位面積中的昆蟲數),也可以是計量的(如身高、體重、血壓、肺活量等)。總體最基本的參數有兩類:表示水平的稱為位置參數或型值,如平均數、中位數、率等;反映個體差異大小的稱為分散度參數,如標准差、極差等。總體參數是一個客觀存在但通常卻又是未知的常數。只能用樣本去估計它。這樣做自然會有誤差。樣本平均數,即
[1432-01]其中表示第 個個體的觀測值;為樣本中的個體數,稱為樣本大小;∑為求和號,∑表示的合計凡是從樣本計算出來的數值都稱為統計量,它是對相應的總體值的一種估計例如是總體均數的一種估計。若總體均數正好等於,則稱為 的無偏估計,意謂用估計雖有誤差但平均來說是無偏的。此時又稱 為 的期望,記作[1432-02]。
⑻ 生物統計 三因素三水平怎麼描述結果
都用L9,(3,4)交表! 點該交表4素列用進行3素試驗空列空列用考察(交互作用+純誤差)用進行4素試驗由於留空列所沒估計交互作用 仍通每處理設置重復考察純誤
⑼ 什麼是生物統計
生物統計學是一門探討如何從事生物學實驗研究的設計,取樣,分析,資料整理與推論的科學.
應用數理統計學來處理生物現象的學問。與其說是生物學的一個分科不如看作是生物學的方法論。與生物測量學大致具有同一涵義,但前者幾乎尚沒有深入到現象的統計處理機制,因此生物測量學作為稍狹義的東西,有時也與生物統計學有所區別。在物理學的測量中,測量誤差是重要問題,與此相應在生物學的研究中必須應用統計處理,其首要原因是變異。有意識地將數理統計學引入到生物學以及人類學領域的先驅者是克韋泰來特(L.A.J.Quetelet),隨後由高爾頓(F.Galton)的工作鞏固了生物測量學和優生學的基礎。數學家泊松(K.Pearson)繼承了他們的研究工作,進行了回歸和相關特別是復相關、泊松型分布數、頻率累加法、X2測驗等數理統計學的研究,並製成了很多統計數值表。他們把人們觀測的或能得到手的資料的全部作為對象,把平均值和離差作為問題,來考查其中的數學規律。數理統計學方法已適用於生物學和農業科學的實驗或試驗領域,但也是以整個資料或比試驗資料更大的抽象資料為依據的,因此人們開始意識到,在其現實是一種不能以其一部分作為研究對象的局面。於是就提出母集團和樣本的區別和關聯,以及從少數資料進行正確有效的推論的問題,這些問題被戈塞特[筆名(Student)]和費希爾(W.S.Gosset和R.A.Fisher)解決了。費希爾的工作指出,統計方法的目的在於得到資料的要點,為此,其分布法則是要以較少的母集團中的數目為特徵推想到無限的母集團,而實際的資料就是從它們之中隨機抽出的樣本。基於此點,在母集團數的統計上的無偏性、一致性、有效性、充分性的概念,構成了解消假設的驗定,最優法等的理論。這就是費希爾派的數理統計學,也特稱推計學。
⑽ 生物統計學結合單因素和多因素試驗的不同比較處理和水平
第二節試驗方案
一、試驗因素與水平
如上節所述,試驗方案是根據試驗目的和要求所擬進行比較的一組試驗處理(treatment)的總稱。農業與生物學研究中,不論農作物還是微生物,其生長、發育以及最終所表現的產量受多種因素的影響,其中有些屬自然的因素,如光、溫、濕、氣、土、病、蟲等,有些是屬於栽培條件的,如肥料、水分、生長素、農葯、除草劑等。進行科學試驗時,必須在固定大多數因素的條件下才能研究一個或幾個因素的作用,從變動這一個或幾個因子的不同處理中比較鑒別出最佳的一個或幾個處理。這里被固定的因子在全試驗中保持一致,組成了相對一致的試驗條件;被變動並設有待比較的一組處理的因子稱為試驗因素,簡稱因素或因子(factor),試驗因素的量的不同級別或質的不同狀態稱為水平(level)。試驗因素水平可以是定性的,如供試的不同品種,具有質的區別,稱為質量水平;也可以是定量的,如噴施生長素的不同濃度,具有量的差異,稱為數量水平。數量水平不同級別間的差異可以等間距,也可以不等間距。所以試驗方案是由試驗因素與其相應的水平組成的,其中包括有比較的標准水平。
試驗方案按其供試因子數的多少可以區分為以下3類:
(1) 單因素試驗(single-factor
experiment)單因素試驗是指整個試驗中只變更、比較一個試驗因素的不同水平,其他作為試驗條件的因素均嚴格控制一致的試驗。這是一種最基本的、最簡單的試驗方案。例如在育種試驗中,將新育成的若干品種與原有品種進行比較以測定其改良的程度,此時,品種是試驗的唯一因素,各育成品種與原有品種即為各個處理水平,在試驗過程中,除品種不同外,其它環境條件和栽培管理措施都應嚴格控制一致。又例如為了明確某一品種的耐肥程度,施肥量就是試驗因素,試驗中的處理水平就是幾種不同的施肥量,品種及其它栽培管理措施都相同。
(2) 多因素試驗(multiple-factor or factorial
experiment)多因素試驗是指在同一試驗方案中包含2個或2個以上的試驗因素,各個因素都分為不同水平,其他試驗條件均應嚴格控制一致的試驗。各因素不同水平的組合稱為處理組合(treatment
combination)。處理組合數是各供試因素水平數的乘積。這種試驗的目的一般在於明確各試驗因素的相對重要性和相互作用,並從中評選出1個或幾個最優處理組合。如進行甲、乙、丙3個品種與高、中、低3種施肥量的2因素試驗,共有甲高、甲中、甲低、乙高、乙中、乙低、丙高、丙中、丙低等3×3=9個處理組合。這樣的試驗,除了可以明確2個試驗因素分別的作用外,還可以檢測出3個品種對各種施肥量是否有不同反應並從中選出最優處理組合。生物體生長受到許多因素的綜合作用,採用多因素試驗,有利於探究並明確對生物體生長有關的幾個因素的效應及其相互作用,能夠較全面地說明問題。多因素試驗的效率常高於單因素試驗。
(3) 綜合性試驗(comprehensive
experiment)這也是一種多因素試驗,但與上述多因素試驗不同。綜合性試驗中各因素的各水平不構成平衡的處理組合,而是將若干因素的某些水平結合在一起形成少數幾個處理組合。這種試驗方案的目的在於探討一系列供試因素某些處理組合的綜合作用,而不在於檢測因素的單獨效應和相互作用。單因素試驗和多因素試驗常是分析性的試驗;綜合性試驗則是在對於起主導作用的那些因素及其相互關系已基本清楚的基礎上設置的試驗。它的處理組合就是一系列經過實踐初步證實的優良水平的配套。例如選擇一種或幾種適合當地條件的綜合性豐產技術作為試驗處理與當地常規技術作比較,從中選出較優的綜合性處理。
二、試驗指標與效應
用於衡量試驗效果的指示性狀稱試驗指標(experimental
indicator)。一個試驗中可以選用單指標,也可以選用多指標,這由專業知識對試驗的要求確定。例如農作物品種比較試驗中,衡量品種的優劣、適用或不適用,圍繞育種目標需要考察生育期(早熟性)、豐產性、抗病性、抗蟲性、耐逆性等多種指標。當然一般田間試驗中最主要的常常是產量這個指標。各種專業領域的研究對象不同,試驗指標各異。例如研究殺蟲劑的作用時,試驗指標不僅要看防治後植物受害程度的反應,還要看昆蟲群體及其生育對殺蟲劑的反應。在設計試驗時要合理地選用試驗指標,它決定了觀測記載的工作量。過簡則難以全面准確地評價試驗結果,功虧一簣;過繁瑣又增加許多不必要的浪費。試驗指標較多時還要分清主次,以便抓住主要方面。
試驗因素對試驗指標所起的增加或減少的作用稱為試驗效應(experimental
effect)。例如,某水稻品種施肥量試驗,每畝施氮10kg,畝產量為350kg,每畝施氮15kg,畝產量為450kg;則在每畝施氮10kg的基礎上增施5kg的效應即為450-350=100(kg/畝)。這一試驗屬單因素試驗,在同一因素內兩種水平間試驗指標的相差屬簡單效應(simple
effect)。在多因素試驗中,不但可以了解各供試因素的簡單效應,還可以了解各因素的平均效應和因素間的交互作用。表1.1為某豆科植物施用氮(N)、磷(P)的2×2=4種處理組合(N1P1,N1P2,N2P1,N2P2)試驗結果的假定數據,用以說明各種效應。(1)一個因素的水平相同,另一因素不同水平間的產量差異仍屬簡單效應。如表1.1Ⅱ中18-10=8就是同一N1水平時P2與P1間的簡單效應;28-16=12為在同一N2水平時P2與P1間的簡單效應;16-10=6為同一P1水平時N2與N1間的簡單效應;28-18=10為同一P2水平時N2與N1間的簡單效應。(2)一個因素內各簡單效應的平均數稱平均效應,亦稱主要效應(main
effect),簡稱主效。如表1.1Ⅱ中N的主效為(6+10)/2=8,這個值也是二個氮肥水平平均數的差數,即22-14=8;P的主效為(8+12)/2=10,也是二個磷肥水平平均數的差數,即23-13=10。(3)兩個因素簡單效應間的平均差異稱為交互作用效應(interaction
effect),簡稱互作。它反映一個因素的各水平在另一因素的不同水平中反應不一致的現象。將表1.1以圖1.1表示,可以明確看到,Ⅰ中的二直線平行,反應一致,表現沒有互作。交互作用的具體計算為(8-8)/2=0,或(6-6)/2=0。圖1.1Ⅱ中P2-P1在N2時比在N1時增產幅度大,直線上升快,表現有互作,交互作用為(12-8)/2=2,或為(10-6)/2=2,這種互作稱為正互作。圖1.1Ⅲ和Ⅳ中,P2-P1在N2時比在N1時增產幅度表現減少或大大減產,直線上升緩慢,甚至下落成交叉狀,這是有負互作。Ⅲ中的交互作用為(4-8)/2=-2,Ⅳ中為(-2-8)/2=-5。
表1.12×2試驗數據(解釋各種效應)
試驗
因素
N
Ⅰ
P
水平
N1
N2
平均
N2-N1
P1
10
16
13
6
P2
18
24
21
6
平均
14
20
6
P2-P1
8
8
8
0,0/2=0
Ⅱ
P
水平
N1
N2
平均
N2-N1
P1
10
16
13
6
P2
18
28
23
10
平均
14
22
8
P2-P1
8
12
10
4,4/2=2
Ⅲ
P
水平
N1
N2
平均
N2-N1
P1
10
16
13
6
P2
18
20
19
2
平均
14
18
4
P2-P1
8
4
6
-4,-4/2=-2
Ⅳ
P
水平
N1
N2
平均
N2-N1
P1
10
16
13
6
P2
18
14
16
-4
平均
14
15
1
P2-P1
8
-2
3
-10,-10/2=-5
因素間的交互作用只有在多因素試驗中才能反映出來。互作顯著與否關繫到主效的實用性。若交互作用不顯著,則各因素的效應可以累加,主效就代表了各個簡單效應。在正互作時,從各因素的最佳水平推論最優組合,估計值要偏低些,但仍有應用價值。若為負互作,則根據互作的大小程度而有不同情況。Ⅲ中由單增施氮(N2P1)及單增施磷(N1P2)來估計氮、磷肥皆增施(N2P2)的效果會估計過高,但N2P2還是最優組合,還有一定的應用價值。而Ⅳ中N2P2反而減產,如從各因素的最佳水平推論最優組合將得出錯誤的結論。
Ⅰ
Ⅱ
Ⅲ
Ⅳ
圖1.12×2試驗的圖示(解釋交互作用)
兩個因素間的互作稱為一級互作(first order
interaction)。一級互作易於理解,實際意義明確。三個因素間的互作稱二級互作(second order
interaction),余類推。二級以上的高級互作較難理解,實際意義不大,一般不予考察。
三、制訂試驗方案的要點
擬訂一個正確有效的試驗方案,以下幾方面供參考:
1.
擬訂試驗方案前應通過回顧以往研究的進展、調查交流、文獻探索等明確試驗的目的,形成對所研究主題及其外延的設想,使待擬訂的試驗方案能針對主題確切而有效地解決問題。
2.
根據試驗目的確定供試因素及其水平。供試因素一般不宜過多,應該抓住1~2個或少數幾個主要因素解決關鍵性問題。每因素的水平數目也不宜過多,且各水平間距要適當,使各水平能有明確區分,並把最佳水平范圍包括在內。例如通過噴施矮壯素以控制某種植物生長,其濃度試驗設置50、100、150、200、250ppm等5個水平,其間距為50ppm。若間距縮小至10ppm便須增加許多處理,若處理數不多,參試濃度的范圍窄,會遺漏最佳水平范圍,而且由於水平間差距過小,其效應因受誤差干擾而不易有規律性地顯示出來。如果涉及試驗因素多,一時難以取捨,或者對各因素最佳水平的可能范圍難以作出估計,這時可以將試驗分為兩階段進行,即先做單因素的預備試驗,通過拉大幅度進行初步觀察,然後根據預備試驗結果再精細選取因素和水平進行正規試驗。預備試驗常採用較多的處理數,較少或不設重復;正規試驗則精選因素和水平,設置較多的重復。為不使試驗規模過大而失控,試驗方案原則上應力求簡單,單因素試驗可解決的就不一定採用多因素試驗。
3.
試驗方案中應包括有對照水平或處理,簡稱對照(check,符號CK)。品種比較試驗中常統一規定同一生態區域內使用的標准(對照)種,以便作為各試驗單位共同的比較標准。
4.
試驗方案中應注意比較間的唯一差異原則,以便正確地解析出試驗因素的效應。例如根外噴施磷肥的試驗方案中如果設噴磷(A)與不噴磷(B)兩個處理,則兩者間的差異含有磷的作用,也有水的作用,這時磷和水的作用混雜在一起解析不出來,若加進噴水(C)的處理,則磷和水的作用可分別從A與C及B與C的比較中解析出來,因而可進一步明確磷和水的相對重要性。
5.
擬訂試驗方案時必須正確處理試驗因素及試驗條件間的關系。一個試驗中只有供試因素的水平在變動,其他因素都保持一致,固定在某一個水平上。根據交互作用的概念,在一種條件下某試驗因子的最優水平,換了一種條件,便可能不再是最優水平,反之亦然。這在品種試驗中最明顯。例如在生產上大面積推廣的揚麥1號小麥品種、農墾58號水稻品種,在品比試驗甚至區域試驗階段都沒有顯示出它們突出的優越性,而是在生產上應用後,倒過來使主管部門重新認識其潛力而得到廣泛推廣的。這說明在某種試驗條件下限制了其潛力的表現,而在另一種試驗條件下則激發了其潛力的表現。因而在擬訂試驗方案時必須做好試驗條件的安排,絕對不要以為強調了試驗條件的一致性就可以獲得正確的試驗結果。例如品種比較試驗時要安排好密度、肥料水平等一系列試驗條件,使之具有代表性和典型性。由於單因子試驗時試驗條件必然有局限性,可以考慮將某些與試驗因素可能有互作(特別負互作)的條件作為試驗因素一起進行多因素試驗,或者同一單因素試驗在多種條件下分別進行試驗。
6.
多因素試驗提供了比單因素試驗更多的效應估計,具有單因素試驗無可比擬的優越性。但當試驗因素增多時,處理組合數迅速增加,要對全部處理組合進行全面試驗(稱全面實施)規模過大,往往難以實施,因而以往多因素試驗的應用常受到限制。解決這一難題的方法就是利用本書後文將介紹的正交試驗法,通過抽取部分處理組合(稱部分實施)用以代表全部處理組合以縮小試驗規模。這種方法犧牲了高級交互作用效應的估計,但仍能估計出因素的簡單效應、主要效應和低級交互作用效應,因而促進了多因素試驗的應用。