導航:首頁 > 生物信息 > 生物統計學實驗設術怎麼寫

生物統計學實驗設術怎麼寫

發布時間:2023-04-30 08:24:09

❶ 生物統計學中研究的誤差有那些 各有何特點 在實際統計分析中如何對待

生物統計學分析的第一步是資料的收集和整理。收集資料主要有調研和開展生物學試驗兩種方法,而資料的整理主要通過對原始資料的核查、校對,製作次數分布表和次數分布圖來完成。生命科學領域的試驗資料一般都具有集中性、離散性及分布形態三個基本特徵:集中性主要利用算術平均數、中位數、幾何平均數等反映;離散性主要通過標准差、方差、變異系數等特徵數進行度量;分布形態則主要藉助偏度和峰度體現。本章首先介紹總體與變數等最基本的生物統計學名詞術語,繼而結合實例,應用軟體來闡明實驗原始數據整理的具體方法,並對實驗數據的特徵進行統計分析,全面闡明數據資料的整理分析方法。
在科學試驗與調查中,常常會得到大量的原始數據,這些對某種具體事物或現象觀察的結果稱為資料(data)。這些資料在統計分析前,一般是分散的、零星的和孤立的,是一堆無序的數字。為了揭示這些資料中所蘊含的科學意義,需要對其進行必要的整理分析,揭示其內在的規律。
2.1 常用統計學術語
為了更好地學習和理解後續章節的生物統計學知識,首先必須掌握以下幾組生物統計學基本概念。
2.1.1 總體、個體與樣本
總體(population)是指研究對象的全體,其中的每一個成員稱為個體(indivial)。依據構成總體的個體數目的多寡,總體可以分為有限總體(finitepopulation)和無限總體(infinitepopulation)。例如,研究珠母貝的殼高,因為無法估計出珠母貝的具體數量,可以認為珠母貝是無限總體。
總體的數目往往非常龐大,全部測定需要耗費大量的時間、人力和物力,甚至根本無法完全測定每一個個體;另外,有時候數據的獲取過程對研究對象具有破壞性,如要測定貝殼硬度,需要壓碎貝殼。因此,只能通過研究總體中的一部分個體來反映總體的特徵。從總體中隨機獲得部分個體的過程,稱為抽樣(sampling)。為了使抽樣的結果具有代表性,需要採取隨機抽樣(randomsampling)的方法,如對一個生物的總體,機會均等地抽取樣本,估計其總體的某種生物學特性。簡單的隨機抽樣的方法有抽簽、抓鬮、隨機數字表法等。從總體中抽取的一部分個體所組成的集合稱為樣本(sample)。樣本中個體的數量稱為樣本容量、樣本含量或樣本大小(samplesize),通常記為n。如果n≤30,則該樣本為小樣本;n>30,該樣本則為大樣本。例如,2009年3月,某珍珠養殖場為了調查2007年繁育的100萬只馬氏珠母貝生長情況,隨機取10籠,共227隻馬氏珠母貝。這里需要研究的100萬只馬氏珠母貝是總體,其中的每隻珠母貝則是個體,隨機抽取的全部227隻馬氏珠母貝是一個樣本。該樣本的樣本容量為227,遠大於30,屬於大樣本。
2.1.2 變數與常量
變數是研究對象所反映的指標,如海水中葉綠素a的含量,動物的體重、體長,魚的攝食量,酶活力,細胞的直徑,DNA分子的大小等。變數通常記作X或Y等大寫的英文字母,而變數的觀測值可以標記為x,稱為資料或數據。例如,測量一批魚的體長X,我們可以隨機抽取10尾魚作為一個樣本,測量它們的體長(x,cm),得到10個觀測值14.2、15.4、13.6、15.8、15.5、16.1、14.9、15.3、14.8、15.7,這里體長是變數X,而這10個觀測值就是樣本數據x。按照其可能取得的值,可將變數分為連續型變數(continuousvariable)和離散型變數(discretevariable)。連續型變數是指在某一個區間內可以取任何數值的變數,其測量值可無限細分,數值之間是連續不斷的。例如,50~60cm的水稻株高為連續變數,因為在該范圍內可取出無數個值,同樣,分子運動速度、魚的體重、貝類的殼高、酶活力的大小、DNA分子的大小等都屬於連續型隨機變數。連續型變數需通過測量才能獲得,其觀測值稱為連續型數據(continuousdata),也稱為度量數據(measurementdata),如長度值、時間、重量值等。如果變數可能取值的數值為自然數或整數,這種變數稱為離散型變數,其數值一般通過計數獲得,如魚、貝的懷卵量等。離散型變數的觀測值稱為離散型數據(discretedata),也稱為計數數據(countdata)。如果變數的取值,在一定的范圍內是一個相對穩定的數值,那麼這種變數稱為常量(constant)。例如,在一個小的時空范圍內,重力加速度是一個常量。常量的取值是一個常數,具有相對穩定性。

❷ 生物統計學結合單因素和多因素試驗的不同比較處理和水平

第二節試驗方案
一、試驗因素與水平
如上節所述,試驗方案是根據試驗目的和要求所擬進行比較的一組試驗處理(treatment)的總稱。農業與生物學研究中,不論農作物還是微生物,其生長、發育以及最終所表現的產量受多種因素的影響,其中有些屬自然的因素,如光、溫、濕、氣、土、病、蟲等,有些是屬於栽培條件的,如肥料、水分、生長素、農葯、除草劑等。進行科學試驗時,必須在固定大多數因素的條件下才能研究一個或幾個因素的作用,從變動這一個或幾個因子的不同處理中比較鑒別出最佳的一個或幾個處理。這里被固定的因子在全試驗中保持一致,組成了相對一致的試驗條件;被變動並設有待比較的一組處理的因子稱為試驗因素,簡稱因素或因子(factor),試驗因素的量的不同級別或質的不同狀態稱為水平(level)。試驗因素水平可以是定性的,如供試的不同品種,具有質的區別,稱為質量水平;也可以是定量的,如噴施生長素的不同濃度,具有量的差異,稱為數量水平。數量水平不同級別間的差異可以等間距,也可以不等間距。所以試驗方案是由試驗因素與其相應的水平組成的,其中包括有比較的標准水平。
試驗方案按其供試因子數的多少可以區分為以下3類:
(1) 單因素試驗(single-factor
experiment)單因素試驗是指整個試驗中只變更、比較一個試驗因素的不同水平,其他作為試驗條件的因素均嚴格控制一致的試驗。這是一種最基本的、最簡單的試驗方案。例如在育種試驗中,將新育成的若干品種與原有品種進行比較以測定其改良的程度,此時,品種是試驗的唯一因素,各育成品種與原有品種即為各個處理水平,在試驗過程中,除品種不同外,其它環境條件和栽培管理措施都應嚴格控制一致。又例如為了明確某一品種的耐肥程度,施肥量就是試驗因素,試驗中的處理水平就是幾種不同的施肥量,品種及其它栽培管理措施都相同。
(2) 多因素試驗(multiple-factor or factorial
experiment)多因素試驗是指在同一試驗方案中包含2個或2個以上的試驗因素,各個因素都分為不同水平,其他試驗條件均應嚴格控制一致的試驗。各因素不同水平的組合稱為處理組合(treatment
combination)。處理組合數是各供試因素水平數的乘積。這種試驗的目的一般在於明確各試驗因素的相對重要性和相互作用,並從中評選出1個或幾個最優處理組合。如進行甲、乙、丙3個品種與高、中、低3種施肥量的2因素試驗,共有甲高、甲中、甲低、乙高、乙中、乙低、丙高、丙中、丙低等3×3=9個處理組合。這樣的試驗,除了可以明確2個試驗因素分別的作用外,還可以檢測出3個品種對各種施肥量是否有不同反應並從中選出最優處理組合。生物體生長受到許多因素的綜合作用,採用多因素試驗,有利於探究並明確對生物體生長有關的幾個因素的效應及其相互作用,能夠較全面地說明問題。多因素試驗的效率常高於單因素試驗。
(3) 綜合性試驗(comprehensive
experiment)這也是一種多因素試驗,但與上述多因素試驗不同。綜合性試驗中各因素的各水平不構成平衡的處理組合,而是將若干因素的某些水平結合在一起形成少數幾個處理組合。這種試驗方案的目的在於探討一系列供試因素某些處理組合的綜合作用,而不在於檢測因素的單獨效應和相互作用。單因素試驗和多因素試驗常是分析性的試驗;綜合性試驗則是在對於起主導作用的那些因素及其相互關系已基本清楚的基礎上設置的試驗。它的處理組合就是一系列經過實踐初步證實的優良水平的配套。例如選擇一種或幾種適合當地條件的綜合性豐產技術作為試驗處理與當地常規技術作比較,從中選出較優的綜合性處理。
二、試驗指標與效應
用於衡量試驗效果的指示性狀稱試驗指標(experimental
indicator)。一個試驗中可以選用單指標,也可以選用多指標,這由專業知識對試驗的要求確定。例如農作物品種比較試驗中,衡量品種的優劣、適用或不適用,圍繞育種目標需要考察生育期(早熟性)、豐產性、抗病性、抗蟲性、耐逆性等多種指標。當然一般田間試驗中最主要的常常是產量這個指標。各種專業領域的研究對象不同,試驗指標各異。例如研究殺蟲劑的作用時,試驗指標不僅要看防治後植物受害程度的反應,還要看昆蟲群體及其生育對殺蟲劑的反應。在設計試驗時要合理地選用試驗指標,它決定了觀測記載的工作量。過簡則難以全面准確地評價試驗結果,功虧一簣;過繁瑣又增加許多不必要的浪費。試驗指標較多時還要分清主次,以便抓住主要方面。
試驗因素對試驗指標所起的增加或減少的作用稱為試驗效應(experimental
effect)。例如,某水稻品種施肥量試驗,每畝施氮10kg,畝產量為350kg,每畝施氮15kg,畝產量為450kg;則在每畝施氮10kg的基礎上增施5kg的效應即為450-350=100(kg/畝)。這一試驗屬單因素試驗,在同一因素內兩種水平間試驗指標的相差屬簡單效應(simple
effect)。在多因素試驗中,不但可以了解各供試因素的簡單效應,還可以了解各因素的平均效應和因素間的交互作用。表1.1為某豆科植物施用氮(N)、磷(P)的2×2=4種處理組合(N1P1,N1P2,N2P1,N2P2)試驗結果的假定數據,用以說明各種效應。(1)一個因素的水平相同,另一因素不同水平間的產量差異仍屬簡單效應。如表1.1Ⅱ中18-10=8就是同一N1水平時P2與P1間的簡單效應;28-16=12為在同一N2水平時P2與P1間的簡單效應;16-10=6為同一P1水平時N2與N1間的簡單效應;28-18=10為同一P2水平時N2與N1間的簡單效應。(2)一個因素內各簡單效應的平均數稱平均效應,亦稱主要效應(main
effect),簡稱主效。如表1.1Ⅱ中N的主效為(6+10)/2=8,這個值也是二個氮肥水平平均數的差數,即22-14=8;P的主效為(8+12)/2=10,也是二個磷肥水平平均數的差數,即23-13=10。(3)兩個因素簡單效應間的平均差異稱為交互作用效應(interaction
effect),簡稱互作。它反映一個因素的各水平在另一因素的不同水平中反應不一致的現象。將表1.1以圖1.1表示,可以明確看到,Ⅰ中的二直線平行,反應一致,表現沒有互作。交互作用的具體計算為(8-8)/2=0,或(6-6)/2=0。圖1.1Ⅱ中P2-P1在N2時比在N1時增產幅度大,直線上升快,表現有互作,交互作用為(12-8)/2=2,或為(10-6)/2=2,這種互作稱為正互作。圖1.1Ⅲ和Ⅳ中,P2-P1在N2時比在N1時增產幅度表現減少或大大減產,直線上升緩慢,甚至下落成交叉狀,這是有負互作。Ⅲ中的交互作用為(4-8)/2=-2,Ⅳ中為(-2-8)/2=-5。
表1.12×2試驗數據(解釋各種效應)
試驗

因素

N



P

水平

N1

N2

平均

N2-N1

P1

10

16

13

6

P2

18

24

21

6

平均

14

20

6

P2-P1

8

8

8

0,0/2=0



P

水平

N1

N2

平均

N2-N1

P1

10

16

13

6

P2

18

28

23

10

平均

14

22

8

P2-P1

8

12

10

4,4/2=2



P

水平

N1

N2

平均

N2-N1

P1

10

16

13

6

P2

18

20

19

2

平均

14

18

4

P2-P1

8

4

6

-4,-4/2=-2



P

水平

N1

N2

平均

N2-N1

P1

10

16

13

6

P2

18

14

16

-4

平均

14

15

1

P2-P1

8

-2

3

-10,-10/2=-5

因素間的交互作用只有在多因素試驗中才能反映出來。互作顯著與否關繫到主效的實用性。若交互作用不顯著,則各因素的效應可以累加,主效就代表了各個簡單效應。在正互作時,從各因素的最佳水平推論最優組合,估計值要偏低些,但仍有應用價值。若為負互作,則根據互作的大小程度而有不同情況。Ⅲ中由單增施氮(N2P1)及單增施磷(N1P2)來估計氮、磷肥皆增施(N2P2)的效果會估計過高,但N2P2還是最優組合,還有一定的應用價值。而Ⅳ中N2P2反而減產,如從各因素的最佳水平推論最優組合將得出錯誤的結論。









圖1.12×2試驗的圖示(解釋交互作用)
兩個因素間的互作稱為一級互作(first order
interaction)。一級互作易於理解,實際意義明確。三個因素間的互作稱二級互作(second order
interaction),余類推。二級以上的高級互作較難理解,實際意義不大,一般不予考察。

三、制訂試驗方案的要點
擬訂一個正確有效的試驗方案,以下幾方面供參考:
1.
擬訂試驗方案前應通過回顧以往研究的進展、調查交流、文獻探索等明確試驗的目的,形成對所研究主題及其外延的設想,使待擬訂的試驗方案能針對主題確切而有效地解決問題。
2.
根據試驗目的確定供試因素及其水平。供試因素一般不宜過多,應該抓住1~2個或少數幾個主要因素解決關鍵性問題。每因素的水平數目也不宜過多,且各水平間距要適當,使各水平能有明確區分,並把最佳水平范圍包括在內。例如通過噴施矮壯素以控制某種植物生長,其濃度試驗設置50、100、150、200、250ppm等5個水平,其間距為50ppm。若間距縮小至10ppm便須增加許多處理,若處理數不多,參試濃度的范圍窄,會遺漏最佳水平范圍,而且由於水平間差距過小,其效應因受誤差干擾而不易有規律性地顯示出來。如果涉及試驗因素多,一時難以取捨,或者對各因素最佳水平的可能范圍難以作出估計,這時可以將試驗分為兩階段進行,即先做單因素的預備試驗,通過拉大幅度進行初步觀察,然後根據預備試驗結果再精細選取因素和水平進行正規試驗。預備試驗常採用較多的處理數,較少或不設重復;正規試驗則精選因素和水平,設置較多的重復。為不使試驗規模過大而失控,試驗方案原則上應力求簡單,單因素試驗可解決的就不一定採用多因素試驗。
3.
試驗方案中應包括有對照水平或處理,簡稱對照(check,符號CK)。品種比較試驗中常統一規定同一生態區域內使用的標准(對照)種,以便作為各試驗單位共同的比較標准。
4.
試驗方案中應注意比較間的唯一差異原則,以便正確地解析出試驗因素的效應。例如根外噴施磷肥的試驗方案中如果設噴磷(A)與不噴磷(B)兩個處理,則兩者間的差異含有磷的作用,也有水的作用,這時磷和水的作用混雜在一起解析不出來,若加進噴水(C)的處理,則磷和水的作用可分別從A與C及B與C的比較中解析出來,因而可進一步明確磷和水的相對重要性。
5.
擬訂試驗方案時必須正確處理試驗因素及試驗條件間的關系。一個試驗中只有供試因素的水平在變動,其他因素都保持一致,固定在某一個水平上。根據交互作用的概念,在一種條件下某試驗因子的最優水平,換了一種條件,便可能不再是最優水平,反之亦然。這在品種試驗中最明顯。例如在生產上大面積推廣的揚麥1號小麥品種、農墾58號水稻品種,在品比試驗甚至區域試驗階段都沒有顯示出它們突出的優越性,而是在生產上應用後,倒過來使主管部門重新認識其潛力而得到廣泛推廣的。這說明在某種試驗條件下限制了其潛力的表現,而在另一種試驗條件下則激發了其潛力的表現。因而在擬訂試驗方案時必須做好試驗條件的安排,絕對不要以為強調了試驗條件的一致性就可以獲得正確的試驗結果。例如品種比較試驗時要安排好密度、肥料水平等一系列試驗條件,使之具有代表性和典型性。由於單因子試驗時試驗條件必然有局限性,可以考慮將某些與試驗因素可能有互作(特別負互作)的條件作為試驗因素一起進行多因素試驗,或者同一單因素試驗在多種條件下分別進行試驗。
6.
多因素試驗提供了比單因素試驗更多的效應估計,具有單因素試驗無可比擬的優越性。但當試驗因素增多時,處理組合數迅速增加,要對全部處理組合進行全面試驗(稱全面實施)規模過大,往往難以實施,因而以往多因素試驗的應用常受到限制。解決這一難題的方法就是利用本書後文將介紹的正交試驗法,通過抽取部分處理組合(稱部分實施)用以代表全部處理組合以縮小試驗規模。這種方法犧牲了高級交互作用效應的估計,但仍能估計出因素的簡單效應、主要效應和低級交互作用效應,因而促進了多因素試驗的應用。

❸ 實驗室三大原則 生物統計學

(1)設置對照原則:在實驗設計中,為排除無關條件的干擾,常常要設立對照實驗。通過
干預或控制研究對象,以消除或減少實驗誤差,鑒別實驗中的處理因素與非處理因素的差異。
(2)單一變數原則:控制其它因素不變,只改變其中一個因素,觀察其對實驗結果的影響。
如探索溫度對酶活性的影響時,只能改變反應的溫度,其它如pH、酶濃度等因素就要完全相同且適宜。
(3)平行重復原則:對所做的實驗在同樣條件下,進行足夠次數的重復,不能只進行1-2次便輕易得出結論。需要選擇的實驗材料的樣本數(如植株的數目、種子的粒數、實驗動物
的個體數等)不能太少,否則實驗的結果不足以反映出生物學現象的本來面目。任何一項生
物學實驗,要有科學性,都必須能夠重復,都必須經得起重復。

❹ 生物統計學要考試,老師出了幾個問題,找不到答案,求高手幫忙啊

參考《生物統計學》李春喜等主編。
1、進行統計推斷的時候,雙尾概率取得某一顯著水平時的臨界值。一般都可查表。比如P=0.05,雙側臨界值u0.05=1.96
2、生物是有機體,與非生物相比具有特殊的變異性,隨機性和復雜性。生物有機體生長發育過程中受外界變化影響大,會使實驗結果有較大差異,這種差異會掩蓋生物本身所含的規律,而生統就是要找出這樣的規律。
3、標准差是變異數之一,由方差開根號而得,方差的單位與原始數據的數值和單位都不相適應,需要將方差開方。就得標准差。公式,好難寫啊,你網路一下,兩個常用公式,一個是按方差開根號,一個是不含有平均數的公式。
4、樣本平均數,符號X(上面加一橫),極差R,樣本標准差s。
5、研究某一因素的影響,將總變異來源分成處理間變異和處理內變異,再進行F檢驗差異顯著性。
6、研究一個學校學生課余活動內容,在學校隨機抽取1000學生做統計。全校學生即總體,1000名學生即樣本。樣本是通過一定方法隨機抽樣而得。
7、當比較兩個樣本的時候,平均數相差懸殊或者單位不同的時候,標准差就不適合用來說明變異程度了,變異系數就是克服這樣的缺點兒產生的。計算公式,標准差除以樣本平均數,得出的百分比就是變異系數。
8、正態分布又稱高斯分布,是一種連續型隨機變數的概率分布。比如說1000株玉米的株高
9、1、提出假設(無效假設和備擇假設)2、確定顯著水平3、計算概率,u檢驗或者t檢驗等等。4、推斷是否接受假設。根據小概率原理判斷是否接受H0的判斷。
10、樣本不隨機不具有代表總體的特性,也就沒有研究的意義。樣本達到3個即可統計,大樣本一般30個。p值就是顯著水平吧,如何分析,小於0.05是顯著,小於0.01是極顯著。

❺ 不禿頭的生物統計學1 - 假設檢驗

生物統計學研究包括 試驗設計 統計分析 兩大部分。

表現在以下4個方面:
1. 提供整理、描述數據資料的科學方法並確定其數量特徵。(描述性統計)
2. 判斷實驗結果的可靠性。(統計推斷)
3. 提供由樣本推斷總體的方法。(統計推斷)
4. 提供試驗設計的原則。(實驗設計)

由於時間關系,先復習老師重點章節。(第一個ppt,第三頁,標藍的)

一圖勝千言,請看 統計推斷 內容包括什麼?

不要覺得這張圖不重要,瞥一眼就過去了
其實這是老師第一節課 PPT 的內容 (我填了一些內容)
當我們上完所有課後,重新回顧這張圖時
我們應該對 (老師上課講的) 生物統計學內容的脈絡有一個基本的認識

也就是說,當我們看到以上的關鍵詞,我們的腦海應該有一個大致的地圖
知道應該往那個方向走
如果還十分模糊,那接下來我和大家一起重新捋一遍思路
如果感覺有點印象,那接下來就溫故知新

先從字面開始, 假設 的是什麼? 檢驗 的是什麼?

假設,就是『猜』。

比如說《女士品茶》中,如下假設:

等價的說法是:

假設,是我們進行學術研究的第一步。我們看得每一篇文獻,進行得每一個研究課題,都有一個假設。

一個 好的假設 應該有以下特徵:
1. 陳述句
2. 提出變數間的預期關系 (如: 能分辨/不能分辨;促進/抑制)
3. 假設應基於已存在的理論或文獻基礎 (如: 有人已經研究過,先煮辣椒,再放豆腐;和先煮豆腐,再放辣椒,這兩種烹飪方式做出的麻婆豆腐味道不一樣) (我隨便舉個例子,我們研究中大多假設的基礎,應該有文獻)
4. 簡短並切中要點 (不廢話,有說服力)
5. 可檢驗 (意味著有可量化的方法判斷這個假設是對還是不對)

一個好的假設是 可檢驗的

什麼是可檢驗?
可檢驗就有判斷命題真偽的普遍性量化標准。

比如說,在《女士品茶》里

我們再來說一個假設:『地球是圓球』

無效假設(零假設) H0:我們要 (間接) 檢驗的假設
備擇假設(研究假設) Ha:無效假設(零假設)的對立命題 (非此即彼),我們想研究的假設。

假設檢驗的基本思想:

反證法 前面已經說過了,否認一個命題相對容易。

另外不知道有朋友發現沒有,在上面的零假設中,我用了『間接』二字。

零假設的對象是 總體
如果你翻翻老師的課件,
你會發現,H0總是這樣的形式:

H0 : μ = μ0

樣本標准差是表示個體間變異大小的指標,反映了整個樣本對樣本平均數的 離散程度 ,是數據精密度的衡量指標 ;
而樣本平均數的標准誤(差),反映樣本平均數對總體平均數的 變異程度 ,從而反映 抽樣誤差的大小 ,是量度結果精密度的指標

好的,我們再回到零假設
H0 : μ = μ0
總體我們一般無法獲得,我們通常使用 抽樣 獲得一部分樣本。
那我們是如何通過樣本來間接驗證總體的呢?

首先,總體的數據會服從某種分布,而抽取的樣本構成的總體,會服從某種抽樣分布。

老師上課講的主要是:
總體分布:『正態分布』
抽樣分布:『t 分布』,『卡方分布』,『F 分布』

為什麼主要講『正態分布』?
1. 因為自然狀態下,大多數數據都服從正態分布。從正態總體中抽取樣本, 樣本均數 也服從正態分布。
2. 即使總體不是正態分布,只要樣本數 n 足夠大, 樣本均數 的分布也近似服從正態分布。(中心極限定理)

不知道大家留意到沒有,上面用的字眼是, 樣本均數的分布 ,是樣本平均數的分布。這意味著, 樣本的平均數,不是唯一的值 (分布意味著是一系列的取值)。

為什麼? (理解這一點很重要,比如會把總體,樣本,樣本總體搞混)

因為每次抽樣,抽樣的樣本是不一樣的(隨機,樣本差異)。所以每次抽取出來的樣本的平均數,肯定不會是一樣的。這樣的所有樣本均值會構成一個 新的總體 ,在這個總體裡面,均值是 μ(x),標准差是 σ(x)。(記住這些符合,後面會用到)

雖然算出來的均值可能會不一樣,但是總有個合理的范圍。如果出現某個偏離很遠的值,我們會覺得很不合理。這個就是 置信區間

好的,思路到這里已經越來越清晰了。

雖然老師說不用記這個圖,但是我覺得還是有必要講一下的。
1. x 軸是樣本統計量。(如:樣本的均值)
2. 概率不是 x 對應的 y 的值,而是曲線和兩個 x 軸的垂線以及 x 軸圍起來的面試,是概率。
3. N(μ,σ2),μ(總體均值) 是中心位置,σ (總體標准差) 代表數據的離散程度。但更重要的是 記住 離 均值μ 若干個 標准差σ 距離 代表的概率 。(如 1個 σ : 68.2%; 1.96 個 σ : 95%; 2.58 個 σ : 99%)
4. 對應到樣本均值,『樣本均值』偏離『樣本總體均值』若干個『樣本均值標准誤』也對應著相應的概率。(覺得懵的往下看)

正態分布只需要兩個參數 ( μ 和 σ ) 即可確定其曲線形狀
當 μ = 0 ,σ = 1 時,稱為標准正態分布,N(0,1)

然而,我們抽取的 樣本的均值 構成的分布,μ(x) 不會都等於 0 ,σ (x) 也不會正好等於 1,因此我們需要一個 標准化正態變換

是不是有種熟悉的感覺,沒錯,這個就是 u 檢驗時,我們計算的 u 值
(看清楚,μ 和 u ,我也不知道為什麼用這么相近的兩個字元)
(對符號含義理解還比較模糊的話往前看,這里的 μ(x) 是指所有抽取的樣本的均值構成的新總體的總體均值, σ(x)是指對應的總體標准差)

好了,到這里應該對 u 值有清晰的理解了,我們再來看看,『樣本總體』怎麼對應到『原總體』上。

到了這一步,我們看看我們還缺什麼?
很明顯,x̅ 和 n 來自樣本,我們還缺 μ 和 σ

首先看看我們的零假設,在一個樣本平均數的 u 檢驗時 :
H0 :μ = μ0 = ? ,我們是有應該理論研究總體均值μ0
也就是說 μ 可以獲得,所以還缺 σ

所以 一個樣本平均數的 u 檢驗 分為兩種情況:

好的,這里理解的話,基於這個思路,兩個樣本均值u檢驗,均值t檢驗,(頻數檢驗),應該也比較好理解了。

(考試看這個圖套公式就好了,重要的是理解每個符號的含義)
(還有就是看懂題目,知道是 u檢驗 還是 t檢驗 ,知道是 成組 還是 配對 ,知道是用 單尾檢驗 還是 雙尾檢驗 )
(這個圖有點小,放大後還是清晰的)

這張表逐一去看,理解後每個字元的含義後,直接套公式就好了。

關於顯著性水平

我怎麼知道我研究的總體是不是服從正態分布的?
或者說,我怎麼通過採集的樣本推斷總體是不是服從正態分布的?

因為我們現在的假設檢驗,基本都是基於總體服從正態分布的前提下做的,如果一開始這個前提就不成立,那不是白幹了。

還記得老師讓我們記得圖嗎?
魚群

我們將數據畫個一個頻數分布直方圖,看看它大致的形狀是不是符合正態分布,如果符合鍾型,那說明可以用正態分布,如果不廢話,那可能需要做一定的轉換,將數據變成正態分布(這個轉換我就不懂了)。

閱讀全文

與生物統計學實驗設術怎麼寫相關的資料

熱點內容
word中化學式的數字怎麼打出來 瀏覽:734
乙酸乙酯化學式怎麼算 瀏覽:1397
沈陽初中的數學是什麼版本的 瀏覽:1343
華為手機家人共享如何查看地理位置 瀏覽:1036
一氧化碳還原氧化鋁化學方程式怎麼配平 瀏覽:877
數學c什麼意思是什麼意思是什麼 瀏覽:1401
中考初中地理如何補 瀏覽:1290
360瀏覽器歷史在哪裡下載迅雷下載 瀏覽:693
數學奧數卡怎麼辦 瀏覽:1380
如何回答地理是什麼 瀏覽:1014
win7如何刪除電腦文件瀏覽歷史 瀏覽:1047
大學物理實驗干什麼用的到 瀏覽:1478
二年級上冊數學框框怎麼填 瀏覽:1692
西安瑞禧生物科技有限公司怎麼樣 瀏覽:949
武大的分析化學怎麼樣 瀏覽:1241
ige電化學發光偏高怎麼辦 瀏覽:1330
學而思初中英語和語文怎麼樣 瀏覽:1642
下列哪個水飛薊素化學結構 瀏覽:1418
化學理學哪些專業好 瀏覽:1479
數學中的棱的意思是什麼 瀏覽:1050