‘壹’ 生物信息 生物统计
怎么说呢
这个专业是以计算机为基础发展起来的
进实验室的几率并不怎么大
但是要计算机基础过硬 我们生物专业的计算机很好的人比较少 所以报的人也少
我们学校就有收这个方向的博导
虽然是在生物方向 但是关联并不怎么大
而且这专业相对吃香些
你可以考虑下
但是单独收这个专业的硕士的比较少吧
反正我们学校是在生物化学与分子生物学中
导师来找人的
或者你看好了学校 然后跟那个导师联系 说明下你的情况
看具体怎么解决
祝你考上理想的学校
‘贰’ 生物统计 试验设计的基本原则是什么,其作用是什么
分别有单一变量原则 ;对照性原则;等量原则;科学性原则。
试验设计,也称为实验设计。,经济地、科学地安排试验的一项技术。试验设计自20世纪20年代问世至今,其发展大致经历了三个阶段:即早期的单因素和多因素方差分析,传统的正交试验法和近代的调优设计法。
其在工业生产和工程设计中能发挥重要的作用,主要有:提高产量;减少质量的波动,提高产品质量水准;大大缩短新产品试验周期;.降低成本;.试验设计延长产品寿命。
‘叁’ 生物统计学的主要内容和作用是什么
生物统计学是一门探讨如何从事生物学实验研究的设计,取样,分析,资料整理与推论的科学.
应用数理统计学来处理生物现象的学问.与其说是生物学的一个分科不如看作是生物学的方法论.与生物测量学大致具有同一涵义,但前者几乎尚没有深入到现象的统计处理机制,因此生物测量学作为稍狭义的东西,有时也与生物统计学有所区别.在物理学的测量中,测量误差是重要问题,与此相应在生物学的研究中必须应用统计处理,其首要原因是变异.有意识地将数理统计学引入到生物学以及人类学领域的先驱者是克韦泰来特(L.A.J.Quetelet),随后由高尔顿(F.Galton)的工作巩固了生物测量学和优生学的基础.数学家泊松(K.Pearson)继承了他们的研究工作,进行了回归和相关特别是复相关、泊松型分布数、频率累加法、X2测验等数理统计学的研究,并制成了很多统计数值表.他们把人们观测的或能得到手的资料的全部作为对象,把平均值和离差作为问题,来考查其中的数学规律.数理统计学方法已适用于生物学和农业科学的实验或试验领域,但也是以整个资料或比试验资料更大的抽象资料为依据的,因此人们开始意识到,在其现实是一种不能以其一部分作为研究对象的局面.于是就提出母集团和样本的区别和关联,以及从少数资料进行正确有效的推论的问题,这些问题被戈塞特[笔名(Student)]和费希尔(W.S.Gosset和R.A.Fisher)解决了.费希尔的工作指出,统计方法的目的在于得到资料的要点,为此,其分布法则是要以较少的母集团中的数目为特征推想到无限的母集团,而实际的资料就是从它们之中随机抽出的样本.基于此点,在母集团数的统计上的无偏性、一致性、有效性、充分性的概念,构成了解消假设的验定,最优法等的理论.这就是费希尔派的数理统计学,也特称推计学.
‘肆’ 生物统计与实验分析
我们用的是黄皮的那本生物统计大实验
‘伍’ 生物统计学的基本特征
生物统计学是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计,取样,分析,资料整理与推论的科学。与生物测量学大致具有同一涵义,但前者几乎尚没有深入到现象的统计处理机制,因此生物测量学作为稍狭义的东西,有时也与生物统计学有所区别
‘陆’ 生物统计附试验设计
第一章绪论
1.生物统计学的内容:统计原理、统计方法和试验设计。
2.生物统计的作用:a.科学地整理分析数据;b.判断试验结果的可能性;c.确定事物之间的相互关系;d.提供试验设计的原理。
3.样本容量常记为n,通常把n≤30的样本称为小样本,n.>30的样本称为大样本。
4.名解:(重)①生物统计:生物统计是应用概率论和数据统计的原理和方法来研究生物界数量变化的学科;
②总体:是被研究对象的全体,据所含的个体的多少,总体分为有限总体和无限总体。
③样本:是指总体内随机抽取出来若干个体所组成的单位。
④随机误差:由于许多无法控制的内在和外在的偶然因素所造成的误差,内在如个体差异,外在如环境,它影响试验的精确性。
(了)①参数:从总体计算出来的数量特征值,它是一个真值,没有抽样变动的影响,一般用平均数u,标准差s。
②统计量:是从样本计算出来的数量特征值,它是参数的估计值,受样本变动的影响,一般用拉丁字母表示,如平均数。
③系统误差:主要是试验动物的初始条件不同,试验条件相差较大,仪器不准,标准试剂未经校正,药品批次不同,药品用量与种类不符合试验计划要求,以及观察,记录抄案,计算中的错误所引起的误差,它影响试验的准确性。
④准确性:指在试验或调查中某试验指标或形状的观测值与其真值接近的程度。
⑤精确性:指试验或调查中一试验指标或形状的重复观测值彼此接近的程度。
第二章资料的整理
1.统计资按性质分为:计量资料、次数资料和半定量资料。
2.计量资料是指用量测方式获得的数量性状资料,即用度、量、衡等计量工具直接测量获得的数量性状资料。计量资料整理的五步骤如下:
(1)求全距,即资料中最大值和最小值之差R=Max(x)—Min(x);
(2)确定组数即按样本大小而定;
样本含量与组数
样本含量 组数
30~60 6~8
60~100 8~10
100~200 10~12
200~500 12~17
500以上 17~30
(3)确定组距,每组最大值与最小值之差记为i ,公式:组距(i)=全距(R)/组数k ;(4)确定组中值及组限,各组的最大值和最小值称为组限,最小值为下限,最大值为上限,每组的中点值称为组中值,组中值=(下限+上限)/2=下限+组距/2=上限-组距/2;(5)归组划线计数,作次数分布表。
3.常用的五种统计图为长条图、圆图、线图、直方图、折线图,掌握直方图和折线图的绘制。
4.原始资料的检查核对主要进行下面三性的检查:①检查资料的完整性;②检查资料的正确性;③检查资料的精确性。
5大样本资料需整理成次数分布表。
第三章资料的统计描述
1.平均数包括以下五种算术平均数、中位数、众数、几何平均数及调和平均数。
2.用来度量资料变异程度的指标主要有极差、方差、标准差、变异系数。
3.平均数的基本性质是(1)样本各观测值与平均数之差的和为零,简述为离均差之和为;(2)样本各观测值与平均数之差的平方和为最小,简述为离均差平方和为最小。
4.10头母猪第一胎产仔数为9、8、7、10、12、10、11、14、8、9(头)计算10头母猪第一胎产仔数的平均数、中位数、标准差和变异系数。
解:①平均数Σx=9+8+7+10+12+10+11+14+8+9=98,n=10
②资料数据按小到大排列如:7、8、8、9、9、10、10、11、12、14
中位数
③标准差
④变异系数
第四章常用概率分布
1.事件概率具有以下性质:①对于任何事件A,有0≤P(A)≤1;②必然事件的概率为1,即P(Ω)=1:③不可能的事件概率为0,即P(Ø)=0。
2.(1)正态分布:若连续型随机变量X的概率分布密度函数为
其中 为平均数,σ2为方差,则称随机变量X服从正态分布,记为X~ 。相应的概率分布函数为
正态分布密度曲线为:
(2)标准正态分布::当μ=0、σ=l时,正态总体称为标准正态总体,其相应的函数表示式是,(-∞<x<+∞)
其相应的曲线称为标准曲线;.标准正态总体的概率问题:
对于标准正态总体N(0,1), 是总体取值小于 的概率,
即 ,
其中 ,图中阴影部分的面积表示为概率 只要有标准正态分布表即可查表解决.从图中不难发现:当 时, ;而当 时,Φ(0)=0.5;标准正态总体 在正态总体的研究中有非常重要的地位,为此专门制作了“标准正态分布表”.在这个表中,对应于 的值 是指总体取值小于 的概率,即 , .
若 ,则 .
利用标准正态分布表,可以求出标准正态总体在任意区间 内取值的概率,即直线 , 与正态曲线、x轴所围成的曲边梯形的面积 .
(3)有关概率计算的公式:
P(0≤u<u1)=Φ(u1)-0.5
P(u≥u1) =Φ(-u1)
P(|u|≥u1)=2Φ(-u1)
P(|u|<u1)=1-2Φ(-u1)
P(u1≤u<u2)=Φ(u2)-Φ(u1)
注:用曲线图和面积来理解记忆。
(4)关于标准正态分布要熟记下列几种常用概率:
P(-1≤u<1)=0.6826
P(-2≤u<2)=0.9545
P(-3≤u<3)=0.9973
P(-1.96≤u<1.96)=0.95
P (-2.58≤u<2.58)=0.99
(5)例:①已知u~N(0,1),试求: (1) P(u<-1.64)=? (2) P (u≥2.58)=? (3) P (|u|≥2.56)=? (4) P(0.34≤u<1.53) =?
利用(4-12)式,查附表1得:
(1) P(u<-1.64)=0.05050
(2) P (u≥2.58)=Φ(-2.58)=0.024940
(3) P (|u|≥2.56)=2Φ(-2.56)=2×0.005234=0.010468
(4) P (0.34≤u<1.53)=Φ(1.53)-Φ(0.34)=0.93669-0.6331=0.30389
②已知u~N(0,1)试求:
(1) P(u<- )+P(u≥ )=0.10的
(2) P(- ≤u< ﹚=0.86的
因为附表2中的α值是:
所以
(1) P(u<- )+ P(u≥ )=1- P(- ≤u< ﹚=0.10=α
由附表2查得: =1.644854
(2) P (- ≤u< )=0.86 ,α=1- P (- ≤u< )=1-0.86=0.14
由附表2查得: =1.475791
对于x~N(μ,σ2),只要将其转换为u~N(0,1),即可求得相应的双侧分位数。
③已知猪血红蛋白含量x服从正态分布N(14.52, ), 若P(x<1.1) =0.025, P(x> )=0.025,P(x< ) =0.005,P(x> )=0.005,求 , , , 。
由题意可知,α/2=0.025,α=0.05 又因为
P(x> )=
故 P(x< =+ P(x> )= P(u<- =+ P(u> )
=1- P(- <P< )=0.05=α
由附表2查得: =1.959964,所以
( -14.52)/1.68=-1.959964, ( -14.52)/1.68=1.959964
即 ≈11.23, ≈17.81。
同理 =2.575829,所以
( -14.52)/1.68=-2.575829, ( -14.52)/1.68=2.575829
即 ≈10.19, ≈18.85。
④已知猪血红蛋白含量x服从正态分布N(12.86, ), 若P(x< ) =0.03, P(x≥ )=0.03,求 , 。
由题意可知,α/2=0.03,α=0.06 又因为
P(x≥ )=
故 P(x< =+ P(x≥ )= P(u<- =+ P(u≥ )
=1- P(- ≤P< )=0.06=α
由附表2查得: =1.880794,所以
( -12.86)/1.33=-1.880794, ( -12.86)/1.33=1.880794
即 ≈10.36, ≈15.36。
3. ①双侧概率(重):把随机变量X落在平均数 左右标准差σ一定倍数区间之外的概率记作σ;②单侧概率:指所求得随机变量X小于平均数 左侧标准差σ一定倍数或大于平均数 右侧标准差σ一定倍数的概率记作σ/2。
第五章假设检验
1.显着性检验:就是指在对资料进行统计分析时,先提某一问题对样本所在总体的参数提出一个统计假设,然后根据从样本获得的统计量所服从的概率分布,对这一假设进行检验;其目的是主要是看样本是否来自于均数相同的总体即通过对样本的研究来对总体作出统计推断;检验的对象是在统计学中,是以样本平均数差异x1- x2的大小时样本所在的总样本平均数 1、 2是否相同作出推断。
2.为什么以样本均数作为检验对象呢?是因为样本平均数具有下述特性:
(1)离均差的平方和 (xi- )2最小。说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。
(2)样本平均数是总体平均数的无偏估计值,即E( )= 。
(3)根据统计学中心极限定理,样本平均数 服从或逼近正态分布。
所以,以样本平均数作为检验对象,由两个样本平均数x1和x2的差异去推断样本所属总体平均数是否相同时有依据的。
3.(了) ①标准误(平均数抽样总体的标准差) 的大小反映样本平均数 的抽样误差的大小,即精确性的高低。标准误大,说明各样本平均数 间差异程度大,样本平均数的精确性低。反之, 小,说明 间的差异程度小,样本平均数的精确性高。 的大小与原总体的标准差σ成正比,与样本含量n的平方根成反比。从某特定总体抽样,因为σ是一常数,所以只有增大样本含量才能降低样本平均数 的抽样误差。在实际工作中,总体标准差σ往往是未知的,因而无法求得 。此时,可用样本标准差S估计σ。于是,以 估计 。记 为 ,称作样本标准误或均数标准误。②区别:样本标准差与样本标准误是既有联系又有区别的两个统计量, = 已表明了二者的联系。二者的区别在于:样本标准差S是反映样本中各观测值 , ,…, 变异程度大小的一个指标,它的大小说明了 对该样本代表性的强弱。样本标准误 是样本平均数 的标准差,它是 抽样误差的估计值, 其大小说明了样本间变异程度的大小及 精确性的高低。
4. ①小概率事件通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。随机事件的概率表示了随机事件在一次试验中出现的可能性大小。若随机事件的概率很小,例如小于0.05、0.01、0.001,称之为小概率事件。小概率事件虽然不是不可能事件,但在一次试验中出现的可能性很小,不出现的可能性很大,以至于实际上可以看成是不可能发生的。在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能性原理是统计学上进行假设检验(显着性检验)的基本依据。
②一统计资料进行统计推断判断的原则如下:
Ⅰ、当 < ,P>0.05 时,差异不显着,用“NS”表示,不能否H0 ;
Ⅱ、当 ≤ ≤ ,0.01< P <0.05时,差异显着,用“*”表示,接受HA,否定H0 ;
Ⅲ、当 ≥ ,P≤0.01时,差异极显着,用“**”表示,接受HA,否定H0 。
5.计算题:了解样本均数与总体均数的差异性显着检验及两样本均数的差异性显着检验;重点知道正态总体平均数 的置信区间。
例:①计算下列资料总体平均数的95%,99%置信区间,119、22、104、32、53、31、118、57、30、101、、58、48、68、70。
解:资料总体平均数的95%,99%置信区间
df=n-1=14-1=13,故 =2.160, =3.012
=65.0714 ,S=33.3293, 9.2431
所以⑴95%置信半径为 =19.9668
95%置信下限为 — =45.1046
95%置信上限为 — =85.0382
即该资料总体平均数u 的95%置信区间为45.1046≤u≤85.0382
⑵99%置信半径为 =27.8426
99%置信下限为 — =37.2288
99%置信上限为 — =92.9140
即该资料总体平均数u 的99%置信区间为37.2288≤u≤92.9140 。
②随机抽测了10只兔的直肠温度,其数据为:38.7、39.0、38.9、39.6、39.1、39.8、38.5、39.7、39.2、38.4℃。已知该品种兔直肠温度的总体平均数为 ℃,检验该样本平均数温度与 是否有显着性差异?
解:⑴提出无效假设与备择假设
H0 : =39.5,HA: <39.5
⑵计算t值 经计算得 =39.09,S=0.4909
t=( - )/ =-2.6411
⑶统计推断
由df=n-1=10-1=9,查附表得临界t值
=2.262 =3.250, <︱t︱< ,0.01< P < 0.05
否定H0,HA接受,表明样本平均数 与已知总体平均数 差异显着。
‘柒’ 求助——医学统计学与统计学,卫生统计学,生物统计学的联系与区别
什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别?医学统计学:是运用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科。统计学:是研究数据的收集、整理、分析与推断的科学。卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。生物统计学:是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计,取样,分析,资料整理与推论的科学。医学统计学与生物统计学、卫生统计学是统计学原理和方法在互有联系的不同学科领域的应用,三者间虽有区别,但无截然界限。生物统计学应用于生物学研究,从生物范畴也包括人的角度来说,它比医学统计学的范围更广。医学统计学和卫生统计学应用于医学研究,前者侧重于医学的生物学方面,后者侧重于医药卫生的社会方面(社会卫生事业管理和人民健康状况研究)。
‘捌’ 生物统计有什么用
生物统计学是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计、取样、分析、资料整理与推论的科学。由此可见,对于研究人员,是不可多得的研究工具。对于纯粹是为了考试的人来说,那就这样咯——为了考试呗~~
‘玖’ 什么是生物统计
生物统计(shengwu tongji,biostatistics,biometry,biometrics)含义 应用于中的数理统计方法。即用数理统计的原理和方法,分析和解释生物界的种种现象和数据资料,以求把握其本质和规律性。
发展简况
最早提出生物统计思想的是比利时数学家L.A.J.凯特莱,他试图把统计学的理论应用于解决生物学、医学和社会学中的问题。1866年,揭示了遗传的基本规律,这是最早运用数理统计于生物实验的一个成功的范例(见)。1889年,在《自然的遗传》一书中,通过对人体身高的研究指出,子代的身高不仅与亲代的身高相关,而且有向平均值“回归”的趋势,由此提出了“回归”和“相关”的概念和算法,从而奠定了生物统计的基础。高尔顿的学生K.皮尔逊进一步把统计学应用于生物研究,提出了实际测定数与理论预期数之间的偏离度指数即卡方差()的概念和算法,这在属性的统计分析上起了重要作用。1899年,他创办了《生物统计》杂志,还建立了一所数理统计学校。他的学生W.S.戈塞特对样本标准差作了许多研究,并于1908年以“Student”的笔名将t-检验法发表于《生物统计》杂志上。此后,t-检验法就成了生物统计学中的基本工具之一。英国数学家指出,只注意事后的数据分析是不够的,事先必须作好实验设计。他使实验设计成了生物统计的一个分支。他的学生G.W.斯奈迪格把变异来源不同的均方比值称为F值,并指出当值大于理论上 5%概率水准的值时,该项变异来源的必然性效应就从偶然性变量中分析出来了,这就是“方差分析法”。上述这些方法对于农业科学、生物学特别是的研究,起了重大的推动作用,20世纪20年代以来,各种数理统计方法陆续创立,它们在实验室、田间、饲养和临床实验中得到广泛应用并日益扩大到整个工业界。70年代,随着计算机的普及,使本来由于计算量过大而不得不放弃的统计方法又获得了新的生命力,应用更为广泛,并在现代科技中占有十分重要的地位。
‘拾’ 生物统计学
生物统计学属生物工程专业。生物统计学是一门探讨如何从不完整的信息中获取科学可靠的结论,从而进一步进行生物学实验研究的设计,取样,分析,资料整理与推论的科学。应用数理统计学来处理生物现象的学问。与其说是生物学的一个分科不如看作是生物学的方法论。与生物测量学大致具有同一涵义,但前者几乎尚没有深入到现象的统计处理机制,因此生物测量学作为稍狭义的东西,有时也与生物统计学有所区别。生物工程专业通过掌握生物技术及其产业化的科学原理、工艺技术过程和工程设计等基础理论,基本技能,能在生物技术与工程领域从事设计生产管理和新技术研究、新产品开发的工程技术人才。