导航:首页 > 生物信息 > 生物中rdd是什么

生物中rdd是什么

发布时间:2022-09-11 22:40:59

A. Spark之我看什么是RDD

一般来讲,对于陌生的名词,大家的第一个反应都是“What is it?”。
RDD是Spark的核心内容,在Spark的官方文档中解释如下:RDD is a fault-tolerant collection of elements that can be operated on in parallel。由此可见,其中有两个关键词:fault-tolerant & in parallel。首先,容错性是RDD的一个重要特性;其次,它是并行计算的数据。

RDD的中文解释为:弹性分布式数据集,全称Resilient Distributed Datasets。宾语是dataset,即内存中的数据库。RDD 只读、可分区,这个数据集的全部或部分可以缓存在内存中,在多次计算间重用。 所谓弹性,是指内存不够时可以与磁盘进行交换。这涉及到了RDD的另一特性:内存计算,就是将数据保存到内存中。同时,为解决内存容量限制问题,Spark为我们提供了最大的自由度,所有数据均可由我们来进行cache的设置,包括是否cache和如何cache。
(关于cache的设置以及Spark的一些基础概念,http://www.dataguru.cn/forum.php?mod=viewthread&tid=295317中解释得很详细。)
如果看到这里,你的思维里对RDD还是没有任何概念的话,或许可以参照我的形象化理解:RDD,就是一个被武装起来的数据集。
主体:a、由源数据分割而来,源码中对应splits变量;
武器有下:b、数据集体内包含了它本身的“血统”信息,即dependencies变量,存储着它的父RDD及两者关系;
c、计算函数,即其与父RDD的转化方式,对应源码中的iterator(split) & compute函数;
d、一些关于如何分块以及如何存放位置的元信息,eg:partitioner & preferredLocations。
有了这些武器,RDD的容错机制也就显而易见了。容错,顾名思义就是在存在故障的情况下,计算机系统仍能正常工作。 容错通常有两种方式 checkpoint 和logging update , RDD 采用的是 logging update 。 Checkpoint( 数据检查点)意味着要在各个机器间复制大数据,花费会很高,这种拷贝操作相当缓慢,而且会消耗大量的存储资源,因此deserted。 Logging update( 记录更新),仅支持粗颗粒度变换,也就是说,仅记录在单个块上执行的单个操作,然后创建某个RDD的变换序列存储下来,数据丢失时,就可通过“血统”重新计算,恢复数据。Nevertheless,血缘链(变换序列)变得很长时,建议用户此时建立一些数据检查点加快容错速度。(saveAstextFile方法手动设置)

B. RNA提取试剂盒中的RDD是什么试剂

一种缓冲液,主要是在RNA提取中需要除去DNA时,与DNase I(DNA酶的一种)配制成DNase I工作液,具体如何使用在试剂盒中会有说明。

C. 什么是一个RDD分区和片之间的区别

rdd作为一个分布式的数据集,是分布在多个worker节点上的。如下图所示,RDD1有五个分区(partition),他们分布在了四个worker nodes 上面,RDD2有三个分区,分布在了三个worker nodes上面。

D. 生物的基因自由组合定律

基因的自由组合定律

孟德尔在完成了对豌豆一对相对性状的研究后,并没有满足已经取得的成绩,而是进一步探索两对相对性状的遗传规律。他在基因的分离定律的基础上,又揭示出了遗传的第二个基本规律——基因的自由组合定律。

两对相对性状的遗传实验孟德尔在做两对相对性状的杂交试验时,用纯种黄色圆粒豌豆和纯种绿色皱粒豌豆作亲本进行杂交,无论正交还是反交,结出的种子(F1)都是黄色圆粒的(如图)。这一结果表明,黄色对绿色是显性,圆粒对皱粒也是显性。孟德尔又让F1植株进行自交,在产生的F2中,不仅出现了亲代原有的性状——黄色圆粒和绿色皱粒,还出现了新的性状——绿色圆粒和黄色皱粒。试验结果显示出不同对的性状之间发生了自由组合。孟德尔对试验的结果也进行了统计学分析:在总共得到的556粒种子中,黄色圆粒、绿色圆粒、黄色皱粒和绿色皱粒的数量依次是315、108、101和32。即这4种表现型的数量比接近于9:3:3:1。怎样解释这一结果呢?

对自由组合现象的解释

如果对每一对性状单独进行分析,其结果是:圆粒:皱粒 接近于3:1黄色:绿色 接近于3:1以上数据表明,豌豆的粒形和粒色的遗传都遵循了基因的分离定律。孟德尔假设豌豆的粒形和粒色分别由一对基因控制,即黄色和绿色分别是由Y和y控制;圆粒和皱粒分别是由R和r控制。这样,纯种黄色圆粒豌豆和纯种绿色皱粒豌豆的基因型就分别是YYRR和yyrr,它们的配子则分别是YR和yr。受精后,F1的基因型就是YyRr。Y对 y、R对r都具有显性作用,因此,F1的表现型是黄色圆粒(如图)。

F1自交产生配子时,根据基因的分离定律,每对基因都要彼此分离,所以,Y与y分离、R与r分离。孟德尔认为,与此同时,不同对的基因之间可以自由组合,也就是Y可以与R或r组合;y可以与R或r组合,这里等位基因的分离和不同对基因之间的组合是彼此独立相互不干扰的。这样,F1产生的雌配子和雄配子就各有4种,它们是YR、Yr、yR和yr,并且它们之间的数量比接近于1:1:l:l。

用结白色扁形果实(基因型是WwDd)的南瓜植株自交,是否能够培育出只有一种显性性状的南瓜?你能推算出具有一种显性性状南瓜的概率是多少吗?答案:用结白色扁形果实的南瓜植株自交,能够培育出只有一种显性性状的南瓜(黄色扁形或白色圆形);出现只有一种显性性状南瓜的概率是6/16(或3/8)。具有杂种优势的品种不能代代遗传,因为这类品种的基因型是杂合的,它们的后代必定会出现性状分离和重组,从而产生出新的性状。

由于受精时雌雄配子的结合是随机的,因此,结合的方式可以有16种。在这16种方式中,共有9种基因型和4种表现型。9种基因型是:YYRR,YYRr,YyRR,YyRr,YYrr,Yyrr,yyRR,yyRr和yyrr;4种表现型是:黄色圆粒、黄色皱粒、绿色圆粒和绿色皱粒,并且4种表现型之间的数量比接近于9:3:3:1。

对自由组合现象解释的验证

孟德尔为了验证对自由组合现象的解释是否正确,还做了测交试验,也就是让子一代植株F1(YyRr)与隐性纯合子杂交(yyrr)。按照孟德尔提出的假设,F1能够产生4种配子,即YR、Yr、yR、yr,并且它们的数目相等;而隐性纯合子只产生含有隐性基因的配子yr。所以,测交的结果应当产生4种类型的后代:黄色圆粒(YyRr)、黄色皱粒(Yyrr)、绿色圆粒(yyRr)和绿色皱粒(yyrr),并且它们的数量应当近似相等(如图)。

孟德尔所做的测交试验,无论是以F1作母本还是作父本,实验的结果都符合预期的设想,也就是4种表现型的实际子粒的数量比都接近于1:1:1:1。从而证实了F1在形成配子时,不同对的基因是自由组合的。
基因自由组合定律的实质

细胞遗传学的研究结果表明,孟德尔所说的一对基因就是位于一对同源染色体上的等位基因,不同对的基因就是位于非同源染色体上的非等位基因。孟德尔的两对相对性状的杂交试验,揭示出的自由组合定律的实质是:位于非同源染色体上的非等位基因的分离或组合是互不干扰的。在进行减数分裂形成配子的过程中,同源染色体上的等位基因彼此分离的同时,非同源染色体上的非等位基因自由组合。

基因自由组合定律在实践中的应用

基因自由组合定律在动植物育种工作和医学实践中同样有着重要意义。在育种工作中,人们用杂交的方法,有目的地使生物不同品种间的基因重新组合,以便使不同亲本的优良基因组合到一起,从而创造出对人类有益的新品种。例如,在水稻中,有芒(A)对无芒(a)是显性,抗病(R)对不抗病(r)是显性。有两个不同品种的水稻,一个品种无芒、不抗病;另一个品种有芒、抗病。人们将这两个不同品种的水稻进行杂交,根据自由组台定律,在F2中分离出的无芒、抗病(aaRR或aaRr)植株应该占总数的3/16,其中,l/16是纯合类型(aaRR)2/16是杂合类型(aaRr)。要进一步得到纯合类型,还需要对无芒、抗病类型进行自交和选育,淘汰不符合要求的植株,最后得到能够稳定遗传的无芒、抗病的类型。
在作物育种中,人们常常利用杂种优势达到增产的目的。杂种优势是利用纯合亲本杂交,使杂种F1具有高产、优质、多种抗性等性状。想一想:具有杂种优势的品种能够代代遗传吗?

在医学实践中,人们可以根据基因的自由组合定律来分析家系中两种遗传病同时发病的情况,并且推断出后代的基因型和表现型以及它们出现的概率,为遗传病的预测和诊断提供理论上的依据。例如,在一个家庭中,父亲是多指患者(由显性致病基因P控制),母亲的表现型正常,他们婚后却生了一个手指正常但患先天聋哑的孩子(由隐性致病基因d控制;基因型为dd)。根据基因的自由组合定律可以推知:父亲的基因型应该是 PpDd,母亲的基因型应该是ppDd。根据父母亲的基因型,可以推断出他们后代有可能出现4种不同的表现型,它们是:只患多指;只患先天聋哑;既患多指又患先天聋哑;表现型完全正常。

推算一下,在这对夫妇所生子女中,每一种表现型出现的概率是多少?

孟德尔获得成功的原因

在孟德尔之前,也有不少学者做过动物和植物的杂交试验,但是都没能总结出任何规律,为什么孟德尔能够取得如此巨大的成果呢?归纳起来,主要有以下几个方面的原因:

第一,正确地选用试验材料是孟德尔获得成功的首要条件。孟德尔在做杂交试验时选用了豌豆作试验材料,这是因为豌豆不仅是闭花受粉植物,而且各个品种之间有一些稳定的、容易区分的性状。实际上,豌豆也有一些不易区分的性状,比如叶的大小与花的大小等,孟德尔在做杂交试验时,舍弃了这类性状,只是对稳定的,容易区分的相对性状进行研究,这就使试验的结果既可靠又容易分析。

第二,在对生物的性状进行分析时,孟德尔首先只针对一对相对性状的传递情况进行研究。例如,当研究子粒的形状时,不考虑子粒的颜色,在研究子粒的颜色时又不考虑子粒的饱满程度。在弄清一对相对性状的传递情况后,再研究两对、三对,甚至多对相对性状的传递情况。这种由单因素到多因素的研究方法也是孟德尔获得成功的重要原因。

第三,孟德尔在进行豌豆的杂交试验时,对不同世代出现的不同性状的个体数目都进行了记载和分析,并且应用统计学方法对实验结果进行分析,这是孟德尔获得成功的又一个重要原因。第四,孟德尔还科学地设计了试验的程序。他在对大量试验数据进行分析的基础上,合理地提出了假说,并且设计了新的试验来验证假说,这是孟德尔获得成功的第四个重要原因。

孟德尔揭示遗传规律的过程表明,任何一项科学研究成果的取得,不仅需要有坚韧的毅力和持之以恒的探索精神,还需要有严谨求实的科学态度和正确的科学方法。

基因自由组合定律的例题分析

例题1 豌豆的高茎(D)对矮茎(d)是显性,红花(C)对白花(c)是显性。推算亲本DdCc与 DdCc杂交后,子代的基因型和表现型以及它们各自的数量比。分析:推算两对(或两对以上)杂交组合的基因型和表现型时,为了使问题简便,一般不采用棋盘法而采用分枝法进行分析。应用分枝法时,首先对各对性状分别进行分析,如本题中,如果单独考虑高茎与矮茎,Dd×Dd子代的基因型和它们的数量比应该为1DD∶2Dd∶1dd;子代的表现型和它们的数量比则为3高茎∶1矮茎。如果单独考虑红花与白花,Cc×Cc子代的基因型和它们的数量比应该为1CC:2Cc:1cc;子代的表现型和它们的数量比则为:3红花:1白花。在此基础上再列表并进行推算(见下表),推算的方法是:子代基因型的数量比应该是各种基因型相应比值的乘积,子代表现型的数量比也应该是各种表现型相应比值的乘积。

答:DdCc和DdCc杂交,子代基因型和它们的数量比是:1DDCC:2DDCc:1DDcc:2DdCC:4DdCc:2Ddcc:1ddCC:2ddCc:1ddcc。子代表现型和它们的数量比是:9高茎红花:3高茎白花:3矮茎红花:1矮茎白花。例题2 番茄的红果(R)对黄果(r)是显性,二室(D)对多室(d)是显性,这两对基因分别位于不同对的染色体上,现用甲乙两种不同类型的植株杂交,它们的后代中,红果二室、红果多室、黄果二室、黄果多室的植株数分别是300、109、305和104,问甲乙两种杂交植株的基因型是怎样的?表现型是怎样的?分析:为了使问题简化,解题时可以对每对性状分别进行分析。依题意从子代中各种表现型的植株数目可以得出:红果:黄果(300+109):(305+104)=1:1二室:多室=(300+305):(109+104)=3:1由此可见,如果单纯考虑果实的颜色,根据子代中推算出的红果与黄果的分离比是1:1,可以分析出双亲中一个是杂合子,一个是隐性纯合子,即如果甲植株的基因型是Rr,那么乙植株的基因型一定是rr。如果单纯考虑二室和多室,根据子代中推算出二室与多室的分离比是3:1,可以分析出双亲都是杂合子。即甲乙植株的基因型都是Dd。因此,综合上述两对性状考虑,甲乙两植株的基因型应该分别是RrDd和rrDd,根据它们的基因型可以推出:甲植株番茄是红果二室,乙植株番茄是黄果二室。

E. 什么是rdd以及应用举例说明

生态位就是每个生物在环境中所占的阈值的大小。比如:生存空间的大小,食性的大小,对不同环境条件的不同适应等。比如说,我们在农业生产中可以高矮间作,可以说就是对生态位理论的一种应用。。。。。。。

F. RDD代表什么组织病理名

罗道病(Rosai-Dorfman病)又称窦组织细胞增生伴巨大淋巴结病(sinus hisliocytosis with massive lymphadenopathy,SHML)是一种良性淋巴组织增生性疾病,1966年Azoury和Reed首先报道,1969年Rosai和Dorfman对其做了详细研究,并正式命名·

G. 请问rdd是什么意思

弹性分布式数据集(RDD,Resilient Distributed Datasets),它具备像MapRece等数据流模型的容错特性,并且允许开发人员在大型集群上执行基于内存的计算。现有的数据流系统对两种应用的处理并不高效:一是迭代式算法,这在图应用和机器学习领域很常见;二是交互式数据挖掘工具。这两种情况下,将数据保存在内存中能够极大地提高性能。为了有效地实现容错,RDD提供了一种高度受限的共享内存,即RDD是只读的,并且只能通过其他RDD上的批量操作来创建。尽管如此,RDD仍然足以表示很多类型的计算,包括MapRece和专用的迭代编程模型(如Pregel)等。我们实现的RDD在迭代计算方面比Hadoop快20多倍,同时还可以在5-7秒内交互式地查询1TB数据集。

H. 生物关于减数分裂的问题(很简单,但好纠结),请解释下

刚开始变成RRrrDDdd以后,进入减数第一次分裂。可以产生RRDD和rrdd(或者RRdd和rrDD)。然后减数第二次分裂,产生RD和rd(或者Rd和rD)。RR可以和DD、dd组合。一个母细胞应该是产生两种配子,四个配子两两相同。至于说产生四种配子是说总的可能性。
http://ke..com/image/b25d9901a8137195267fb579 这个链接的图片你可以看看。

阅读全文

与生物中rdd是什么相关的资料

热点内容
word中化学式的数字怎么打出来 浏览:743
乙酸乙酯化学式怎么算 浏览:1408
沈阳初中的数学是什么版本的 浏览:1356
华为手机家人共享如何查看地理位置 浏览:1048
一氧化碳还原氧化铝化学方程式怎么配平 浏览:889
数学c什么意思是什么意思是什么 浏览:1414
中考初中地理如何补 浏览:1306
360浏览器历史在哪里下载迅雷下载 浏览:706
数学奥数卡怎么办 浏览:1394
如何回答地理是什么 浏览:1029
win7如何删除电脑文件浏览历史 浏览:1060
大学物理实验干什么用的到 浏览:1489
二年级上册数学框框怎么填 浏览:1705
西安瑞禧生物科技有限公司怎么样 浏览:986
武大的分析化学怎么样 浏览:1252
ige电化学发光偏高怎么办 浏览:1341
学而思初中英语和语文怎么样 浏览:1658
下列哪个水飞蓟素化学结构 浏览:1427
化学理学哪些专业好 浏览:1490
数学中的棱的意思是什么 浏览:1063