❶ 关于生物学上的各种信息 行为信息,含义是什么,举例子说明
化学信息:甲昆虫的幼虫吃一种植物,于是,这种植物可以释放化学物质吸引甲昆虫的天敌乙昆虫,从而保护自己.
物理信息:蜘蛛网上粘住了小虫子,从而使蜘蛛网震动,蜘蛛感受到后进行捕食.
没有生物信息这个概念吧,反正高中课本上没涉及.
行为信息:蜜蜂在采蜜的时候跳舞,吸引更多的蜜蜂.
❷ 生物中的 物理信息 化学信息 行为信息 怎么分辨
物理信息,光、电、热、声等都算,最简单的例子是鸟鸣化学信息,主要是气味呀之类和化学成分有关的,例子:性外激素行为信息,通过一系列动作(重点是行为动作)传达信息,例子:蜜蜂跳舞 不懂的话可追问
❸ 高中生物学习的信息分子有那些
高中生物学习的信息分子主要有:
1、生物学中起催化作用的主要是酶。
2、传递信息的分子主要是:神经递质和激素。
3、酶在反应前后不会被水解;神经递质一般会被水解,如乙酰胆碱会被乙酰胆碱酯酶水解;激素在体内不断地发生代谢失活。
❹ 什么是行为信息,什么是物理信息,什么是化学信息什么是营养信息(生物的)
化学信息
:生物在某些特定条件下,或某个生长发育阶段,分解出某些特殊的化学物质。这些分泌物不是对生物提供营养,而是在生物的个体或种群之间起着某种信息的传递作用,即构成了化学信息。如蚂蚁可以通过自己的分泌物留下化学痕迹,以便后面的蚂蚁跟随;猫、
狗可以通过排尿标记自己的行踪及活动区域。化学信息对集群活动的整体性和集群整体性的维持具有极重要的作用。
物理信息:鸟鸣、兽吼、颜色、光等构成了生态系统的物理信息。鸟鸣、兽吼可以传达惊慌、安全、恫吓、警告、嫌恶、有无食物和要求配偶等各种信息。昆虫可以根据花的颜色判断花蜜的有无;鱼类在水中长期适应于把光作为食物的信息。
行为信息:有些动物可以通过自己的各种行为方式向同伴发出识别、威吓、求偶和挑战等信息,
如燕子在求偶时,雄燕在空中围绕雌燕做出特殊的飞行姿式。蜜蜂在发现蜂蜜时,以舞蹈动作“告诉”其他蜜蜂去采蜜。不同的舞蹈动作有不同的含义,如圆舞姿态表示蜜源较近,摆尾舞表示蜜源较远。其他蜜蜂以触觉来感觉舞蹈的步伐,得到蜜源的信息。
❺ 生物学都有哪些内容
生物学是自然科学的一个门类,研究生物的结构、功能、发生和发展的规律。根据研究对象,分为动物学、植物学、微生物学等;根据研究内容,分为分类学、解剖学、生理学、遗传学、生态学等。它是研究生物各个层次的种类、结构、功能、行为、发育和起源进化以及生物与周围环境的关系等的科学。人是生物的一种,也是生物学的研究对象。
❻ 生物中的信息分子有哪些
信号(信息)分子是指生物体内的某些化学分子, 既非营养物, 又非能源物质和结构物质,而且也不是酶,它们主要是用来在细胞间和细胞内传递信息, 如激素、神经递质、生长因子等统称为信号分子,它们的惟一功能是同细胞受体结合, 传递细胞信息。
从产生和作用方式来看可分为内分泌激素、神经递质、局部化学介导因子和气体分子等四类。
①激素是由内分泌细胞(如肾上腺、睾丸、卵巢、胰腺、甲状腺、甲状旁腺和垂体)合成的化学信号分子,一种内分泌细胞基本上只分泌一种激素,参与细胞通讯的激素有三种类型:蛋白与肽类激素、类固醇激素、氨基酸衍生物激素。
②神经递质是由神经末梢释放出来的小分子物质,是神经元与靶细胞之间的化学信使。由于神经递质是神经细胞分泌的,所以这种信号又称为神经信号。
③局部化学介质又称为旁分泌信号,指由细胞分泌的信息分子通过扩散而作用于邻近的靶细胞,调节细胞的生理功能。体内的局部化学介质包括组胺、花生四烯酸(AA)、生长因子等。
❼ 生物信息学的概念
生物信息学(Bioinformatics):从事对基因组研究相关生物信息的获取、加工、储存、分配、分析和解释。这一定义包括了两层含义,一是对海量数据的收集、整理与服务,也就是管好这些数据;另一个是从中发现新的规律,也就是用好这些数据。
具体地说,生物信息学是把基因组DNA序列信息分析作为源头,找到基因组序列中代表蛋白质和RNA基因的编码区;同时,阐明基因组中大量存在的非编码区的信息实质,破译隐藏在DNA序列中的遗传语言规律;在此基础上,归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白质谱的数据,从而认识代谢、发育、分化、进化的规律。
生物信息学还利用基因组中编码区的信息进行蛋白质空间结构的模拟和蛋白质功能的预测,并将此类信息与生物体和生命过程的生理生化信息相结合,阐明其分子机理,最终进行蛋白质、核酸的分子设计、药物设计和个体化的医疗保健设计。
❽ 如何区别物理信息,化学信息,行为信息(生物学)
根据传递的物质来区别,物理信息传递的是物理物质,生态系统中的光,声,湿度,温度,磁力等。化学信息传递的是化学物质,化学信息主要是生命活动的代谢产物以及性外激素等。
行为信息传递的是动物的行为,动植物的许多特殊行为都可以传递某种信息。如蜜蜂的舞蹈行为就是一种行为信息。草原中有一种鸟,当雄鸟发现危险时就会急速起飞,并扇动两翼,给在孵卵的雌鸟发出逃避的信息。
(8)哪些算是生物学上的信息扩展阅读
生态系统中信息传递的作用
1、维持生命活动的正常进行和生物种群的繁衍
蝙蝠对周围环境的识别、取食与飞行,几乎完全依赖声波。蝙蝠通过自身发出声波,对目标进行“回声定位”。有些植物,像莴苣、茄、烟草的种子必须接受某种波长的光信息,才能萌发生长。
2、调节生物的种间关系,维持生态系统的稳定
在生态系统中,食物链上的相邻物种之间存在着“食”与“被食”的关系,相邻物种的某些个体行为与种群特征为对方提供了大量的有用信息。
信息传递在农业生产中的应用
1、提高农产品或畜产品的产量
人类种植农作物,有许多是要收获果实。而动物的传份对于许多农作物的结实是不可或缺的。事实上,地球上许多被子植物的传粉都是由动物完成的。如果能利用模拟的动物信息吸引大量的传份动物,就可以提高果树的传粉效率和结实率。
2、对有害动物进行控制
世界上每年都有大面积的农田、草原和森林遭受病虫害、鼠害、鸟害。控制动物危害的技术大致有化学防治、生物防治和机械防治等。这些方法各有优点,但人类越来越倾向于利用对人类生存环境无污染的生物防治。生物防治中有些就是利用信息传递作用。
❾ 什么是生物信息学
生物信息学
一, 生物信息学发展简介
生物信息学是建立在分子生物学的基础上的,因此,要了解生物信息学,就
必须先对分子生物学的发展有一个简单的了解.研究生物细胞的生物大分子的结
构与功能很早就已经开始,1866年孟德尔从实验上提出了假设:基因是以生物
成分存在[1],1871年Miescher从死的白细胞核中分离出脱氧核糖核酸(DNA),
在Avery和McCarty于1944年证明了DNA是生命器官的遗传物质以前,人们
仍然认为染色体蛋白质携带基因,而DNA是一个次要的角色.
1944年Chargaff发现了着名的Chargaff规律,即DNA中鸟嘌呤的量与胞嘧
定的量总是相等,腺嘌呤与胸腺嘧啶的量相等.与此同时,Wilkins与Franklin
用X射线衍射技术测定了DNA纤维的结构.1953年James Watson 和Francis
Crick在Nature杂志上推测出DNA的三维结构(双螺旋).DNA以磷酸糖链形
成发双股螺旋,脱氧核糖上的碱基按Chargaff规律构成双股磷酸糖链之间的碱基
对.这个模型表明DNA具有自身互补的结构,根据碱基对原则,DNA中贮存的
遗传信息可以精确地进行复制.他们的理论奠定了分子生物学的基础.
DNA双螺旋模型已经预示出了DNA复制的规则,Kornberg于1956年从大
肠杆菌(E.coli)中分离出DNA聚合酶I(DNA polymerase I),能使4种dNTP连接
成DNA.DNA的复制需要一个DNA作为模板.Meselson与Stahl(1958)用实验
方法证明了DNA复制是一种半保留复制.Crick于1954年提出了遗传信息传递
的规律,DNA是合成RNA的模板,RNA又是合成蛋白质的模板,称之为中心
法则(Central dogma),这一中心法则对以后分子生物学和生物信息学的发展都起
到了极其重要的指导作用.
经过Nirenberg和Matthai(1963)的努力研究,编码20氨基酸的遗传密码
得到了破译.限制性内切酶的发现和重组DNA的克隆(clone)奠定了基因工程
的技术基础.
正是由于分子生物学的研究对生命科学的发展有巨大的推动作用,生物信息
学的出现也就成了一种必然.
2001年2月,人类基因组工程测序的完成,使生物信息学走向了一个高潮.
由于DNA自动测序技术的快速发展,DNA数据库中的核酸序列公共数据量以每
天106bp速度增长,生物信息迅速地膨胀成数据的海洋.毫无疑问,我们正从一
个积累数据向解释数据的时代转变,数据量的巨大积累往往蕴含着潜在突破性发
现的可能,"生物信息学"正是从这一前提产生的交叉学科.粗略地说,该领域
的核心内容是研究如何通过对DNA序列的统计计算分析,更加深入地理解DNA
序列,结构,演化及其与生物功能之间的关系,其研究课题涉及到分子生物学,
分子演化及结构生物学,统计学及计算机科学等许多领域.
生物信息学是内涵非常丰富的学科,其核心是基因组信息学,包括基因组信
息的获取,处理,存储,分配和解释.基因组信息学的关键是"读懂"基因组的核
苷酸顺序,即全部基因在染色体上的确切位置以及各DNA片段的功能;同时在
发现了新基因信息之后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的
功能进行药物设计[2].了解基因表达的调控机理也是生物信息学的重要内容,根
据生物分子在基因调控中的作用,描述人类疾病的诊断,治疗内在规律.它的研
究目标是揭示"基因组信息结构的复杂性及遗传语言的根本规律",解释生命的遗
传语言.生物信息学已成为整个生命科学发展的重要组成部分,成为生命科学研
究的前沿.
二, 生物信息学的主要研究方向
生物信息学在短短十几年间,已经形成了多个研究方向,以下简要介绍一些
主要的研究重点.
1,序列比对(Sequence Alignment)
序列比对的基本问题是比较两个或两个以上符号序列的相似性或不相似
性.从生物学的初衷来看,这一问题包含了以下几个意义[3]:
从相互重叠的序列片断中重构DNA的完整序列.
在各种试验条件下从探测数据(probe data)中决定物理和基因图
存贮,遍历和比较数据库中的DNA序列
比较两个或多个序列的相似性
在数据库中搜索相关序列和子序列
寻找核苷酸(nucleotides)的连续产生模式
找出蛋白质和DNA序列中的信息成分
序列比对考虑了DNA序列的生物学特性,如序列局部发生的插入,删除(前
两种简称为indel)和替代,序列的目标函数获得序列之间突变集最小距离加权
和或最大相似性和,对齐的方法包括全局对齐,局部对齐,代沟惩罚等.两个
序列比对常采用动态规划算法,这种算法在序列长度较小时适用,然而对于海
量基因序列(如人的DNA序列高达109bp),这一方法就不太适用,甚至采用算
法复杂性为线性的也难以奏效.因此,启发式方法的引入势在必然,着名的
BALST和FASTA算法及相应的改进方法均是从此前提出发的.
2, 蛋白质结构比对和预测
基本问题是比较两个或两个以上蛋白质分子空间结构的相似性或不相似性.
蛋白质的结构与功能是密切相关的,一般认为,具有相似功能的蛋白质结构一般
相似.蛋白质是由氨基酸组成的长链,长度从50到1000~3000AA(Amino Acids),
蛋白质具有多种功能,如酶,物质的存贮和运输,信号传递,抗体等等.氨基酸
的序列内在的决定了蛋白质的3维结构.一般认为,蛋白质有四级不同的结构.
研究蛋白质结构和预测的理由是:医药上可以理解生物的功能,寻找docking
drugs的目标,农业上获得更好的农作物的基因工程,工业上有利用酶的合成.
直接对蛋白质结构进行比对的原因是由于蛋白质的3维结构比其一级结构
在进化中更稳定的保留,同时也包含了较AA序列更多的信息.
蛋白质3维结构研究的前提假设是内在的氨基酸序列与3维结构一一对应
(不一定全真),物理上可用最小能量来解释.
从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构.同
源建模(homology modeling)和指认(Threading)方法属于这一范畴.同源建模用
于寻找具有高度相似性的蛋白质结构(超过30%氨基酸相同),后者则用于比较
进化族中不同的蛋白质结构.
然而,蛋白结构预测研究现状还远远不能满足实际需要.
3, 基因识别,非编码区分析研究.
基因识别的基本问题是给定基因组序列后,正确识别基因的范围和在基因组
序列中的精确位置.非编码区由内含子组成(introns),一般在形成蛋白质后被丢
弃,但从实验中,如果去除非编码区,又不能完成基因的复制.显然,DNA序
列作为一种遗传语言,既包含在编码区,又隐含在非编码序列中.分析非编码
区DNA序列目前没有一般性的指导方法.
在人类基因组中,并非所有的序列均被编码,即是某种蛋白质的模板,已
完成编码部分仅占人类基因总序列的3~5%,显然,手工的搜索如此大的基因序
列是难以想象的.
侦测密码区的方法包括测量密码区密码子(codon)的频率,一阶和二阶马尔
可夫链,ORF(Open Reading Frames),启动子(promoter)识别,HMM(Hidden
Markov Model)和GENSCAN,Splice Alignment等等.
4, 分子进化和比较基因组学
分子进化是利用不同物种中同一基因序列的异同来研究生物的进化,构建进
化树.既可以用DNA序列也可以用其编码的氨基酸序列来做,甚至于可通过相
关蛋白质的结构比对来研究分子进化,其前提假定是相似种族在基因上具有相似
性.通过比较可以在基因组层面上发现哪些是不同种族中共同的,哪些是不同的.
早期研究方法常采用外在的因素,如大小,肤色,肢体的数量等等作为进化
的依据.近年来较多模式生物基因组测序任务的完成,人们可从整个基因组的角
度来研究分子进化.在匹配不同种族的基因时,一般须处理三种情况:
Orthologous: 不同种族,相同功能的基因
Paralogous: 相同种族,不同功能的基因
Xenologs: 有机体间采用其他方式传递的基因,如被病毒注入的基因.
这一领域常采用的方法是构造进化树,通过基于特征(即DNA序列或蛋白
质中的氨基酸的碱基的特定位置)和基于距离(对齐的分数)的方法和一些传统
的聚类方法(如UPGMA)来实现.
5, 序列重叠群(Contigs)装配
根据现行的测序技术,每次反应只能测出500 或更多一些碱基对的序列,
如人类基因的测量就采用了短枪(shortgun)方法,这就要求把大量的较短的序列
全体构成了重叠群(Contigs).逐步把它们拼接起来形成序列更长的重叠群,直
至得到完整序列的过程称为重叠群装配.从算法层次来看,序列的重叠群是一个
NP-完全问题.
6, 遗传密码的起源
通常对遗传密码的研究认为,密码子与氨基酸之间的关系是生物进化历史上
一次偶然的事件而造成的,并被固定在现代生物的共同祖先里,一直延续至今.
不同于这种"冻结"理论,有人曾分别提出过选择优化,化学和历史等三种学说
来解释遗传密码.随着各种生物基因组测序任务的完成,为研究遗传密码的起源
和检验上述理论的真伪提供了新的素材.
7, 基于结构的药物设计
人类基因工程的目的之一是要了解人体内约10万种蛋白质的结构,功能,
相互作用以及与各种人类疾病之间的关系,寻求各种治疗和预防方法,包括药物
治疗.基于生物大分子结构及小分子结构的药物设计是生物信息学中的极为重要
的研究领域.为了抑制某些酶或蛋白质的活性,在已知其蛋白质3级结构的基础
上,可以利用分子对齐算法,在计算机上设计抑制剂分子,作为候选药物.这一
领域目的是发现新的基因药物,有着巨大的经济效益.
8, 其他
如基因表达谱分析,代谢网络分析;基因芯片设计和蛋白质组学数据分析等,
逐渐成为生物信息学中新兴的重要研究领域;在学科方面,由生物信息学衍生的
学科包括结构基因组学,功能基因组学,比较基因组学,蛋白质学,药物基因组
学,中药基因组学,肿瘤基因组学,分子流行病学和环境基因组学.
从现在的发展不难看出,基因工程已经进入了后基因组时代.我们也有应对
与生物信息学密切相关的如机器学习,和数学中可能存在的误导有一个清楚的认
识.
三, 生物信息学与机器学习
生物信息的大规模给数据挖掘提出了新课题和挑战,需要新的思想的加入.
常规的计算机算法仍可以应用于生物数据分析中,但越来越不适用于序列分析问
题.究竟原因,是由于生物系统本质上的模型复杂性及缺乏在分子层上建立的完
备的生命组织理论.
西蒙曾给出学习的定义:学习是系统的变化,这种变化可使系统做相同工作
时更有效[4].机器学习的目的是期望能从数据中自动地获得相应的理论,通过采
用如推理,模型拟合及从样本中学习,尤其适用于缺乏一般性的理论,"噪声"
模式,及大规模数据集.因此,机器学习形成了与常规方法互补的可行的方法.
机器学习使得利用计算机从海量的生物信息中提取有用知识,发现知识成为可能
[5].
机器学习方法在大样本,多向量的数据分析工作中发挥着日益重要的作用,
而目前大量的基因数据库处理需要计算机能自动识别,标注,以避免即耗时又花
费巨大的人工处理方法.早期的科学方法—观测和假设----面对高数据的体积,
快速的数据获取率和客观分析的要求---已经不能仅依赖于人的感知来处理了.因
而,生物信息学与机器学习相结合也就成了必然.
机器学习中最基本的理论框架是建立在概率基础上的,从某种意义来说,是
统计模型拟合的延续,其目的均为提取有用信息.机器学习与模式识别和统计推
理密切相关.学习方法包括数据聚类,神经网络分类器和非线性回归等等.隐马
尔可夫模型也广泛用于预测DNA的基因结构.目前研究重心包括:1)观测和
探索有趣的现象.目前ML研究的焦点是如何可视化和探索高维向量数据.一般
的方法是将其约简至低维空间,如常规的主成分分析(PCA),核主成分分析
(KPCA),独立成分分析(Independent component analysis),局部线性嵌套(Locally
Linear embedding).2)生成假设和形式化模型来解释现象[6].大多数聚类方法可
看成是拟合向量数据至某种简单分布的混合.在生物信息学中聚类方法已经用于
microarray数据分析中,癌症类型分类及其他方向中.机器学习也用于从基因数
据库中获得相应的现象解释.
机器学习加速了生物信息学的进展,也带了相应的问题.机器学习方法大多
假定数据符合某种相对固定的模型,而一般数据结构通常是可变的,在生物信息
学中尤其如此,因此,有必要建立一套不依赖于假定数据结构的一般性方法来寻
找数据集的内在结构.其次,机器学习方法中常采用"黑箱"操作,如神经网络
和隐马尔可夫模型,对于获得特定解的内在机理仍不清楚.
四, 生物信息学的数学问题
生物信息学中数学占了很大的比重.统计学,包括多元统计学,是生物信息
学的数学基础之一;概率论与随机过程理论,如近年来兴起的隐马尔科夫链模型
(HMM),在生物信息学中有重要应用;其他如用于序列比对的运筹学;蛋白质
空间结构预测和分子对接研究中采用的最优化理论;研究DNA超螺旋结构的拓
扑学;研究遗传密码和DNA序列的对称性方面的群论等等.总之,各种数学理
论或多或少在生物学研究中起到了相应的作用.
但并非所有的数学方法在引入生物信息学中都能普遍成立的,以下以统计学
和度量空间为例来说明.
1, 统计学的悖论
数学的发展是伴随悖论而发展的.对于进化树研究和聚类研究中最显着的悖
论莫过于均值了,如图1:
图1 两组同心圆的数据集
图1是两组同心圆构成的数据集,显然,两组数据集的均值均在圆点,这也
就说明了要采用常规的均值方法不能将这两类分开,也表明均值并不能带来更多
的数据的几何性质.那么,如果数据呈现类似的特有分布时,常有的进化树算法
和聚类算法(如K-均值)往往会得错误的结论.统计上存在的陷阱往往是由于
对数据的结构缺乏一般性认识而产生的.
2, 度量空间的假设
在生物信息学中,进化树的确立,基因的聚类等都需要引入度量的概念.举
例来说,距离上相近或具有相似性的基因等具有相同的功能,在进化树中满足分
值最小的具有相同的父系,这一度量空间的前提假设是度量在全局意义下成立.
那么,是否这种前提假设具有普适性呢
我们不妨给出一般的描述:假定两个向量为A,B,其中,
,则在假定且满足维数间线性无关的前提下,两个
向量的度量可定义为:
(1)
依据上式可以得到满足正交不变运动群的欧氏度量空间,这也是大多数生物信息
学中常采用的一般性描述,即假定了变量间线性无关.
然而,这种假设一般不能正确描述度量的性质,尤其在高维数据集时,不考
虑数据变量间的非线性相关性显然存在问题,由此,我们可以认为,一个正确的
度量公式可由下式给出:
(2)
上式中采用了爱因斯坦和式约定,描述了变量间的度量关系.后者在满足
(3)
时等价于(1),因而是更一般的描述,然而问题在于如何准确描述变量间的非线
性相关性,我们正在研究这个问题.
五, 几种统计学习理论在生物信息学中应用的困难
生物信息学中面对的数据量和数据库都是规模很大的,而相对的目标函数却
一般难以给出明确的定义.生物信息学面临的这种困难,可以描述成问题规模的
巨大以及问题定义的病态性之间的矛盾,一般从数学上来看,引入某个正则项来
改善性能是必然的[7].以下对基于这一思想产生的统计学习理论[8],Kolmogorov
复杂性[98]和BIC(Bayesian Information Criterion)[109]及其存在的问题给出简要介
绍.
支持向量机(SVM)是近来较热门的一种方法,其研究背景是Vapnik的统计
学习理论,是通过最大化两个数据集的最大间隔来实现分类,对于非线性问题则
采用核函数将数据集映射至高维空间而又无需显式描述数据集在高维空间的性
质,这一方法较之神经方法的好处在于将神经网络隐层的参数选择简化为对核函
数的选择,因此,受到广泛的注意.在生物信息学中也开始受到重视,然而,核
函数的选择问题本身是一个相当困难的问题,从这个层次来看,最优核函数的选
择可能只是一种理想,SVM也有可能象神经网络一样只是机器学习研究进程中
又一个大气泡.
Kolmogorov复杂性思想与统计学习理论思想分别从不同的角度描述了学习
的性质,前者从编码的角度,后者基于有限样本来获得一致收敛性.Kolmogorov
复杂性是不可计算的,因此由此衍生了MDL原则(最小描述长度),其最初只
适用于离散数据,最近已经推广至连续数据集中,试图从编码角度获得对模型参
数的最小描述.其缺陷在于建模的复杂性过高,导致在大数据集中难以运用.
BIC准则从模型复杂性角度来考虑,BIC准则对模型复杂度较高的给予大的
惩罚,反之,惩罚则小,隐式地体现了奥卡姆剃刀("Occam Razor")原理,近
年也广泛应用于生物信息学中.BIC准则的主要局限是对参数模型的假定和先验
的选择的敏感性,在数据量较大时处理较慢.因此,在这一方面仍然有许多探索
的空间.
六, 讨论与总结
人类对基因的认识,从以往的对单个基因的了解,上升到在整个基因组水平
上考察基因的组织结构和信息结构,考察基因之间在位置,结构和功能上的相互
关系.这就要求生物信息学在一些基本的思路上要做本质的观念转变,本节就这
些问题做出探讨和思索.
启发式方法:
Simond在人类的认知一书中指出,人在解决问题时,一般并不去寻找最优
的方法,而只要求找到一个满意的方法.因为即使是解决最简单的问题,要想得
到次数最少,效能最高的解决方法也是非常困难的.最优方法和满意方法之间的
困难程度相差很大,后者不依赖于问题的空间,不需要进行全部搜索,而只要能
达到解决的程度就可以了.正如前所述,面对大规模的序列和蛋白质结构数据集,
要获得全局结果,往往是即使算法复杂度为线性时也不能够得到好的结果,因此,
要通过变换解空间或不依赖于问题的解空间获得满意解,生物信息学仍需要人工
智能和认知科学对人脑的进一步认识,并从中得到更好的启发式方法.
问题规模不同的处理:
Marvin Minsky在人工智能研究中曾指出:小规模数据量的处理向大规模数
据量推广时,往往并非算法上的改进能做到的,更多的是要做本质性的变化.这
好比一个人爬树,每天都可以爬高一些,但要想爬到月球,就必须采用其他方法
一样.在分子生物学中,传统的实验方法已不适应处理飞速增长的海量数据.同
样,在采用计算机处理上,也并非依靠原有的计算机算法就能够解决现有的数据
挖掘问题.如在序列对齐(sequence Alignment)问题上,在小规模数据中可以采用
动态规划,而在大规模序列对齐时不得不引入启发式方法,如BALST,FASTA.
乐观中的隐扰
生物信息学是一门新兴学科,起步于20世纪90年代,至今已进入"后基因
组时代",目前在这一领域的研究人员均呈普遍乐观态度,那么,是否存在潜在
的隐扰呢
不妨回顾一下早期人工智能的发展史[11],在1960年左右,西蒙曾相信不出
十年,人类即可象完成登月一样完成对人的模拟,造出一个与人智能行为完全相
同的机器人.而至今为止,这一诺言仍然遥遥无期.尽管人工智能研究得到的成
果已经渗入到各个领域,但对人的思维行为的了解远未完全明了.从本质来看,
这是由于最初人工智能研究上定位错误以及没有从认识论角度看清人工智能的
本质造成的;从研究角度来看,将智能行为还原成一般的形式化语言和规则并不
能完整描述人的行为,期望物理科学的成功同样在人工智能研究中适用并不现
实.
反观生物信息学,其目的是期望从基因序列上解开一切生物的基本奥秘,从
结构上获得生命的生理机制,这从哲学上来看是期望从分子层次上解释人类的所
有行为和功能和致病原因.这类似于人工智能早期发展中表现的乐观行为,也来
自于早期分子生物学,生物物理和生物化学的成就.然而,从本质上来讲,与人
工智能研究相似,都是希望将生命的奥秘还原成孤立的基因序列或单个蛋白质的
功能,而很少强调基因序列或蛋白质组作为一个整体在生命体中的调控作用.我
们因此也不得不思考,这种研究的最终结果是否能够支撑我们对生物信息学的乐
观呢 现在说肯定的话也许为时尚早.
综上所述,不难看出,生物信息学并不是一个足以乐观的领域,究竟原因,
是由于其是基于分子生物学与多种学科交叉而成的新学科,现有的形势仍表现为
各种学科的简单堆砌,相互之间的联系并不是特别的紧密.在处理大规模数据方
面,没有行之有效的一般性方法;而对于大规模数据内在的生成机制也没有完全
明了,这使得生物信息学的研究短期内很难有突破性的结果.那么,要得到真正
的解决,最终不能从计算机科学得到,真正地解决可能还是得从生物学自身,从
数学上的新思路来获得本质性的动力.
毫无疑问,正如Dulbecco1986年所说:"人类的DNA序列是人类的真谛,
这个世界上发生的一切事情,都与这一序列息息相关".但要完全破译这一序列
以及相关的内容,我们还有相当长的路要走.
(来源 ------[InfoBio.org | 生物信息学研讨组])http://www.infobio.org
生物信息学(Bioinformatics)是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学(Genomics)和蛋白学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。
生物信息学是一门利用计算机技术研究生物系统之规律的学科。
目前的生物信息学基本上只是分子生物学与信息技术(尤其是因特网技术)的结合体。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。
1990年代以来,伴随着各种基因组测序计划的展开和分子结构测定技术的突破和Internet的普及,数以百计的生物学数据库如雨后春笋般迅速出现和成长。对生物信息学工作者提出了严峻的挑战:数以亿计的ACGT序列中包涵着什么信息?基因组中的这些信息怎样控制有机体的发育?基因组本身又是怎样进化的?
生物信息学的另一个挑战是从蛋白质的氨基酸序列预测蛋白质结构。这个难题已困扰理论生物学家达半个多世纪,如今找到问题答案要求正变得日益迫切。诺贝尔奖获得者W. Gilbert在1991年曾经指出:“传统生物学解决问题的方式是实验的。现在,基于全部基因都将知晓,并以电子可操作的方式驻留在数据库中,新的生物学研究模式的出发点应是理论的。一个科学家将从理论推测出发,然后再回到实验中去,追踪或验证这些理论假设”。
生物信息学的主要研究方向: 基因组学 - 蛋白质组学 - 系统生物学 - 比较基因组学
❿ 什么是行为信息,什么是物理信息,什么是化学信息什么是营养信息(生物的)
生物学
即生命科学(life science/biology),概括地说,生物是研究生命现象和生命活动规律的科学。作为继物理、化学之后又一高速发展的学科,正朝着宏观和微观两个方向发展。宏观观方面已经发展到全球生态系统的研究;微观方面则向着分子方向发展。生物学与众多科学结合形成了种类繁多的边缘科学,呈辐射状发展。
生物学从最开始就有2个学派,一个叫博物学派,一个是实验学派。博物学派以生态学为代表,实验学派以遗传学和分子生物学为代表。
目前国内外尚无明确一致的生命科学的定义。特别是对生命科学的范畴,即生命科学包括哪些学科没有明确一致的说法。但一般认为,生命科学是将生命世界(living world)作为一个整体来研究的一个科学分支,研究活着的生物(living organisms)和生命过程(life processes),包括生物科学(biological science)--即生物学(biology)及其分支即医药学、农林牧渔业、人类学、社会学等。生物学的分支有动物学、植物学、微生物学、解剖学、生理学、生物物理学、生物化学、细胞生物学、分子生物学、神经生物学、发育生物学、社会生物学等。生命科学中生物学及其分支是生物科学的基础科学(basic science)或纯科学(pure science),医药学和农林牧渔业等是生物科学的应用科学(applied science);很显然,生物科学属于自然科学,而人类学和社会学则属于人文社会科学。所以生命科学的范畴是比较大的,包括了自然科学和社会科学两大科学领域。但是,我国教育部1998年颁布的新的高等学校本科专业目录的理工科部分中与上述生命科学自然科学部分有关的专业有生物学、生物学技术、医学、药学、农学等等,分别属于基础生物科学或应用生物科学范畴。
生物学是研究生物各个层次的种类、结构、功能、行为、发育和起源进化以及生物与周围环境的关系的科学。人也是生物的一种,也是生物学的研究对象。
20世纪40年代以来,生物学吸收了数学、物理学和化学的成就,逐渐发展成一门精确的、定量的、深入到分子层次的科学。
人们已经认识的生命是物质的一种运动状态。生命的基本单位是细胞,它是由蛋白质、核酸、脂类等生物大分子组成的物质系统。生命现象就是这一复杂系统中物质、能和信息三个量综合运动与传递的表现。
生命有许多无生命物质所不具备的特性。比如:生命能够在常温常压下合成多种有机化合物;能够以远远超出机器的效率来利用环境中的物质和制造体内的各种物质;能以极高的效率储存信息和传递信息;具有自我调节功能和自我复制能力;以不可逆的方式进行着个体发育和物种的演化等等。揭示生命过程中的机制具有巨大的理论和实践意义。
生物学的研究对象
地球上现存的生物估计有200万~450万种;已经灭绝的种类更多,估计至少也有1500万种。从北极到南极,从高山到深海,从冰雪覆盖的冻原到高温的矿泉,都有生物的存在。它们具有多种多样的形态结构,它们的生活方式也变化多端。
从生物的基本结构单位——细胞的水平来考察,有的生物还不具备细胞形态;在已经具有细胞形态的生物中,有原核细胞构成的、有由真核细胞构成的;从组织结构看,有单细胞生物、多细胞生物。而多细胞生物又根据组织器官的分化和发展而分为多种类型;从营养方式来看,有光和自养、吸收异养、腐蚀性异养、吞食异养;从生物在生态系统的作用看,有生产者、消费者、分解者等等。
生物学家根据生物的发展历史、形态结构特征、营养方式以及它们在生态系统中的作用等,将生物分成若干界。现在比较通行的认识是将地球上的生物界划分为五界:细菌、蓝菌等原核生物是原核生物界;单细胞的真核生物是原生生物界;光和自养的植物界;吸收异养的真菌界;吞食异养的动物界。
病毒是一种非细胞生命形态,它由一个核酸长链和蛋白质外壳构成,病毒没有自己的代谢机构,没有酶系统。因此病毒离开了宿主细胞,就成了没有任何生命活动、也不能独立自我繁殖的化学物质。一旦进入宿主细胞后,它就可以利用细胞中的物质和能量以及复制、转录和转译的能力,按照它自己的核酸所包含的遗传信息产生和它一样的新一代病毒。
病毒基因同其他生物的基因一样,也可以发生突变和重组,因此也是可以演化的。因为病毒没有独立的代谢机构,不能独立的繁殖,因此被认为是一种不完整的生命形态。近年来发现了比病毒还要简单的类病毒,它是小的RNA分子,没有蛋白质外壳,但它可以在动物身上造成疾病。这些不完整的生命形态的存在说明无生命与有生命之间没有不可逾越的鸿沟。
原核细胞和真核细胞是细胞的两大基本形态,它们反映了细胞进化的两个阶段。把具有细胞形态的生物划分原核生物和真核生物,是现代生物学的一大进展。原核细胞的主要特征是没有线粒体、质体等模细胞器,染色体只是一个环状的DNA分子,不含组蛋白及其它蛋白质,没有核膜。原和生物主要是细菌。
真核细胞是结构更为复杂的细胞。它有线粒体等膜细胞器,有包以双层膜的细胞核把核内的遗传物质与细胞质分开。DNA是长链分子,狱卒蛋白以及其他蛋白合成染色体。这核细胞可以进行有丝分裂和减数分裂,分裂的结果是复制的染色体均等地分配到子细胞中。原生生物是最原始的真核生物。
植物是以光和自养为主要营养方式的真核生物。典型植物细胞都含有液泡核以纤维素为主要成分的细胞壁。细胞质中由进行光合作用的细胞器—叶绿体。植物的光合作用都是以水为电子供体的,光合自养是植物的主要营养方式,少数的高等植物是寄生的,还有更少数的植物能够捕捉小昆虫,进行异养吸收。
植物从单细胞绿藻到被子植物是沿着适应光合作用的的方向发展的。高等植物中发生了植物的根(固定和吸收器官)、茎(支持器官)、叶(光和器官)的分化。叶柄和众多分支的茎支持片状的叶向四面展开,以获得最大的光照和吸收面积,细胞也逐渐分化成专门用于光合作用、输导和覆盖等各种组织。大多数植物的通过有性生殖,形成配子体和孢子体世代交替的生活史。植物是生态系统中最主要的生产者,也是地球上氧气的主要来源。
真菌是以吸收为主要营养方式的真核生物。真菌有细胞壁,细胞壁含有几丁质,也含有纤维素。几丁质是一种含氨基葡萄糖的多糖,是昆虫等动物骨骼的主要成分,植物细胞不含几丁质。真菌没有质体和光合色素。真菌的繁殖能力很强,繁殖方式多样,主要是以无性或有性生殖产生的各种孢子作为繁殖单位。真菌分布非常广泛,在生态系统中,真菌是重要的分解者。
动物是以吞食为营养方式的真核生物。吞食异养包括捕获、吞食、消化和吸收等一些列复杂的过程。动物体的结构是沿着适应吞食异养的方向发展的。单细胞动物吞入食物后形成食物泡。食物在食物泡中被消化,然后透过膜而进入细胞质中,细胞质中溶酶体与之融合,就是细胞内消化。
多细胞动物在进化过程中,细胞内消化逐渐为细胞外消化所取代,食物被捕获后在消化道内由消化腺分泌酶而被消化,消化后的小分子营养物经过消化道吸收,并通过环系循统输送到身体的各种细胞中。
与此相适应,多细胞动物逐步形成了复杂的排泄系统、外呼吸系统以及复杂的感觉系统、神经系统、内分泌系统和运动系统等。在全部生物中,只有动物的身体构造发展到如此复杂的高级水平。在生态系统中,动物是有机食物的消费者。
在生命发展的早期,生态系统是由生产者和分解者组成的两环系统。随着真核生物特别是动物的产生和发展,两环生态系统发展成有生产者、分解者和消费者所组成的三环系统。出现了今日丰富多彩的生物世界。
从类病毒、病毒到植物、动物,生物拥有众多特征鲜明的类型。各种类型之间又有一系列的中间环节,形成连续的谱系。同时由营养方式决定的三大进化方向,在生态系统中呈现出相互作用的空间关系。因而,进化既是时间过程,又是空间发展过程。生物从时间的历史渊源和空间的生活关系上都是一个整体。
生物的特征
生物不仅具有多样性,而且具有一些共同的特征和属性。
组成生物体的生物大分子的结构和功能,在原则上是相同的。比如各种生物的蛋白质的单体都是氨基酸,种类不过20种左右,它们的功能对所有的生物都是相同的;在不同生物体内基本代谢途径也是相同的等等。这就是生物化学的同一性。同一性深刻的揭示了生物的统一性。
生物具有多层次的结构模式。对于病毒以外的一切生物都是由细胞组成的,细胞是由大量原子和分子所组成的非均质的系统。
从结构上看,细胞是由蛋白质、核酸、脂类、多糖等组成的多分子动态体系;从信息论观点看,细胞是遗传信息和代谢信息的传递系统;从化学观点看,细胞是由小分子合成的复杂大分子;从热力学上看,细胞是远离平衡的开放系统……
除细胞外,生物还有其他结构单位。细胞之下有细胞器、分子、原子,细胞之上有组织、器官、器官系统、个体、生态系统、生物圈等等。生物的各种结构单位,按照复杂程度和逐级结合的关系而排列成一系列的等级,这就是结构层次。较高层次上会出现许多较低层次所没有的性质和规律。
其他的还有很多,比如生物的有序性和耗散结构、生物的稳定性,生命的连续性,个体发育,生物的进化,生态系统中的相互关系等等。
这些都说明,尽管生物世界存在惊人的多样性,但所有的生物都有共同的物质基础,遵循共同的规律。生物就是这样一个统一而有多样的物质世界。
和其他学科一样,生物学依据自己所研究的对象,也有一些基本的研究方法——观察描述的方法、比较的方法、实验的方法等等,也都具有自己的特点。对于生物学来说,既需要有精确的实验分析,又需要从整体和系统的角度来观察生命,生物学积累了大量关于各种层次生命系统及其组成部分的资料。今天对于生命系统的规律作出定量的理论研究已经提到日程上来,系统论方法将作为新的研究方法而受到人们的重视。
生物学的分支
早期的生物学主要是对自然的观察和描述,是关于博物学和形态分类的研究。所以生物学最早是按类群划分学科的,如植物学、动物学、为生物学等。由于生物种类的多样性,也由于人们对生物学的了解越来越多,学科的划分也就越来越细,一门学科往往在划分为若干学科。
按生物类群划分学科,有利于从各个侧面认识某一个自然类群的生物特点和规律性。但无论研究对象是什么,都不外乎分类、形态、生理、生化、生态、遗传、进化等等。
生物在地球历史中有着很长的发展历史,大约有1500万种生物已经灭绝,它们的遗骸保存在地层中形成化石。古生物学专门通过化石研究历史上的生物;
生物的类群是如此的繁多,需要一个专门的学科来研究类群的划分,就产生了分类学;
形态学是生物学中研究动植物的形态结构的学科;随着显微镜的使用,形态学又深入到超微结构的领域,组织学和细胞学也就相应的建立起来了;
生理学是研究生物机能的学科,生理学的研究方法是以实验为主;
遗传学是研究生物性状的遗传和变异,阐明其规律的学科;
胚胎学是研究生物个体发育的学科;
生态学是研究生物与生物之间以及生物与环境之间的关系的学科。研究范围包括个体、种群、群落、生态系统以及生物圈等层次。揭示生态系统中食物链、生产力、能量流动和物质循环的有关规律;
生物化学是研究生命物质的化学组成和生物体各种化学过程的学科,是进入20世纪以后迅速发展起来的一门学科。生物化学的成就提高了人们对生命本质的认识。生物化学侧重于生命的化学过程、参与这一过程的物质、产品以及酶的作用机制的研究。分子生物学是从研究生物大分子的结构发展起来的,现在更多的仍是研究生物大分子的结构与功能的关系、以及基因的表达、调控等方面的机制;
生物物理学是用物理薛的概念和方法研究生物的结构、生命活动的物理和物理化学过程的学科。早期生物物理学的研究是从生物发光、生物电等问题开始的。随着生物学、物理学的发展,新概念的产生和介入,生物物理的研究范围和水平不断加深加宽。产生了量子生物学、生物大分子晶体结构以及生物控制论等小分支;
生物数学是数学和生物学结合的产物,它的任务是研究生命过程中的数学规律。
生物界是一个多层次的复杂系统,为了揭示某一层次的规律以及和其他层次的关系,出现了按层次划分的学科并且越来越受人们的重视。比如:分子生物学、细胞生物学、个体生物学、种群生物学等等。
总之,生物学中一些新的学科在不断的分化出来,另一些学科又在走向融合。生物学分可的这种局面,反映了生物学极其丰富的内容,也反映了生物学蓬勃发展的景象。
研究生物学的意义
生物与人类生活的许多方面都有着非常密切的关系。生物学作为一门基础科学,传统上一直是农业和医学的基础,涉及种植业、畜牧业、养殖业、医疗、制药、卫生等等。随着生物学理论与方法的不断进步,它的应用领域也在不断扩大。现在,生物学的影响已经扩展到食品、化工、环境保护、能源、冶金等方面。如果考虑仿生学的因素,它还影响到了机械、电子技术、信息技术等等诸多领域的发展。
生物学分支学科
植物学、孢粉学、动物学、微生物学、细胞生物学、分子生物学、生物分类学、习性学、生理学、细菌学、微生物生理学、微生物遗传学、土壤微生物学、细胞学、细胞化学、细胞遗传学、免疫学、胚胎学、优生学、悉生生物学、遗传学、分子遗传学、生态学、仿生学、生物物理学、生物力学、生物力能学、生物声学、生物化学、生物数学