❶ 關於生物學上的各種信息 行為信息,含義是什麼,舉例子說明
化學信息:甲昆蟲的幼蟲吃一種植物,於是,這種植物可以釋放化學物質吸引甲昆蟲的天敵乙昆蟲,從而保護自己.
物理信息:蜘蛛網上粘住了小蟲子,從而使蜘蛛網震動,蜘蛛感受到後進行捕食.
沒有生物信息這個概念吧,反正高中課本上沒涉及.
行為信息:蜜蜂在采蜜的時候跳舞,吸引更多的蜜蜂.
❷ 生物中的 物理信息 化學信息 行為信息 怎麼分辨
物理信息,光、電、熱、聲等都算,最簡單的例子是鳥鳴化學信息,主要是氣味呀之類和化學成分有關的,例子:性外激素行為信息,通過一系列動作(重點是行為動作)傳達信息,例子:蜜蜂跳舞 不懂的話可追問
❸ 高中生物學習的信息分子有那些
高中生物學習的信息分子主要有:
1、生物學中起催化作用的主要是酶。
2、傳遞信息的分子主要是:神經遞質和激素。
3、酶在反應前後不會被水解;神經遞質一般會被水解,如乙醯膽鹼會被乙醯膽鹼酯酶水解;激素在體內不斷地發生代謝失活。
❹ 什麼是行為信息,什麼是物理信息,什麼是化學信息什麼是營養信息(生物的)
化學信息
:生物在某些特定條件下,或某個生長發育階段,分解出某些特殊的化學物質。這些分泌物不是對生物提供營養,而是在生物的個體或種群之間起著某種信息的傳遞作用,即構成了化學信息。如螞蟻可以通過自己的分泌物留下化學痕跡,以便後面的螞蟻跟隨;貓、
狗可以通過排尿標記自己的行蹤及活動區域。化學信息對集群活動的整體性和集群整體性的維持具有極重要的作用。
物理信息:鳥鳴、獸吼、顏色、光等構成了生態系統的物理信息。鳥鳴、獸吼可以傳達驚慌、安全、恫嚇、警告、嫌惡、有無食物和要求配偶等各種信息。昆蟲可以根據花的顏色判斷花蜜的有無;魚類在水中長期適應於把光作為食物的信息。
行為信息:有些動物可以通過自己的各種行為方式向同伴發出識別、威嚇、求偶和挑戰等信息,
如燕子在求偶時,雄燕在空中圍繞雌燕做出特殊的飛行姿式。蜜蜂在發現蜂蜜時,以舞蹈動作「告訴」其他蜜蜂去采蜜。不同的舞蹈動作有不同的含義,如圓舞姿態表示蜜源較近,擺尾舞表示蜜源較遠。其他蜜蜂以觸覺來感覺舞蹈的步伐,得到蜜源的信息。
❺ 生物學都有哪些內容
生物學是自然科學的一個門類,研究生物的結構、功能、發生和發展的規律。根據研究對象,分為動物學、植物學、微生物學等;根據研究內容,分為分類學、解剖學、生理學、遺傳學、生態學等。它是研究生物各個層次的種類、結構、功能、行為、發育和起源進化以及生物與周圍環境的關系等的科學。人是生物的一種,也是生物學的研究對象。
❻ 生物中的信息分子有哪些
信號(信息)分子是指生物體內的某些化學分子, 既非營養物, 又非能源物質和結構物質,而且也不是酶,它們主要是用來在細胞間和細胞內傳遞信息, 如激素、神經遞質、生長因子等統稱為信號分子,它們的惟一功能是同細胞受體結合, 傳遞細胞信息。
從產生和作用方式來看可分為內分泌激素、神經遞質、局部化學介導因子和氣體分子等四類。
①激素是由內分泌細胞(如腎上腺、睾丸、卵巢、胰腺、甲狀腺、甲狀旁腺和垂體)合成的化學信號分子,一種內分泌細胞基本上只分泌一種激素,參與細胞通訊的激素有三種類型:蛋白與肽類激素、類固醇激素、氨基酸衍生物激素。
②神經遞質是由神經末梢釋放出來的小分子物質,是神經元與靶細胞之間的化學信使。由於神經遞質是神經細胞分泌的,所以這種信號又稱為神經信號。
③局部化學介質又稱為旁分泌信號,指由細胞分泌的信息分子通過擴散而作用於鄰近的靶細胞,調節細胞的生理功能。體內的局部化學介質包括組胺、花生四烯酸(AA)、生長因子等。
❼ 生物信息學的概念
生物信息學(Bioinformatics):從事對基因組研究相關生物信息的獲取、加工、儲存、分配、分析和解釋。這一定義包括了兩層含義,一是對海量數據的收集、整理與服務,也就是管好這些數據;另一個是從中發現新的規律,也就是用好這些數據。
具體地說,生物信息學是把基因組DNA序列信息分析作為源頭,找到基因組序列中代表蛋白質和RNA基因的編碼區;同時,闡明基因組中大量存在的非編碼區的信息實質,破譯隱藏在DNA序列中的遺傳語言規律;在此基礎上,歸納、整理與基因組遺傳信息釋放及其調控相關的轉錄譜和蛋白質譜的數據,從而認識代謝、發育、分化、進化的規律。
生物信息學還利用基因組中編碼區的信息進行蛋白質空間結構的模擬和蛋白質功能的預測,並將此類信息與生物體和生命過程的生理生化信息相結合,闡明其分子機理,最終進行蛋白質、核酸的分子設計、葯物設計和個體化的醫療保健設計。
❽ 如何區別物理信息,化學信息,行為信息(生物學)
根據傳遞的物質來區別,物理信息傳遞的是物理物質,生態系統中的光,聲,濕度,溫度,磁力等。化學信息傳遞的是化學物質,化學信息主要是生命活動的代謝產物以及性外激素等。
行為信息傳遞的是動物的行為,動植物的許多特殊行為都可以傳遞某種信息。如蜜蜂的舞蹈行為就是一種行為信息。草原中有一種鳥,當雄鳥發現危險時就會急速起飛,並扇動兩翼,給在孵卵的雌鳥發出逃避的信息。
(8)哪些算是生物學上的信息擴展閱讀
生態系統中信息傳遞的作用
1、維持生命活動的正常進行和生物種群的繁衍
蝙蝠對周圍環境的識別、取食與飛行,幾乎完全依賴聲波。蝙蝠通過自身發出聲波,對目標進行「回聲定位」。有些植物,像萵苣、茄、煙草的種子必須接受某種波長的光信息,才能萌發生長。
2、調節生物的種間關系,維持生態系統的穩定
在生態系統中,食物鏈上的相鄰物種之間存在著「食」與「被食」的關系,相鄰物種的某些個體行為與種群特徵為對方提供了大量的有用信息。
信息傳遞在農業生產中的應用
1、提高農產品或畜產品的產量
人類種植農作物,有許多是要收獲果實。而動物的傳份對於許多農作物的結實是不可或缺的。事實上,地球上許多被子植物的傳粉都是由動物完成的。如果能利用模擬的動物信息吸引大量的傳份動物,就可以提高果樹的傳粉效率和結實率。
2、對有害動物進行控制
世界上每年都有大面積的農田、草原和森林遭受病蟲害、鼠害、鳥害。控制動物危害的技術大致有化學防治、生物防治和機械防治等。這些方法各有優點,但人類越來越傾向於利用對人類生存環境無污染的生物防治。生物防治中有些就是利用信息傳遞作用。
❾ 什麼是生物信息學
生物信息學
一, 生物信息學發展簡介
生物信息學是建立在分子生物學的基礎上的,因此,要了解生物信息學,就
必須先對分子生物學的發展有一個簡單的了解.研究生物細胞的生物大分子的結
構與功能很早就已經開始,1866年孟德爾從實驗上提出了假設:基因是以生物
成分存在[1],1871年Miescher從死的白細胞核中分離出脫氧核糖核酸(DNA),
在Avery和McCarty於1944年證明了DNA是生命器官的遺傳物質以前,人們
仍然認為染色體蛋白質攜帶基因,而DNA是一個次要的角色.
1944年Chargaff發現了著名的Chargaff規律,即DNA中鳥嘌呤的量與胞嘧
定的量總是相等,腺嘌呤與胸腺嘧啶的量相等.與此同時,Wilkins與Franklin
用X射線衍射技術測定了DNA纖維的結構.1953年James Watson 和Francis
Crick在Nature雜志上推測出DNA的三維結構(雙螺旋).DNA以磷酸糖鏈形
成發雙股螺旋,脫氧核糖上的鹼基按Chargaff規律構成雙股磷酸糖鏈之間的鹼基
對.這個模型表明DNA具有自身互補的結構,根據鹼基對原則,DNA中貯存的
遺傳信息可以精確地進行復制.他們的理論奠定了分子生物學的基礎.
DNA雙螺旋模型已經預示出了DNA復制的規則,Kornberg於1956年從大
腸桿菌(E.coli)中分離出DNA聚合酶I(DNA polymerase I),能使4種dNTP連接
成DNA.DNA的復制需要一個DNA作為模板.Meselson與Stahl(1958)用實驗
方法證明了DNA復制是一種半保留復制.Crick於1954年提出了遺傳信息傳遞
的規律,DNA是合成RNA的模板,RNA又是合成蛋白質的模板,稱之為中心
法則(Central dogma),這一中心法則對以後分子生物學和生物信息學的發展都起
到了極其重要的指導作用.
經過Nirenberg和Matthai(1963)的努力研究,編碼20氨基酸的遺傳密碼
得到了破譯.限制性內切酶的發現和重組DNA的克隆(clone)奠定了基因工程
的技術基礎.
正是由於分子生物學的研究對生命科學的發展有巨大的推動作用,生物信息
學的出現也就成了一種必然.
2001年2月,人類基因組工程測序的完成,使生物信息學走向了一個高潮.
由於DNA自動測序技術的快速發展,DNA資料庫中的核酸序列公共數據量以每
天106bp速度增長,生物信息迅速地膨脹成數據的海洋.毫無疑問,我們正從一
個積累數據向解釋數據的時代轉變,數據量的巨大積累往往蘊含著潛在突破性發
現的可能,"生物信息學"正是從這一前提產生的交叉學科.粗略地說,該領域
的核心內容是研究如何通過對DNA序列的統計計算分析,更加深入地理解DNA
序列,結構,演化及其與生物功能之間的關系,其研究課題涉及到分子生物學,
分子演化及結構生物學,統計學及計算機科學等許多領域.
生物信息學是內涵非常豐富的學科,其核心是基因組信息學,包括基因組信
息的獲取,處理,存儲,分配和解釋.基因組信息學的關鍵是"讀懂"基因組的核
苷酸順序,即全部基因在染色體上的確切位置以及各DNA片段的功能;同時在
發現了新基因信息之後進行蛋白質空間結構模擬和預測,然後依據特定蛋白質的
功能進行葯物設計[2].了解基因表達的調控機理也是生物信息學的重要內容,根
據生物分子在基因調控中的作用,描述人類疾病的診斷,治療內在規律.它的研
究目標是揭示"基因組信息結構的復雜性及遺傳語言的根本規律",解釋生命的遺
傳語言.生物信息學已成為整個生命科學發展的重要組成部分,成為生命科學研
究的前沿.
二, 生物信息學的主要研究方向
生物信息學在短短十幾年間,已經形成了多個研究方向,以下簡要介紹一些
主要的研究重點.
1,序列比對(Sequence Alignment)
序列比對的基本問題是比較兩個或兩個以上符號序列的相似性或不相似
性.從生物學的初衷來看,這一問題包含了以下幾個意義[3]:
從相互重疊的序列片斷中重構DNA的完整序列.
在各種試驗條件下從探測數據(probe data)中決定物理和基因圖
存貯,遍歷和比較資料庫中的DNA序列
比較兩個或多個序列的相似性
在資料庫中搜索相關序列和子序列
尋找核苷酸(nucleotides)的連續產生模式
找出蛋白質和DNA序列中的信息成分
序列比對考慮了DNA序列的生物學特性,如序列局部發生的插入,刪除(前
兩種簡稱為indel)和替代,序列的目標函數獲得序列之間突變集最小距離加權
和或最大相似性和,對齊的方法包括全局對齊,局部對齊,代溝懲罰等.兩個
序列比對常採用動態規劃演算法,這種演算法在序列長度較小時適用,然而對於海
量基因序列(如人的DNA序列高達109bp),這一方法就不太適用,甚至採用算
法復雜性為線性的也難以奏效.因此,啟發式方法的引入勢在必然,著名的
BALST和FASTA演算法及相應的改進方法均是從此前提出發的.
2, 蛋白質結構比對和預測
基本問題是比較兩個或兩個以上蛋白質分子空間結構的相似性或不相似性.
蛋白質的結構與功能是密切相關的,一般認為,具有相似功能的蛋白質結構一般
相似.蛋白質是由氨基酸組成的長鏈,長度從50到1000~3000AA(Amino Acids),
蛋白質具有多種功能,如酶,物質的存貯和運輸,信號傳遞,抗體等等.氨基酸
的序列內在的決定了蛋白質的3維結構.一般認為,蛋白質有四級不同的結構.
研究蛋白質結構和預測的理由是:醫葯上可以理解生物的功能,尋找docking
drugs的目標,農業上獲得更好的農作物的基因工程,工業上有利用酶的合成.
直接對蛋白質結構進行比對的原因是由於蛋白質的3維結構比其一級結構
在進化中更穩定的保留,同時也包含了較AA序列更多的信息.
蛋白質3維結構研究的前提假設是內在的氨基酸序列與3維結構一一對應
(不一定全真),物理上可用最小能量來解釋.
從觀察和總結已知結構的蛋白質結構規律出發來預測未知蛋白質的結構.同
源建模(homology modeling)和指認(Threading)方法屬於這一范疇.同源建模用
於尋找具有高度相似性的蛋白質結構(超過30%氨基酸相同),後者則用於比較
進化族中不同的蛋白質結構.
然而,蛋白結構預測研究現狀還遠遠不能滿足實際需要.
3, 基因識別,非編碼區分析研究.
基因識別的基本問題是給定基因組序列後,正確識別基因的范圍和在基因組
序列中的精確位置.非編碼區由內含子組成(introns),一般在形成蛋白質後被丟
棄,但從實驗中,如果去除非編碼區,又不能完成基因的復制.顯然,DNA序
列作為一種遺傳語言,既包含在編碼區,又隱含在非編碼序列中.分析非編碼
區DNA序列目前沒有一般性的指導方法.
在人類基因組中,並非所有的序列均被編碼,即是某種蛋白質的模板,已
完成編碼部分僅占人類基因總序列的3~5%,顯然,手工的搜索如此大的基因序
列是難以想像的.
偵測密碼區的方法包括測量密碼區密碼子(codon)的頻率,一階和二階馬爾
可夫鏈,ORF(Open Reading Frames),啟動子(promoter)識別,HMM(Hidden
Markov Model)和GENSCAN,Splice Alignment等等.
4, 分子進化和比較基因組學
分子進化是利用不同物種中同一基因序列的異同來研究生物的進化,構建進
化樹.既可以用DNA序列也可以用其編碼的氨基酸序列來做,甚至於可通過相
關蛋白質的結構比對來研究分子進化,其前提假定是相似種族在基因上具有相似
性.通過比較可以在基因組層面上發現哪些是不同種族中共同的,哪些是不同的.
早期研究方法常採用外在的因素,如大小,膚色,肢體的數量等等作為進化
的依據.近年來較多模式生物基因組測序任務的完成,人們可從整個基因組的角
度來研究分子進化.在匹配不同種族的基因時,一般須處理三種情況:
Orthologous: 不同種族,相同功能的基因
Paralogous: 相同種族,不同功能的基因
Xenologs: 有機體間採用其他方式傳遞的基因,如被病毒注入的基因.
這一領域常採用的方法是構造進化樹,通過基於特徵(即DNA序列或蛋白
質中的氨基酸的鹼基的特定位置)和基於距離(對齊的分數)的方法和一些傳統
的聚類方法(如UPGMA)來實現.
5, 序列重疊群(Contigs)裝配
根據現行的測序技術,每次反應只能測出500 或更多一些鹼基對的序列,
如人類基因的測量就採用了短槍(shortgun)方法,這就要求把大量的較短的序列
全體構成了重疊群(Contigs).逐步把它們拼接起來形成序列更長的重疊群,直
至得到完整序列的過程稱為重疊群裝配.從演算法層次來看,序列的重疊群是一個
NP-完全問題.
6, 遺傳密碼的起源
通常對遺傳密碼的研究認為,密碼子與氨基酸之間的關系是生物進化歷史上
一次偶然的事件而造成的,並被固定在現代生物的共同祖先里,一直延續至今.
不同於這種"凍結"理論,有人曾分別提出過選擇優化,化學和歷史等三種學說
來解釋遺傳密碼.隨著各種生物基因組測序任務的完成,為研究遺傳密碼的起源
和檢驗上述理論的真偽提供了新的素材.
7, 基於結構的葯物設計
人類基因工程的目的之一是要了解人體內約10萬種蛋白質的結構,功能,
相互作用以及與各種人類疾病之間的關系,尋求各種治療和預防方法,包括葯物
治療.基於生物大分子結構及小分子結構的葯物設計是生物信息學中的極為重要
的研究領域.為了抑制某些酶或蛋白質的活性,在已知其蛋白質3級結構的基礎
上,可以利用分子對齊演算法,在計算機上設計抑制劑分子,作為候選葯物.這一
領域目的是發現新的基因葯物,有著巨大的經濟效益.
8, 其他
如基因表達譜分析,代謝網路分析;基因晶元設計和蛋白質組學數據分析等,
逐漸成為生物信息學中新興的重要研究領域;在學科方面,由生物信息學衍生的
學科包括結構基因組學,功能基因組學,比較基因組學,蛋白質學,葯物基因組
學,中葯基因組學,腫瘤基因組學,分子流行病學和環境基因組學.
從現在的發展不難看出,基因工程已經進入了後基因組時代.我們也有應對
與生物信息學密切相關的如機器學習,和數學中可能存在的誤導有一個清楚的認
識.
三, 生物信息學與機器學習
生物信息的大規模給數據挖掘提出了新課題和挑戰,需要新的思想的加入.
常規的計算機演算法仍可以應用於生物數據分析中,但越來越不適用於序列分析問
題.究竟原因,是由於生物系統本質上的模型復雜性及缺乏在分子層上建立的完
備的生命組織理論.
西蒙曾給出學習的定義:學習是系統的變化,這種變化可使系統做相同工作
時更有效[4].機器學習的目的是期望能從數據中自動地獲得相應的理論,通過采
用如推理,模型擬合及從樣本中學習,尤其適用於缺乏一般性的理論,"雜訊"
模式,及大規模數據集.因此,機器學習形成了與常規方法互補的可行的方法.
機器學習使得利用計算機從海量的生物信息中提取有用知識,發現知識成為可能
[5].
機器學習方法在大樣本,多向量的數據分析工作中發揮著日益重要的作用,
而目前大量的基因資料庫處理需要計算機能自動識別,標注,以避免即耗時又花
費巨大的人工處理方法.早期的科學方法—觀測和假設----面對高數據的體積,
快速的數據獲取率和客觀分析的要求---已經不能僅依賴於人的感知來處理了.因
而,生物信息學與機器學習相結合也就成了必然.
機器學習中最基本的理論框架是建立在概率基礎上的,從某種意義來說,是
統計模型擬合的延續,其目的均為提取有用信息.機器學習與模式識別和統計推
理密切相關.學習方法包括數據聚類,神經網路分類器和非線性回歸等等.隱馬
爾可夫模型也廣泛用於預測DNA的基因結構.目前研究重心包括:1)觀測和
探索有趣的現象.目前ML研究的焦點是如何可視化和探索高維向量數據.一般
的方法是將其約簡至低維空間,如常規的主成分分析(PCA),核主成分分析
(KPCA),獨立成分分析(Independent component analysis),局部線性嵌套(Locally
Linear embedding).2)生成假設和形式化模型來解釋現象[6].大多數聚類方法可
看成是擬合向量數據至某種簡單分布的混合.在生物信息學中聚類方法已經用於
microarray數據分析中,癌症類型分類及其他方向中.機器學習也用於從基因數
據庫中獲得相應的現象解釋.
機器學習加速了生物信息學的進展,也帶了相應的問題.機器學習方法大多
假定數據符合某種相對固定的模型,而一般數據結構通常是可變的,在生物信息
學中尤其如此,因此,有必要建立一套不依賴於假定數據結構的一般性方法來尋
找數據集的內在結構.其次,機器學習方法中常採用"黑箱"操作,如神經網路
和隱馬爾可夫模型,對於獲得特定解的內在機理仍不清楚.
四, 生物信息學的數學問題
生物信息學中數學佔了很大的比重.統計學,包括多元統計學,是生物信息
學的數學基礎之一;概率論與隨機過程理論,如近年來興起的隱馬爾科夫鏈模型
(HMM),在生物信息學中有重要應用;其他如用於序列比對的運籌學;蛋白質
空間結構預測和分子對接研究中採用的最優化理論;研究DNA超螺旋結構的拓
撲學;研究遺傳密碼和DNA序列的對稱性方面的群論等等.總之,各種數學理
論或多或少在生物學研究中起到了相應的作用.
但並非所有的數學方法在引入生物信息學中都能普遍成立的,以下以統計學
和度量空間為例來說明.
1, 統計學的悖論
數學的發展是伴隨悖論而發展的.對於進化樹研究和聚類研究中最顯著的悖
論莫過於均值了,如圖1:
圖1 兩組同心圓的數據集
圖1是兩組同心圓構成的數據集,顯然,兩組數據集的均值均在圓點,這也
就說明了要採用常規的均值方法不能將這兩類分開,也表明均值並不能帶來更多
的數據的幾何性質.那麼,如果數據呈現類似的特有分布時,常有的進化樹演算法
和聚類演算法(如K-均值)往往會得錯誤的結論.統計上存在的陷阱往往是由於
對數據的結構缺乏一般性認識而產生的.
2, 度量空間的假設
在生物信息學中,進化樹的確立,基因的聚類等都需要引入度量的概念.舉
例來說,距離上相近或具有相似性的基因等具有相同的功能,在進化樹中滿足分
值最小的具有相同的父系,這一度量空間的前提假設是度量在全局意義下成立.
那麼,是否這種前提假設具有普適性呢
我們不妨給出一般的描述:假定兩個向量為A,B,其中,
,則在假定且滿足維數間線性無關的前提下,兩個
向量的度量可定義為:
(1)
依據上式可以得到滿足正交不變運動群的歐氏度量空間,這也是大多數生物信息
學中常採用的一般性描述,即假定了變數間線性無關.
然而,這種假設一般不能正確描述度量的性質,尤其在高維數據集時,不考
慮數據變數間的非線性相關性顯然存在問題,由此,我們可以認為,一個正確的
度量公式可由下式給出:
(2)
上式中採用了愛因斯坦和式約定,描述了變數間的度量關系.後者在滿足
(3)
時等價於(1),因而是更一般的描述,然而問題在於如何准確描述變數間的非線
性相關性,我們正在研究這個問題.
五, 幾種統計學習理論在生物信息學中應用的困難
生物信息學中面對的數據量和資料庫都是規模很大的,而相對的目標函數卻
一般難以給出明確的定義.生物信息學面臨的這種困難,可以描述成問題規模的
巨大以及問題定義的病態性之間的矛盾,一般從數學上來看,引入某個正則項來
改善性能是必然的[7].以下對基於這一思想產生的統計學習理論[8],Kolmogorov
復雜性[98]和BIC(Bayesian Information Criterion)[109]及其存在的問題給出簡要介
紹.
支持向量機(SVM)是近來較熱門的一種方法,其研究背景是Vapnik的統計
學習理論,是通過最大化兩個數據集的最大間隔來實現分類,對於非線性問題則
採用核函數將數據集映射至高維空間而又無需顯式描述數據集在高維空間的性
質,這一方法較之神經方法的好處在於將神經網路隱層的參數選擇簡化為對核函
數的選擇,因此,受到廣泛的注意.在生物信息學中也開始受到重視,然而,核
函數的選擇問題本身是一個相當困難的問題,從這個層次來看,最優核函數的選
擇可能只是一種理想,SVM也有可能象神經網路一樣只是機器學習研究進程中
又一個大氣泡.
Kolmogorov復雜性思想與統計學習理論思想分別從不同的角度描述了學習
的性質,前者從編碼的角度,後者基於有限樣本來獲得一致收斂性.Kolmogorov
復雜性是不可計算的,因此由此衍生了MDL原則(最小描述長度),其最初只
適用於離散數據,最近已經推廣至連續數據集中,試圖從編碼角度獲得對模型參
數的最小描述.其缺陷在於建模的復雜性過高,導致在大數據集中難以運用.
BIC准則從模型復雜性角度來考慮,BIC准則對模型復雜度較高的給予大的
懲罰,反之,懲罰則小,隱式地體現了奧卡姆剃刀("Occam Razor")原理,近
年也廣泛應用於生物信息學中.BIC准則的主要局限是對參數模型的假定和先驗
的選擇的敏感性,在數據量較大時處理較慢.因此,在這一方面仍然有許多探索
的空間.
六, 討論與總結
人類對基因的認識,從以往的對單個基因的了解,上升到在整個基因組水平
上考察基因的組織結構和信息結構,考察基因之間在位置,結構和功能上的相互
關系.這就要求生物信息學在一些基本的思路上要做本質的觀念轉變,本節就這
些問題做出探討和思索.
啟發式方法:
Simond在人類的認知一書中指出,人在解決問題時,一般並不去尋找最優
的方法,而只要求找到一個滿意的方法.因為即使是解決最簡單的問題,要想得
到次數最少,效能最高的解決方法也是非常困難的.最優方法和滿意方法之間的
困難程度相差很大,後者不依賴於問題的空間,不需要進行全部搜索,而只要能
達到解決的程度就可以了.正如前所述,面對大規模的序列和蛋白質結構數據集,
要獲得全局結果,往往是即使演算法復雜度為線性時也不能夠得到好的結果,因此,
要通過變換解空間或不依賴於問題的解空間獲得滿意解,生物信息學仍需要人工
智能和認知科學對人腦的進一步認識,並從中得到更好的啟發式方法.
問題規模不同的處理:
Marvin Minsky在人工智慧研究中曾指出:小規模數據量的處理向大規模數
據量推廣時,往往並非演算法上的改進能做到的,更多的是要做本質性的變化.這
好比一個人爬樹,每天都可以爬高一些,但要想爬到月球,就必須採用其他方法
一樣.在分子生物學中,傳統的實驗方法已不適應處理飛速增長的海量數據.同
樣,在採用計算機處理上,也並非依靠原有的計算機演算法就能夠解決現有的數據
挖掘問題.如在序列對齊(sequence Alignment)問題上,在小規模數據中可以採用
動態規劃,而在大規模序列對齊時不得不引入啟發式方法,如BALST,FASTA.
樂觀中的隱擾
生物信息學是一門新興學科,起步於20世紀90年代,至今已進入"後基因
組時代",目前在這一領域的研究人員均呈普遍樂觀態度,那麼,是否存在潛在
的隱擾呢
不妨回顧一下早期人工智慧的發展史[11],在1960年左右,西蒙曾相信不出
十年,人類即可象完成登月一樣完成對人的模擬,造出一個與人智能行為完全相
同的機器人.而至今為止,這一諾言仍然遙遙無期.盡管人工智慧研究得到的成
果已經滲入到各個領域,但對人的思維行為的了解遠未完全明了.從本質來看,
這是由於最初人工智慧研究上定位錯誤以及沒有從認識論角度看清人工智慧的
本質造成的;從研究角度來看,將智能行為還原成一般的形式化語言和規則並不
能完整描述人的行為,期望物理科學的成功同樣在人工智慧研究中適用並不現
實.
反觀生物信息學,其目的是期望從基因序列上解開一切生物的基本奧秘,從
結構上獲得生命的生理機制,這從哲學上來看是期望從分子層次上解釋人類的所
有行為和功能和致病原因.這類似於人工智慧早期發展中表現的樂觀行為,也來
自於早期分子生物學,生物物理和生物化學的成就.然而,從本質上來講,與人
工智能研究相似,都是希望將生命的奧秘還原成孤立的基因序列或單個蛋白質的
功能,而很少強調基因序列或蛋白質組作為一個整體在生命體中的調控作用.我
們因此也不得不思考,這種研究的最終結果是否能夠支撐我們對生物信息學的樂
觀呢 現在說肯定的話也許為時尚早.
綜上所述,不難看出,生物信息學並不是一個足以樂觀的領域,究竟原因,
是由於其是基於分子生物學與多種學科交叉而成的新學科,現有的形勢仍表現為
各種學科的簡單堆砌,相互之間的聯系並不是特別的緊密.在處理大規模數據方
面,沒有行之有效的一般性方法;而對於大規模數據內在的生成機制也沒有完全
明了,這使得生物信息學的研究短期內很難有突破性的結果.那麼,要得到真正
的解決,最終不能從計算機科學得到,真正地解決可能還是得從生物學自身,從
數學上的新思路來獲得本質性的動力.
毫無疑問,正如Dulbecco1986年所說:"人類的DNA序列是人類的真諦,
這個世界上發生的一切事情,都與這一序列息息相關".但要完全破譯這一序列
以及相關的內容,我們還有相當長的路要走.
(來源 ------[InfoBio.org | 生物信息學研討組])http://www.infobio.org
生物信息學(Bioinformatics)是在生命科學的研究中,以計算機為工具對生物信息進行儲存、檢索和分析的科學。它是當今生命科學和自然科學的重大前沿領域之一,同時也將是21世紀自然科學的核心領域之一。其研究重點主要體現在基因組學(Genomics)和蛋白學(Proteomics)兩方面,具體說就是從核酸和蛋白質序列出發,分析序列中表達的結構功能的生物信息。
生物信息學是一門利用計算機技術研究生物系統之規律的學科。
目前的生物信息學基本上只是分子生物學與信息技術(尤其是網際網路技術)的結合體。生物信息學的研究材料和結果就是各種各樣的生物學數據,其研究工具是計算機,研究方法包括對生物學數據的搜索(收集和篩選)、處理(編輯、整理、管理和顯示)及利用(計算、模擬)。
1990年代以來,伴隨著各種基因組測序計劃的展開和分子結構測定技術的突破和Internet的普及,數以百計的生物學資料庫如雨後春筍般迅速出現和成長。對生物信息學工作者提出了嚴峻的挑戰:數以億計的ACGT序列中包涵著什麼信息?基因組中的這些信息怎樣控制有機體的發育?基因組本身又是怎樣進化的?
生物信息學的另一個挑戰是從蛋白質的氨基酸序列預測蛋白質結構。這個難題已困擾理論生物學家達半個多世紀,如今找到問題答案要求正變得日益迫切。諾貝爾獎獲得者W. Gilbert在1991年曾經指出:「傳統生物學解決問題的方式是實驗的。現在,基於全部基因都將知曉,並以電子可操作的方式駐留在資料庫中,新的生物學研究模式的出發點應是理論的。一個科學家將從理論推測出發,然後再回到實驗中去,追蹤或驗證這些理論假設」。
生物信息學的主要研究方向: 基因組學 - 蛋白質組學 - 系統生物學 - 比較基因組學
❿ 什麼是行為信息,什麼是物理信息,什麼是化學信息什麼是營養信息(生物的)
生物學
即生命科學(life science/biology),概括地說,生物是研究生命現象和生命活動規律的科學。作為繼物理、化學之後又一高速發展的學科,正朝著宏觀和微觀兩個方向發展。宏觀觀方面已經發展到全球生態系統的研究;微觀方面則向著分子方向發展。生物學與眾多科學結合形成了種類繁多的邊緣科學,呈輻射狀發展。
生物學從最開始就有2個學派,一個叫博物學派,一個是實驗學派。博物學派以生態學為代表,實驗學派以遺傳學和分子生物學為代表。
目前國內外尚無明確一致的生命科學的定義。特別是對生命科學的范疇,即生命科學包括哪些學科沒有明確一致的說法。但一般認為,生命科學是將生命世界(living world)作為一個整體來研究的一個科學分支,研究活著的生物(living organisms)和生命過程(life processes),包括生物科學(biological science)--即生物學(biology)及其分支即醫葯學、農林牧漁業、人類學、社會學等。生物學的分支有動物學、植物學、微生物學、解剖學、生理學、生物物理學、生物化學、細胞生物學、分子生物學、神經生物學、發育生物學、社會生物學等。生命科學中生物學及其分支是生物科學的基礎科學(basic science)或純科學(pure science),醫葯學和農林牧漁業等是生物科學的應用科學(applied science);很顯然,生物科學屬於自然科學,而人類學和社會學則屬於人文社會科學。所以生命科學的范疇是比較大的,包括了自然科學和社會科學兩大科學領域。但是,我國教育部1998年頒布的新的高等學校本科專業目錄的理工科部分中與上述生命科學自然科學部分有關的專業有生物學、生物學技術、醫學、葯學、農學等等,分別屬於基礎生物科學或應用生物科學范疇。
生物學是研究生物各個層次的種類、結構、功能、行為、發育和起源進化以及生物與周圍環境的關系的科學。人也是生物的一種,也是生物學的研究對象。
20世紀40年代以來,生物學吸收了數學、物理學和化學的成就,逐漸發展成一門精確的、定量的、深入到分子層次的科學。
人們已經認識的生命是物質的一種運動狀態。生命的基本單位是細胞,它是由蛋白質、核酸、脂類等生物大分子組成的物質系統。生命現象就是這一復雜系統中物質、能和信息三個量綜合運動與傳遞的表現。
生命有許多無生命物質所不具備的特性。比如:生命能夠在常溫常壓下合成多種有機化合物;能夠以遠遠超出機器的效率來利用環境中的物質和製造體內的各種物質;能以極高的效率儲存信息和傳遞信息;具有自我調節功能和自我復制能力;以不可逆的方式進行著個體發育和物種的演化等等。揭示生命過程中的機制具有巨大的理論和實踐意義。
生物學的研究對象
地球上現存的生物估計有200萬~450萬種;已經滅絕的種類更多,估計至少也有1500萬種。從北極到南極,從高山到深海,從冰雪覆蓋的凍原到高溫的礦泉,都有生物的存在。它們具有多種多樣的形態結構,它們的生活方式也變化多端。
從生物的基本結構單位——細胞的水平來考察,有的生物還不具備細胞形態;在已經具有細胞形態的生物中,有原核細胞構成的、有由真核細胞構成的;從組織結構看,有單細胞生物、多細胞生物。而多細胞生物又根據組織器官的分化和發展而分為多種類型;從營養方式來看,有光和自養、吸收異養、腐蝕性異養、吞食異養;從生物在生態系統的作用看,有生產者、消費者、分解者等等。
生物學家根據生物的發展歷史、形態結構特徵、營養方式以及它們在生態系統中的作用等,將生物分成若干界。現在比較通行的認識是將地球上的生物界劃分為五界:細菌、藍菌等原核生物是原核生物界;單細胞的真核生物是原生生物界;光和自養的植物界;吸收異養的真菌界;吞食異養的動物界。
病毒是一種非細胞生命形態,它由一個核酸長鏈和蛋白質外殼構成,病毒沒有自己的代謝機構,沒有酶系統。因此病毒離開了宿主細胞,就成了沒有任何生命活動、也不能獨立自我繁殖的化學物質。一旦進入宿主細胞後,它就可以利用細胞中的物質和能量以及復制、轉錄和轉譯的能力,按照它自己的核酸所包含的遺傳信息產生和它一樣的新一代病毒。
病毒基因同其他生物的基因一樣,也可以發生突變和重組,因此也是可以演化的。因為病毒沒有獨立的代謝機構,不能獨立的繁殖,因此被認為是一種不完整的生命形態。近年來發現了比病毒還要簡單的類病毒,它是小的RNA分子,沒有蛋白質外殼,但它可以在動物身上造成疾病。這些不完整的生命形態的存在說明無生命與有生命之間沒有不可逾越的鴻溝。
原核細胞和真核細胞是細胞的兩大基本形態,它們反映了細胞進化的兩個階段。把具有細胞形態的生物劃分原核生物和真核生物,是現代生物學的一大進展。原核細胞的主要特徵是沒有線粒體、質體等模細胞器,染色體只是一個環狀的DNA分子,不含組蛋白及其它蛋白質,沒有核膜。原和生物主要是細菌。
真核細胞是結構更為復雜的細胞。它有線粒體等膜細胞器,有包以雙層膜的細胞核把核內的遺傳物質與細胞質分開。DNA是長鏈分子,獄卒蛋白以及其他蛋白合成染色體。這核細胞可以進行有絲分裂和減數分裂,分裂的結果是復制的染色體均等地分配到子細胞中。原生生物是最原始的真核生物。
植物是以光和自養為主要營養方式的真核生物。典型植物細胞都含有液泡核以纖維素為主要成分的細胞壁。細胞質中由進行光合作用的細胞器—葉綠體。植物的光合作用都是以水為電子供體的,光合自養是植物的主要營養方式,少數的高等植物是寄生的,還有更少數的植物能夠捕捉小昆蟲,進行異養吸收。
植物從單細胞綠藻到被子植物是沿著適應光合作用的的方向發展的。高等植物中發生了植物的根(固定和吸收器官)、莖(支持器官)、葉(光和器官)的分化。葉柄和眾多分支的莖支持片狀的葉向四面展開,以獲得最大的光照和吸收面積,細胞也逐漸分化成專門用於光合作用、輸導和覆蓋等各種組織。大多數植物的通過有性生殖,形成配子體和孢子體世代交替的生活史。植物是生態系統中最主要的生產者,也是地球上氧氣的主要來源。
真菌是以吸收為主要營養方式的真核生物。真菌有細胞壁,細胞壁含有幾丁質,也含有纖維素。幾丁質是一種含氨基葡萄糖的多糖,是昆蟲等動物骨骼的主要成分,植物細胞不含幾丁質。真菌沒有質體和光合色素。真菌的繁殖能力很強,繁殖方式多樣,主要是以無性或有性生殖產生的各種孢子作為繁殖單位。真菌分布非常廣泛,在生態系統中,真菌是重要的分解者。
動物是以吞食為營養方式的真核生物。吞食異養包括捕獲、吞食、消化和吸收等一些列復雜的過程。動物體的結構是沿著適應吞食異養的方向發展的。單細胞動物吞入食物後形成食物泡。食物在食物泡中被消化,然後透過膜而進入細胞質中,細胞質中溶酶體與之融合,就是細胞內消化。
多細胞動物在進化過程中,細胞內消化逐漸為細胞外消化所取代,食物被捕獲後在消化道內由消化腺分泌酶而被消化,消化後的小分子營養物經過消化道吸收,並通過環系循統輸送到身體的各種細胞中。
與此相適應,多細胞動物逐步形成了復雜的排泄系統、外呼吸系統以及復雜的感覺系統、神經系統、內分泌系統和運動系統等。在全部生物中,只有動物的身體構造發展到如此復雜的高級水平。在生態系統中,動物是有機食物的消費者。
在生命發展的早期,生態系統是由生產者和分解者組成的兩環系統。隨著真核生物特別是動物的產生和發展,兩環生態系統發展成有生產者、分解者和消費者所組成的三環系統。出現了今日豐富多彩的生物世界。
從類病毒、病毒到植物、動物,生物擁有眾多特徵鮮明的類型。各種類型之間又有一系列的中間環節,形成連續的譜系。同時由營養方式決定的三大進化方向,在生態系統中呈現出相互作用的空間關系。因而,進化既是時間過程,又是空間發展過程。生物從時間的歷史淵源和空間的生活關繫上都是一個整體。
生物的特徵
生物不僅具有多樣性,而且具有一些共同的特徵和屬性。
組成生物體的生物大分子的結構和功能,在原則上是相同的。比如各種生物的蛋白質的單體都是氨基酸,種類不過20種左右,它們的功能對所有的生物都是相同的;在不同生物體內基本代謝途徑也是相同的等等。這就是生物化學的同一性。同一性深刻的揭示了生物的統一性。
生物具有多層次的結構模式。對於病毒以外的一切生物都是由細胞組成的,細胞是由大量原子和分子所組成的非均質的系統。
從結構上看,細胞是由蛋白質、核酸、脂類、多糖等組成的多分子動態體系;從資訊理論觀點看,細胞是遺傳信息和代謝信息的傳遞系統;從化學觀點看,細胞是由小分子合成的復雜大分子;從熱力學上看,細胞是遠離平衡的開放系統……
除細胞外,生物還有其他結構單位。細胞之下有細胞器、分子、原子,細胞之上有組織、器官、器官系統、個體、生態系統、生物圈等等。生物的各種結構單位,按照復雜程度和逐級結合的關系而排列成一系列的等級,這就是結構層次。較高層次上會出現許多較低層次所沒有的性質和規律。
其他的還有很多,比如生物的有序性和耗散結構、生物的穩定性,生命的連續性,個體發育,生物的進化,生態系統中的相互關系等等。
這些都說明,盡管生物世界存在驚人的多樣性,但所有的生物都有共同的物質基礎,遵循共同的規律。生物就是這樣一個統一而有多樣的物質世界。
和其他學科一樣,生物學依據自己所研究的對象,也有一些基本的研究方法——觀察描述的方法、比較的方法、實驗的方法等等,也都具有自己的特點。對於生物學來說,既需要有精確的實驗分析,又需要從整體和系統的角度來觀察生命,生物學積累了大量關於各種層次生命系統及其組成部分的資料。今天對於生命系統的規律作出定量的理論研究已經提到日程上來,系統論方法將作為新的研究方法而受到人們的重視。
生物學的分支
早期的生物學主要是對自然的觀察和描述,是關於博物學和形態分類的研究。所以生物學最早是按類群劃分學科的,如植物學、動物學、為生物學等。由於生物種類的多樣性,也由於人們對生物學的了解越來越多,學科的劃分也就越來越細,一門學科往往在劃分為若干學科。
按生物類群劃分學科,有利於從各個側面認識某一個自然類群的生物特點和規律性。但無論研究對象是什麼,都不外乎分類、形態、生理、生化、生態、遺傳、進化等等。
生物在地球歷史中有著很長的發展歷史,大約有1500萬種生物已經滅絕,它們的遺骸保存在地層中形成化石。古生物學專門通過化石研究歷史上的生物;
生物的類群是如此的繁多,需要一個專門的學科來研究類群的劃分,就產生了分類學;
形態學是生物學中研究動植物的形態結構的學科;隨著顯微鏡的使用,形態學又深入到超微結構的領域,組織學和細胞學也就相應的建立起來了;
生理學是研究生物機能的學科,生理學的研究方法是以實驗為主;
遺傳學是研究生物性狀的遺傳和變異,闡明其規律的學科;
胚胎學是研究生物個體發育的學科;
生態學是研究生物與生物之間以及生物與環境之間的關系的學科。研究范圍包括個體、種群、群落、生態系統以及生物圈等層次。揭示生態系統中食物鏈、生產力、能量流動和物質循環的有關規律;
生物化學是研究生命物質的化學組成和生物體各種化學過程的學科,是進入20世紀以後迅速發展起來的一門學科。生物化學的成就提高了人們對生命本質的認識。生物化學側重於生命的化學過程、參與這一過程的物質、產品以及酶的作用機制的研究。分子生物學是從研究生物大分子的結構發展起來的,現在更多的仍是研究生物大分子的結構與功能的關系、以及基因的表達、調控等方面的機制;
生物物理學是用物理薛的概念和方法研究生物的結構、生命活動的物理和物理化學過程的學科。早期生物物理學的研究是從生物發光、生物電等問題開始的。隨著生物學、物理學的發展,新概念的產生和介入,生物物理的研究范圍和水平不斷加深加寬。產生了量子生物學、生物大分子晶體結構以及生物控制論等小分支;
生物數學是數學和生物學結合的產物,它的任務是研究生命過程中的數學規律。
生物界是一個多層次的復雜系統,為了揭示某一層次的規律以及和其他層次的關系,出現了按層次劃分的學科並且越來越受人們的重視。比如:分子生物學、細胞生物學、個體生物學、種群生物學等等。
總之,生物學中一些新的學科在不斷的分化出來,另一些學科又在走向融合。生物學分可的這種局面,反映了生物學極其豐富的內容,也反映了生物學蓬勃發展的景象。
研究生物學的意義
生物與人類生活的許多方面都有著非常密切的關系。生物學作為一門基礎科學,傳統上一直是農業和醫學的基礎,涉及種植業、畜牧業、養殖業、醫療、制葯、衛生等等。隨著生物學理論與方法的不斷進步,它的應用領域也在不斷擴大。現在,生物學的影響已經擴展到食品、化工、環境保護、能源、冶金等方面。如果考慮仿生學的因素,它還影響到了機械、電子技術、信息技術等等諸多領域的發展。
生物學分支學科
植物學、孢粉學、動物學、微生物學、細胞生物學、分子生物學、生物分類學、習性學、生理學、細菌學、微生物生理學、微生物遺傳學、土壤微生物學、細胞學、細胞化學、細胞遺傳學、免疫學、胚胎學、優生學、悉生生物學、遺傳學、分子遺傳學、生態學、仿生學、生物物理學、生物力學、生物力能學、生物聲學、生物化學、生物數學