⑴ 生物信息學有哪些方面的應用
生物信息學是一門利用計算機技術研究生物系統之規律的學科。
目前的生物信息學基本上只是分子生物學與信息技術(尤其是網際網路技術)的結合體。生物信息學的研究材料和結果就是各種各樣的生物學數據,其研究工具是計算機,研究方法包括對生物學數據的搜索(收集和篩選)、處理(編輯、整理、管理和顯示)及利用(計算、模擬)。
生物信息學的主要研究方向: 基因組學 - 蛋白質組學 - 系統生物學 - 比較基因組學,1989年在美國舉辦生物化學系統論與生物數學的計算機模型國際會議,生物信息學發展到了計算生物學、計算系統生物學的時代。
生物信息學目前主要應用於:
1,序列比對;
2, 蛋白質結構比對和預測;
3, 基因識別,非編碼區分析研究.;
4, 分子進化和比較基因組學;
5, 序列重疊群(Contigs)裝配;
6, 遺傳密碼的起源;
7, 基於結構的葯物設計;
8.生物系統的建模和模擬;
9.生物信息學技術方法的研究;
10, 生物圖像;
如果你有意獻身於科研事業,為人類未來的發展做出自己的貢獻,這門學科還是有很大的發展前景的,如果想畢業找工作,估計會很難
⑵ 生物信息學有哪些方面的應用
1,測序與序列比對(Sequence Alignment)
測序是生物信息學的基礎和主要數據來源,可以是人類數據也可以是其他的數據。序列比對的基本問題是比較兩個或兩個以上符號序列的相似性或不相似性.從生物學的初衷來看,這一問題包含了以下幾個意義:從相互重疊的序列片斷中重構DNA的完整序列.在各種試驗條件下從探測數據(probe data)中決定物理和基因圖存貯,遍歷和比較資料庫中的DNA序列比較兩個或多個序列的相似性在資料庫中搜索相關序列和子序列尋找核苷酸(nucleotides)的連續產生模式找出蛋白質和DNA序列中的信息成分序列比對考慮了DNA序列的生物學特性,如序列局部發生的插入,刪除(前兩種簡稱為indel)和替代,序列的目標函數獲得序列之間突變集最小距離加權和或最大相似性和,對齊的方法包括全局對齊,局部對齊,代溝懲罰等.兩個序列比對常採用動態規劃演算法,這種演算法在序列長度較小時適用,然而對於海量基因序列(如人的DNA序列高達109bp),這一方法就不太適用,甚至採用演算法復雜性為線性的也難以奏效.因此,啟發式方法的引入勢在必然,著名的BALST和FASTA演算法及相應的改進方法均是從此前提出發的.
2, 蛋白質結構比對和預測
基本問題是比較兩個或兩個以上蛋白質分子空間結構的相似性或不相似性.蛋白質的結構與功能是密切相關的,一般認為,具有相似功能的蛋白質結構一般相似.蛋白質是由氨基酸組成的長鏈,長度從50到1000~3000AA(Amino Acids),蛋白質具有多種功能,如酶,物質的存貯和運輸,信號傳遞,抗體等等.氨基酸的序列內在的決定了蛋白質的3維結構.一般認為,蛋白質有四級不同的結構.研究蛋白質結構和預測的理由是:醫葯上可以理解生物的功能,尋找dockingdrugs的目標,農業上獲得更好的農作物的基因工程,工業上有利用酶的合成.直接對蛋白質結構進行比對的原因是由於蛋白質的3維結構比其一級結構在進化中更穩定的保留,同時也包含了較AA序列更多的信息.蛋白質3維結構研究的前提假設是內在的氨基酸序列與3維結構一一對應(不一定全真),物理上可用最小能量來解釋.從觀察和總結已知結構的蛋白質結構規律出發來預測未知蛋白質的結構.同源建模(homology modeling)和指認(Threading)方法屬於這一范疇.同源建模用於尋找具有高度相似性的蛋白質結構(超過30%氨基酸相同),後者則用於比較進化族中不同的蛋白質結構.然而,蛋白結構預測研究現狀還遠遠不能滿足實際需要.
3, 基因識別,非編碼區分析研究.
基因識別的基本問題是給定基因組序列後,正確識別基因的范圍和在基因組序列中的精確位置.非編碼區由內含子組成(introns),一般在形成蛋白質後被丟棄,但從實驗中,如果去除非編碼區,又不能完成基因的復制.顯然,DNA序列作為一種遺傳語言,既包含在編碼區,又隱含在非編碼序列中.分析非編碼區DNA序列目前沒有一般性的指導方法.在人類基因組中,並非所有的序列均被編碼,即是某種蛋白質的模板,已完成編碼部分僅占人類基因總序列的3~5%,顯然,手工的搜索如此大的基因序列是難以想像的.偵測密碼區的方法包括測量密碼區密碼子(codon)的頻率,一階和二階馬爾可夫鏈,ORF(Open Reading Frames),啟動子(promoter)識別,HMM(Hidden Markov Model)和GENSCAN,Splice Alignment等等.
4, 分子進化和比較基因組學
分子進化是利用不同物種中同一基因序列的異同來研究生物的進化,構建進化樹.既可以用DNA序列也可以用其編碼的氨基酸序列來做,甚至於可通過相關蛋白質的結構比對來研究分子進化,其前提假定是相似種族在基因上具有相似性.通過比較可以在基因組層面上發現哪些是不同種族中共同的,哪些是不同的.早期研究方法常採用外在的因素,如大小,膚色,肢體的數量等等作為進化的依據.近年來較多模式生物基因組測序任務的完成,人們可從整個基因組的角度來研究分子進化.在匹配不同種族的基因時,一般須處理三種情況:Orthologous: 不同種族,相同功能的基因;Paralogous: 相同種族,不同功能的基因;Xenologs: 有機體間採用其他方式傳遞的基因,如被病毒注入的基因.這一領域常採用的方法是構造進化樹,通過基於特徵(即DNA序列或蛋白質中的氨基酸的鹼基的特定位置)和基於距離(對齊的分數)的方法和一些傳統的聚類方法(如UPGMA)來實現.
5, 序列重疊群(Contigs)裝配
根據現行的測序技術,每次反應只能測出500 或更多一些鹼基對的序列,如人類基因的測量就採用了短槍(shortgun)方法,這就要求把大量的較短的序列全體構成了重疊群(Contigs).逐步把它們拼接起來形成序列更長的重疊群,直至得到完整序列的過程稱為重疊群裝配.從演算法層次來看,序列的重疊群是一個NP-完全問題.
6, 遺傳密碼的起源
通常對遺傳密碼的研究認為,密碼子與氨基酸之間的關系是生物進化歷史上一次偶然的事件而造成的,並被固定在現代生物的共同祖先里,一直延續至今.不同於這種"凍結"理論,有人曾分別提出過選擇優化,化學和歷史等三種學說來解釋遺傳密碼.隨著各種生物基因組測序任務的完成,為研究遺傳密碼的起源和檢驗上述理論的真偽提供了新的素材.
7, 基於結構的葯物設計
人類基因工程的目的之一是要了解人體內約10萬種蛋白質的結構,功能,相互作用以及與各種人類疾病之間的關系,尋求各種治療和預防方法,包括葯物治療.基於生物大分子結構及小分子結構的葯物設計是生物信息學中的極為重要的研究領域.為了抑制某些酶或蛋白質的活性,在已知其蛋白質3級結構的基礎上,可以利用分子對齊演算法,在計算機上設計抑制劑分子,作為候選葯物.這一領域目的是發現新的基因葯物,有著巨大的經濟效益.
8.生物系統的建模和模擬
隨著大規模實驗技術的發展和數據累積,從全局和系統水平研究和分析生物學系統,揭示其發展規律已經成為後基因組時代的另外一個研究 熱點-系統生物學。目前來看,其研究內容包括生物系統的模擬(Curr Opin Rheumatol,2007,463-70),系統穩定性分析(Nonlinear Dynamics Psychol Life Sci,2007,413-33),系統魯棒性分析(Ernst Schering Res Found Workshop, 2007,69-88)等方面。以SBML(Bioinformatics,2007,1297-8)為代表的建模語言在迅速發展之中,以布爾網路 (PLoS Comput Biol,2007,e163)、微分方程(Mol Biol Cell,2004,3841-62)、隨機過程(Neural Comput,2007,3262-92)、離散動態事件系統等(Bioinformatics,2007,336-43)方法在系統分析中已經得到應 用。很多模型的建立借鑒了電路和其它物理系統建模的方法,很多研究試圖從信息流、熵和能量流等宏觀分析思想來解決系統的復雜性問題(Anal Quant Cytol Histol,2007,296-308)。當然,建立生物系統的理論模型還需要很長時間的努力,現在實驗觀測數據雖然在海量增加,但是生物系統的模型辨 識所需要的數據遠遠超過了目前數據的產出能力。例如,對於時間序列的晶元數據,采樣點的數量還不足以使用傳統的時間序列建模方法,巨大的實驗代價是目前系 統建模主要困難。系統描述和建模方法也需要開創性的發展。
9.生物信息學技術方法的研究
生物信息學不僅僅是生物學知識的簡單整理和、數學、物理學、信息科學等學科知識的簡單應用。海量數據和復雜的背景導致機器學習、統 計數據分析和系統描述等方法需要在生物信息學所面臨的背景之中迅速發展。巨大的計算量、復雜的雜訊模式、海量的時變數據給傳統的統計分析帶來了巨大的困難, 需要像非參數統計(BMC Bioinformatics,2007,339)、聚類分析(Qual Life Res,2007,1655-63)等更加靈活的數據分析技術。高維數據的分析需要偏最小二乘(partial least squares,PLS)等特徵空間的壓縮技術。在計算機演算法的開發中,需要充分考慮演算法的時間和空間復雜度,使用並行計算、網格計算等技術來拓展演算法的 可實現性。
10, 生物圖像
沒有血緣關系的人,為什麼長得那麼像呢?
外貌是像點組成的,像點愈重合兩人長得愈像,那兩個沒有血緣關系的人像點為什麼重合?
有什麼生物學基礎?基因是不是相似?我不知道,希望專家解答。
11, 其他
如基因表達譜分析,代謝網路分析;基因晶元設計和蛋白質組學數據分析等,逐漸成為生物信息學中新興的重要研究領域;在學科方面,由生物信息學衍生的學科包括結構基因組學,功能基因組學,比較基因組學,蛋白質學,葯物基因組學,中葯基因組學,腫瘤基因組學,分子流行病學和環境基因組學,成為系統生物學的重要研究方法.從現在的發展不難看出,基因工程已經進入了後基因組時代.我們也有應對與生物信息學密切相關的如機器學習,和數學中可能存在的誤導有一個清楚的認識.
⑶ 計算機在生物學方面的應用有哪些
計算機所能做的就是大量的繁瑣的運算,只是幫人們解決公式化的問題。比如DNA的破解。倒是生物對計算機有很大幫助,下一代智能化計算機就有向生物計算機方向的發展。
⑷ 信息技術有哪些應用
信息技術主要用於管理和處理信息。它主要是應用計算機科學和通信技術來設計、開發、安裝和實施信息系統及應用軟體。
信息技術的應用包括計算機硬體和軟體,網路和通訊技術,應用軟體開發工具等。計算機和互聯網普及以來,人們日益普遍的使用計算機來生產、處理、交換和傳播各種形式的信息(如書籍、商業文件、報刊、唱片、電影、電視節目、語音、圖形、影像等)。
⑸ 信息技術在日常生活中有哪些應用
電視、電腦、智能手機、電子商務、網上購物、手機里的應用軟體等。
⑹ 生物信息技術的介紹
(1)信息技術為生物技術的發展提供強有力的計算工具。在現代生物技術發展過程中,計算機與高性能的計算技術發揮了巨大的推動作用。在賽萊拉基因研究公司、英國Sanger
中心、美國懷特海德研究院、美國國家衛生研究院和中國科學院遺傳所人類基因組中心聯合繪制的人類基因組草圖的發布中,美國多家研究機構特別強調正是信息技術廠商提供的高性能計算技術使這一切成為可能。同樣,在被稱為「生命科學阿波羅登月計劃」的人類基因草圖的誕生過程中,康柏公司的Alpha伺服器也為研究人員提供了出色的計算動力。業界分析人士稱,在這場激烈的基因解碼競賽背後隱含的是一場超級計算能力的競賽,同時,這次競賽有助於大眾對超級計算機的超強能力形成普遍認知。在此之前,這些造價至少在數百萬美元以上可以超高速運轉的機器一直默默無聞,他們被用於控制核反應堆、預報天氣或是與世界級國際象棋大師同台對弈。如今,人們越來越清醒地認識到,超級計算機在創造新品種的葯物、治癒疾病以及最終使我們能夠修復人類基因缺陷等方面是至關重要的,高性能計算可以為人類作出更大的貢獻。
賽萊拉公司執行總裁在接受《今日美國》的采訪時說:「將人類基因密碼以線型方式組合起來,這還是人類有史以來的第一次。」賽萊拉公司要將32億個鹼基對按照正確順序加以排列,在曾經嘗試過的大規模計算中,這次挑戰是最為嚴峻的一次。為了完成這次歷史性課題所需的數量極為龐大的數據處理工作,賽萊拉公司動用了700台互聯的Alpha64位處理器,運算能力達到每秒1.3萬億次浮點運算。同時,賽萊拉公司還採用了康柏的Storage Works系統,用以完成對一個空間為50TB且以每年IOTB速度增長的資料庫管理工作.康柏電腦公司董事會主席曾在一次演講上說道:「如今,我們很難將生物技術的進步與高性能計算領域的發展割裂開來。實際上,許多一流的科學家都相信,高性能計算是生物和醫葯的未來。今後,越來越多的具有強大功能的計算機和軟體將會被用來搜集、存儲、分析、模擬和發布信息。
信息技術還有助於加強生物技術領域的各種資料庫管理、信息傳遞、檢索和資源共享等。另一個僅次於基因排序器、在生物技術領域引起關注的硬體是基因晶元,它的研製也非常依賴於信息技術。在顯微鏡載片或矽片等基片上把基因片段排列、固定,這就是基因晶元。把這個晶元上的基因片段和檢體的基因片段放到基因晶元讀出器(也是一種破譯裝置)上,就能迅速比較和破譯檢體信息。 基因排序器是從零入手破譯檢體的遺傳信息的裝置,而基因晶元和其讀出器則是與已經有的遺傳信息相對照破譯信息的裝置。 在這個領域,美國的企業比較有名,但日本企業也在同美國企業合作的同時,積極參與這個領域的開發。
(2)生物技術發展需要特定軟體技術的支持。生物技術及其產業的發展對於生物技術類軟體的需求將進一步增加,軟體技術將成為支撐生物技術及其產業發展的關鍵力量之一。在生物技術各領域中均需要相應的專業軟體來支撐:1) 各類生物技術資料庫的構建需要性能優良、更新換代迅速的軟體技術;2) 核酸低級結構分析、引物設計、質粒繪圖、序列分析、蛋白質低級結構分析、生化反應模擬等等也需要相應的軟體及其技術支撐;3) 加強生物安全管理與生物信息安全管理也離不開軟體及其技術發展的支持。
2.生物技術為信息技術發展開辟了新的道路
(1)生物技術推動超級計算機產業的發展。隨著人類基因組計劃各項任務的完成,有關核酸、蛋白質的序列和結構數據呈指數增長。面對如此巨大而復雜的數據,只有運用計算機進行數據管理、控制誤差、加速分析過程,使得人類最終能夠從中受益。然而要完成這些過程,並非一般的計算機力所能及,而需要具有超級計算能力的計算機。因此,生物技術的發展將對信息技術提出更高的需求,從而推動信息產業的發展。比較有說服力的例子是,2002年11月22日出版的《自然》雜志上,以色列科學家宣布研製出一種由DNA分子和酶分子構成的微型「生物計算機」,一萬億個這樣的計算機僅一滴水那樣大,運算速度達到每秒10億次,准確率為99.8%。當然像所有的新技術一樣,有的科學家表示懷疑。他們認為,這種試管里的計算機存在致命的缺陷,因為生化反應本身存在一定的隨機性,這種運算的結果可能不完全精確;而且,參與運算的DNA分子之間不能像傳統計算機一樣通信,只能「各自為戰」,不足以處理一些大型計算。
歐美各國及日本相繼成立了生物信息數據中心,美國有國家生物技術信息中心(NCBI)、英國有歐洲生物信息研究所(ebi)、日本有70餘家制葯、生物及高技術公司組成的「生物產業信息化共同體」等。而戈德曼-薩克斯財團2001年的一份報告顯示,美國國際商用機器公司(IBM)、SUN、康伯和摩托羅拉等公司每家已至少與生物技術公司和調研公司達成12項合作意向,共有140多項合作協議,合作內容涉及到各種技術領域,包括基因晶元,用計算機模擬葯效等。
(2)生物技術將從根本上突破計算機的物理極限。目前使用的計算機是以硅晶元為基礎,由於受到物理空間的限制、面臨耗能和散熱等問題,將不可避免地遭遇發展極限,要取得大的突破,需要依賴於新材料的革新。2000年美國加利福尼亞大學洛杉磯分校的科學家根據生物大分子在不同狀態下可產生有和無信息的特性,研製出分子開關(molecular switches)。2001年世界首台可自動運行的DNA計算機問世,並被評為當年世界十大科技進展。2002年,DNA計算機研究領域的先驅阿德勒曼教授利用簡單的DNA計算機,在實驗中為一個有24個變數、100萬種可能結果的數學難題找到了答案,DNA計算機的研製邁出了重要一步。
信息產業和生物產業無疑都是高科技的產物,在生命科學的研究中,始終不能缺少計算機的工作,如果到基因組測序的研究所去看一看,大量的以超級計算機為基礎的測序儀,會使你誤以為到了一家信息技術公司。生物產業因計算機的加盟而提速,信息技術產業也因生命科學的需要而得以發展、獲利。運用數學、計算機科學和生物學的各種工具,來闡明和理解大量基因組研究獲得數據中所包含的生物學意義,生物學和信息學交叉、結合,從而形成了一個新的學科。生物信息學或信息生物學,它的進步所帶來的效益是不可估量的。美國已經出現了大批基於生物信息學的公司,希冀在基因工程葯物、生物晶元、代謝工程等領域掘出財富,生物信息學工業潛力巨大。可以說,生物科技(生物技術)與信息科技(信息技術)的融合,才是世界經濟市場的未來。在深圳舉行的第三屆中國國際高新技術成果交易會高新技術論壇上,中國工程院副院長侯雲德院士指出,應該把生物技術產業定位為僅次於信息產業的重點產業。他說,信息和生物技術是關繫到我國新世紀經濟發展和國家命運的關鍵技術,並將成為我國創新產業的經濟增長點。
⑺ 生物信息學在醫學領域都有哪些具體應用
基因組測序,基因工程和蛋白質工程中資料庫的構建與運用等等,反正有關數據的都可以
⑻ 生物信息技術有什麼用
信息技術(Information Technology,縮寫IT),是主要用於管理和處理信息所採用的各種技術的總稱。它主要是應用計算機科學和通信技術來設計、開發、安裝和實施信息系統及應用軟體。它也常被稱為信息和通信技術(Information and Communications Technology, ICT)。主要包括感測技術、計算機技術和通信技術。