⑴ 如何學習生物信息學
生物信息學專業好嗎
還不錯,但是不好就業
生物信息學(Bioinformatics)是在生命科學的研究中,以計算機為工具對生物信息進行儲存、檢索和分析的科學。它是當今生命科學和自然科學的重大前沿領域之一,同時也將是21世紀自然科學的核心領域之一。其研究重點主要體現在基因組學(Genomics)和蛋白質組學(Proteomics)兩方面,具體說就是從核酸和蛋白質序列出發,分析序列中表達的結構功能的生物信息。
⑵ 如何自學生物信息學
無論自學什麼,都要從一本最基礎的,比較權威的教材入手,要是沒有教材的話,先從一些大牛的文獻綜述開始了解,再從碩士博士論文一步步深入,還有就是看看網上有沒有課程,比如愛課程,還可以去網盤搜搜試試看。望採納
⑶ 自學生物信息學真的有效嗎
從工科轉到生物信息學來,講一下自己的經歷。首先得了解生物信息學做什麼。推薦一本入門的書:《探索基因組學、蛋白質組學和生物信息學》,這本書基本上把現在用到的生物信息的基本技術講了一遍。然後是學會如何應用現有的工具。現在有很多已經寫好的工具,只要會看幫助文檔,對於解決手頭的工作是提供了相當大的幫助。學習一門語言python,perl,R,都可以,只要能夠幫自己解決問題就好。因為你是生物學出身,所以能夠理解工具背後的含義。對於像我一樣從工科轉到生物信息方向的,需要好好了解生物學的意義。有助於更好的完成工作。國內的相關論壇確實不多,相應的幫助可以去查看工具和資料庫的文獻。
⑷ 如何從零開始學習生物基因類相關學科
生物技術是現代生物學發展及其與相關學科交差融和的產物,其核心是以DNA重組技術為中心的基因工程,還包括微生物工程、生化工程、細胞工程及生物製品等領域。培養掌握現代生物學和生物技術的基本理論、基本知識和基本技能,獲得應用基礎研究和科技開發研究的初步訓練,具有良好的科學素質、較強的創新意識和實踐能力的生物技術高級專門人才。
課程主要包括生物化學、植物生物學、動物生物學、微生物學、遺傳學、細胞生物學、分子
生物學、生化技術、免疫學技術、基因工程細胞工程、發酵工程、蛋白質化學及研究技術、
葯用植物化學、生化葯物以及數、理、化、計算機應用等必修和選修課。生物技術專業就業
前景之培養目標本專業培養具備生命科學的基本理論和較系統的生物技術的基本理論、基礎知識、基本技能,能在科研機構或高等學校從事科學研究或教學工作,能在工業、醫葯、食品、農、林、牧、漁、環保、園林等行業的企業、事業和行政管理部門從事與生物技術有關的應用研究、技術開發、生產管理和行政管理等工作的高級專門人才。
⑸ 想自學生物信息學,不知道怎麼開始,有沒有什麼好的推薦
想學習生物信息學可以首先購買相應的書籍,其次可以關注慕課或者是一些其他的網站,上面有很多免費的一些課程可以自己看。
⑹ 如何自學生物信息學
本人自大三就開始做生物信息,現在即將讀博士,希望我的經驗可以幫助到你。
既然你是想做生物信息學,那麼相關背景什麼的會了解一些,我在這就不多說了。
首先,確定你自己的背景專業,現在很多學校本科都沒有專門的生物信息學專業,都是掛靠在生命學院或者計算機學院的。所以背景專業一般都是生物學或計算機學,不同的專業將來做生信區別會很大。當然,做什麼方向和背景專業並沒有絕對關系。
如果是生物學背景,那麼將來大部分的工作將會是使用專門的生物信息學分析軟體。所以難度會降低。自學的話,主要學幾下幾點就好:
1、一門腳本語言,個人推薦Python(Perl也可以,各有利弊,Python更新興一些)。
2、Linux系統。這個也不是百分百要求,但是專業的生信人,都是用Linux的,而且很多軟體都是不支持Windows的。
3、常用的生物信息學資料庫,這里列出幾個,NCBI,Ensembl,EBI,GENEbank等等,這些資料庫下面還分子資料庫,像GEO,GWAS catalog等。當然,還有方向更細的,像miRBase(miRNA資料庫)等。
4、R,這也是一種編程語言,但更加側重結果的展示,實際上也就是畫圖。
5、常用生信分析軟體,這個沒必要專門去學,需要用到他們的時候再學也不晚,都是很簡單的東西。
如果是計算機背景,那麼以後的工作可能主要是演算法分析,創造新的生信分析軟體,做資料庫等。需要自學的就是以上的那些,再加一門工程語言,C,C++,C#,Java都可以。
⑺ 如何系統的學習生物信息學
生物信息學,是一門綜合學科。涉及到數學,生物學和計算機的內容。但在我看來,計算機的基礎需要,但要求不是很高,關鍵是要有很好的生物學知識,包括遺傳學的、生物化學的、發育生物學的、分子生物學的、植物生理學的知識等等,也就說需要達到這樣的一個要求:在進行數據分析時,能對各種分析結果進行生物學的評價,並給出最優的分析策略。同時也應該有純熟的數理基礎,包括統計學的、拓撲學的,這樣才能把待分析的問題轉換成可計算的模型,最後能給出實現的程序。
從個人來說,因為生物信息學是一個非常大的領域,所以,關鍵是要確定自己的研究方向。比如,以關聯分析為方向的生物信息學,那麼就要掌握好各種關聯分析的統計分析方法,有很強的數據管理能力,足夠好的序列分析能力(這是進行variation查找和分析的基礎)。
回到6年以前,如果決定在生物信息學上發展,那麼我也許會做下面這些事情:
首先,從最不重要的計算機這個方面來說:
(1)要掌握好bash等腳本語言,一般的linux問題都能很好的解決
(2)熟練使用apache,mysql等基礎軟體工具,用joomla等CMS配置搭建網站
(3)應該努力精通perl,bioperl,以基於此的各種分析工具,比如gbrowser,cmap等
(4)足夠好的c/c++語言能力,這是實現新演算法的最高效語言。
(5)應該努力精通R語言,這是進行統計分析的基礎工具
(6)如果有機會,學學erlang這樣一些函數式語言吧
其次,從數學基礎來說,我覺得應該:
(1)學好線性代數
(2)學好高等數學,或者數學分析
(3)學好統計學
(4)學好離散數學
(5)學好計算機演算法和數據結構
其次,從生物學來說:
(1)如果沒有進化論的基層,請把進化論學好
(2)學好發育生物學,植物生理學
(3)學好基因組學、遺傳學等
千萬不要認為這些沒有什麼用,當你在數據分析,怎麼判斷結果的合理性,或者對結果進行解釋時候,都離不開這些生物學問題。最後,你對這些問題的理解成度,決定了你的生物信息學水平:只是一個有生物學知識的、會進行計算機操作的技術員,還是一個能給出解決方案的有良好計算機基礎的能把握生物學問題的生物信息學家。
最後,從生物信息學的角度來說:
(1)對NCBI等各大資料庫非常熟悉
(2)對各種生物學信息學的分析方法和策略非常的清楚,至少應該知道有那些工具軟體,以及這些工具軟體的原理和基於的生物學基礎,包括:基因組學分析,表達譜分析,代謝組分析、調控網路分析、數據結果的整合展示等
最後,生物信息學是一個發展很快的學科,但因起涉及的內容比較多,因此,要想到底一定的要求,是需要付出巨大的努力的。此外,在進行生物信息學學習的過程中,對自己感興趣的方法工具,一定要把文獻上的數據拿來,自己獨立分析一遍,自己去體會分析的過程,從而對這些方法和工具有更深入的理解。
⑻ 如何學好生物信息學
我碩士讀的是細胞生物學,今年4月開始在boss要求下自學perl,打聽了下,<learning perl>這本書不錯,就買來開始看,等5月份去北京參加公司的培訓班時,<learning perl>讀了一遍,<intermediate perl>看了一部分。培訓回來,我們的項目就開始做了,9月拿到所有原始數據和分析結果。然後,我對照著公司的分析報告,試著自己走一邊分析流程,中間遇到問題,自己解決不了的,就發郵件求助。有幾點需要注意:1. 我能理解你想早些玩兒數據的願望,但是在這之前,最好要有一個outline.需要知道數據從哪兒來的,怎麼產生的?其實就是測序儀的工作原理。然後是數據質量檢驗,為什麼需要數據過濾?接著是reads拼接和組裝。總之,要對整個流程有一個認識,而後在學習的過程中,再不斷回頭對比這個流程,這樣才不會有迷失的感覺。2. 有了基礎知識的鋪墊,就可以嘗試著自己做些練習了,paper上面都會給出他們的數據、原碼地址,可以找來自己試試,先看看自己能不能做出一樣的效果。當然,這時要是你手裡正好有項目,那就更好了。3. 學生物信息,paper肯定是要跟蹤的。覆蓋生物信息有趣的論文, 演算法,以及生物科學問題。這個網站還匯集了很多生物信息領域科學家的博客。再如BGI的主程羅瑞邦, SAMtools、BWA的作者Heng Li都有在這里出現。[RNA-Seq Blog](RNA-Seq Blog) 推薦新的論文、工作、培訓課程、大型會議等。如果你是生物背景的,那麼計算機方面的知識需要補一下:需要能在linux環境下舒服的工作。比如從源碼編譯安裝軟體PATH配置,再比如舒服地使用google找到問題的答案。學會使用python/perl。比如有的時候運行一個軟體老是報錯,可能就是因為在一個包含幾十萬行的文本文件里,有隨機的那麼幾千行的末個位置,多一個冒號, 這時候你知道需要怎麼做了? 學會R。要從一大堆基因裡面找出表達水平變化的基因來,需要統計分析和顯著檢驗;而要把我們的數據更直觀地展示出來,最好的方式就是圖形了吧。這兩個需要,R都能滿足。當然matlab也是可以的,區別在於R是開源工具。具備了上述技能,那麼常用的軟體就能用起來了。隨著學習的深入,可能你的問題別人也沒遇到過,這時候就需要自己動手,要麼修改現成的工具,要麼自己做一個出來。這時候,除了python/perl,或許還可以學C/C++/java,或許需要研究下比如BWT、De Bruijn Graph背後的原理。
⑼ 生物信息學入門需要具備什麼能力
1.編程
Linux:會用Editor(e.g. VIM) 和 Shell Script (e.g. bash);推薦《鳥哥的Linux私房菜-基礎學習篇》
Python/Perl:《Python編程入門(第3版)》,Perl推薦小駱駝
R/MATLAB:《R語言實戰(R in action)》
如果做資料庫或者server,推薦再學PHP,MySQL,JavaScript
2.課程
Bioinformatics: 生物信息導論和方法(北大高歌老師的課程,講解邏輯清晰,由淺入深),MOOC。
因為生信有好多分支,如對基因組、蛋白質組學數據分析並給出生物學解釋;在研究演算法方面,如利用機器學習的各種原理來解決生物學問題(對基因序列原件的注釋,如對TSS,splicing sites,promoters,enhancers,positioned nucleosomes等功能區域的注釋;通過對RNA-seq,microarray,ChIP-seq等數據的分析,區分不同的疾病類型或疾病的分子標志物(biomarkers);對基因功能的注釋,如Gene Ontology term;以及基因間互作調控網路的分析);比如運用統計學知識改進已有的生信軟體的演算法,等等。可以根據將來要做什麼繼續補充知識,比如看一下斯坦福大學的Andrew Ng在coursera的機器課程呀 ,看一下統計學原理呀之類的。
3.文獻和實戰練習
如果是做基因組學的生信公司
3.1 RNA數據分析流程
RNA-seq:可以重復一下文章中的分析Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks當然入門之後可以更多了解相關軟體啦,比如STAR,feature counts, Gfold, EdgeR, DESeq2,
DESeq等。
找lncRNA:Recurrently deregulated lncRNAs in hepatocellular carcinoma. 這篇文章中有如何找新lncRNA的流程,可以根據文章提供的方法重復一下。
3.2 DNA數據分析流程
GATK那一套流程檢測
同時variant與疾病、eQTL等關聯分析的話,可以了解一下STATA
3.3
結合機器學習和基因組學的話,可以看一下以下文獻:
DeepVariant:由谷歌Deep mind公司研發,利用卷積神經網路(convolutional neural network, CNN)檢測基因組上單鹼基突變(SNP)和小的插入缺失(Indel),比現有的GATK軟體有更高的精確度。
DeepWAS:根據功能單元選擇出一組SNP的集合,與現有的基因組關聯分析(GWAS)檢測基因組上一個SNP與疾病的關系相比,DeepWAS能夠更綜合地分析致病基因突變,在尋找調控區域的基因突變也更為直接。
DeepSEA:預測人類基因組非編碼區有功能的變異。
DeepBind:預測DNA,RNA結合蛋白的序列特徵,並能識別有害的基因突變。
DeepCpG:在表觀遺傳學層面上,應用深度神經網路演算法,研發了通過單細胞測序的DNA序列和不完整的甲基化修飾數據的,用來預測細胞細胞層面是否會發生甲基化,其效果優於現有軟體。
⑽ 如何自學生物信息學
一、計算機基礎,需要看三本書,一步步的學會學通,不需要刻意去找哪個書,一般linux是鳥哥私房菜,perl是小駱駝咯,R是R in action,但是看一本書只能入門,真正想成為菜鳥,必須每個要看五本書以上!我雲盤裡面有這基本上的高清列印版,大家可以去淘寶列印一下才幾十塊錢還包郵,對書比較講究的也可以買正版,也不過是一百多塊錢而已!
二、生信基礎知識,測序方面,在網路文庫找十幾篇一代二代三代測序儀資料仔細研讀,然後去優酷下載各大主流測序儀的動畫講解,再看看陳巍學基因的講解;資料庫先看看三大主流資料庫——NCBI,ENSEMBL,UCSC,還有一些也可以了解一些(uniprot,IMGT,KEGG,OMIN,TIGR,GO)同樣也是網路文庫自己搜索資料,但是這次需要自己去官網一個個頁面點擊看,一個個翻譯成中文理解吃透;數據格式講起了就多了,這個主要是在項目流程中慢慢學,或者你有機會去上課,不然你看來也是立馬忘記的,主要有sam,vcf,fasta,fastq,bed,gtf,gff,genbank,ensembl,psl等。
三、生信研究領域,各個領域主要是軟體繁多,合起來常用的估計有上百個軟體了,一般只有從業五六年以上的人才有可能把它們全部用過一遍,而且這也完全需要項目來訓練,而不能僅僅是看看軟體手冊,但是研究領域最重要的是背後的原理,需要看各大牛的綜述。
a) 生信基礎軟體(blast++套件,fastqc,flash,blast,solexaQA,NGS-QC-toolkit,SRA-toolkit,fastx-toolkit)。
b) snp-calling相關軟體(bwa,bowtie,samtools,GATK,VarScan.jar,annovar)。
c) 基因組相關軟體(velvet,SOAPdenovo2,repeatmasker,repeatscount,piler,orthMCL,inparanoid,clustw,muscle,MAFFT,quickparanoid,blast2go,RAxML,phyML)。
d) 轉錄組相關軟體(trinity,tophat,cufflinks,RseQC,RNAseq,GOseq,MISO,RSEM,khmer,screed,trimmomatic,transDecoder,vast-tools,picard-tools,htseq,cuffdiff,edgeR,DEseq,funnet,davidgo,wego,kobas,KEGG,Amigo,go)。
四、生信應用領域,講這一塊其實已經脫離了生信菜鳥的解釋范圍了,主要是想說社會上為什麼需要搞生信的人才,全是因為在腫瘤篩查,產前診斷,流行病學,個性化醫療等領域有所應用,可以造福人類!這方面政策不確定,產業不定型,所以也這絕對是藍海,但是也絕對不會有現成的資料直接培訓人才,我們必須關注各種微信公眾號,逛各種測序,醫學相關論壇,緊跟業界精英的腳本,同時追著大牛的文獻閱讀,如此這般才能保住菜鳥的身份!