⑴ 網上的生物信息學資源都有哪些
有很多,你要是做生物信息學需要三個方面的資源
1,數據,網上現在的資料庫很多,最常用的是NCBI,TCGA,千人基因組等,要是想找特定的數據,有tRNA資料庫,PDB,NDB等,每個資料庫的側重點都不相同,但是以NCBI最全面,最准確。
2,演算法,也可以說是分析方法,網上也有很多的在線分析軟體以及能下載的軟體,建議你看看《生物信息學分析與實踐》這本書,綠色封皮的,書名大概是這個,我的這本書沒找到。裡面有各種網上軟體的尋找和使用方法。
3,文獻,當你了解了生物信息的基礎知識之後,就可以看論文了,看論文的時候,盡量看近幾年的高質量論文,比如bioinformatics等雜志的論文就很不錯,建議看看。
我沒有給你附上網站的地址,一是因為資料太多,根本說不完,二是盡量自己尋找,以後就知道怎麼做了,如果你不知道怎麼找的話,就去小木蟲上搜一下生物信息學,會有很多相關的較好的方法和建議。
⑵ 學習生物信息學有哪些比較好的網站或論壇
生信菜鳥團上大學之後,我上網找資料時發現的第一個博客就是生信菜鳥團,裡麵包羅萬象,涵蓋很多方面(初次發現時,就感覺自己進入了新的天地)rabbit gao's blog 我超喜歡這個師兄的博客裡面的筆記,很直觀,尤其是python那部分。他是以代碼的形式展示內容。沈夢圓博客夢圓師姐,和我一樣喜歡用熊貓頭像,她的博客也是剛剛建立不長時間。師姐的文筆很贊,看裡面博文相信對你有幫助的。生信日誌|鳴一道鳴一道師兄的博客我比較喜歡的是R做圖那一塊plob這個我比較少看,不過內容也不錯,我後續再寫上這個博客的描述。陳連福博客聽說連福老師有開培訓班,實力自然也不差。糗世界←歡迎來到糗糗的世界糗世界主要包括:序列比對與NGS R/bioconctorcircos教程,其中糗世界關於R和bioconctor以及NGS的歸納總結特別詳盡生信客部落生信客部落是我自己的博客,剛建不久(2016.9.3建的),我目前在准備考研,打理的時間不多。但相信是一隻潛力股,有提升的空間。也歡迎博友們交換 "友情鏈接".hope博客 hope 他(她)有一篇關於生物信息學在線工具的總結,我特別喜歡科研動力「endnote使用寶典」,專注寫endnote相關的內容。(註:endnote 是文獻管理的軟體,插入引用文獻的神器)biochen生物伯臣生物里也蠻多歸納整理的Bob's Blog bob這位兄弟的博客我接觸不多,我後續補上描述.論壇(包括生信論壇和其他一些相關的網站):生信技能樹生信技能樹前面那個師兄有詳細描述過。我也親眼見證了它從無到有的過程,看著生信技能樹感覺特別親切,感覺就像自家的孩子一樣。我自己由於准備考研和書寫畢業論文的事情,在生信技能樹建設的參與度不高。總之,好喜歡......生物信息學天空內容超全的一個生信論壇丁香園(生信板塊)丁香園,就不解釋了,一個國內最成功的論壇之一。醫學生基本都知道的一個論壇。小木蟲小木蟲,裡面蠻多資源的,也是國內最成功的論壇之一生物統計家園描述待輸入...基因堂描述待輸入biostars這是一個生信問答網站生信刷題網站ROSALIND | About 這個是一個生物信息的刷題網站,超多實戰題(純英文,既提高英語水平,又訓練了自己的實戰能力,何樂而不為)。實戰走起......生物信息學在線工具網站生信客部落生物信息工具整合(包含在線工具與離線工具)–更新中這裡麵包含了一些生物信息學可視化工具,包含在線的工具和一些離線的可視化工具,由於目前個人水平有限,所以還有待繼續完善
⑶ 網上的生物信息學資源都有哪些
生物信息資源簡介
生物信息(bioinformatics)中的「信息(-informatics)」指的是從海量的數據中進行挖掘,從而得到知識的過程,如下圖所示。在這個過程中,會涉及到數據的管理,數據的運算,數據挖掘和建模模擬。其中,數據管理部分主要是資料庫(database),數據的運算部分主要是指各種生物信息的軟體(software tools)。這兩部分是生物信息研究非常重要的資源,也是生信入門需要了解的基礎知識。下面簡要介紹一下這些資源。(本文根據北京大學生物信息學公開課程視頻整理,圖片來自視頻截圖)
根據不同的特點,可以把這些資源分成不同的類別。比如根據數據性質可以將database分為原始數據(Original data)資料庫和二級數據(Secondary data)資料庫。再比如根據軟體是獨立的工具還是網路伺服器,可以將software tools分為standalone programs和web servers。
根據發布者的類別可以分為centralized resources和indivial resources。比較大的centralized resources主要有NCBI(National Center for Biotechnology Information), EBI(European Bioinformatics Institute)和UCSC(University of California Santa Cruz)Genome Browser。下面將分別介紹這三個最大的資料庫以及其他的生物信息學數據資源。
1.NCBI簡介
NCBI-Genome Database:
存儲了目前絕大多數的被測序出來的基因組,目前有1000+基因組被測序出來。
NCBI-Nucleotide/protein (RefSeq):
將不同的版本作了整合之後的參考序列。其中NM_*表示核酸序列,NP_*表示蛋白序列。其中核酸給出了ID號,名稱,物種,特徵,編碼區,序列等信息。蛋白還給出了功能區間信息。
NCBI-Gene:
以基因為單位,整合了pathway、variations、phenotype等信息。
對於Human genes而言,GeneCards比NCBI有更好的對人類基因、蛋白的注釋(表達、相互作用、同源蛋白、功能、遺傳變異等)。
NCBI-SRA
新一代測序技術的短序列database,每5個月數據就會翻倍。
NCBI-Taxonomy
把所有至少有一個基因被測序過的物種做的物種分類樹,在所有被描述過的物種中有10%被測序過。
NCBI-PubMed
用於查閱文獻。
NCBI-MeSH
(Medical Subject Heading)controlled vocabulary used for indexing articles for PubMed 結構化的詞庫。
NCBI-My NCBI
對於感興趣的關鍵詞,在NBCI設定之後,每周會推送相關文獻,對於項目中跟蹤文獻非常有用。
NCBI-BLAST
NCBI最著名的工具,關於BLAST的兩篇文章已經被引用了四萬兩千多次。不同版本的BLAST包括:
Online:NCBI-BLAST
Standalone:BLAST+
Embedded in webpage:wwwblast
2. EBI簡介
EBI中的一些資源如表中所示:
EBI-Ensembl:
介於NCBI和UCSC之間的資源,整合很多物種的不同的資源。Ensembl中數量的類型包括:
EBI-UniProtKB
The Universal Protein Resource (UniProt) is a comprehensive resource for protein sequence and annotation data.
(The UniProt Knowledgebase (UniProtKB) is the central hub for the collection of functional information on proteins, with accurate, consistent and rich annotation. )
UniProtKB -Swiss-Prot(已經過人工校對)
UniProtKB -TrEMBL(無人工校對)
EBI-IntAct
分子之間相互作用
EBI-Clustal Omega
多序列比對
EBI-InterProScan
輸入一個序列,看是否包含目前已經知道功能的蛋白的區域
3 UCSC簡介
以基因組為坐標。包含很多的track,包括:SNP,mRNA,剪切的EST,沒剪切的EST,高通量的,通過Chi
⑷ 微生信免費嗎
免費哪枯。微生信免費。微生信是一個免費在線生物信息陵緩核學數據可視化工具,能做文獻中常見的50多種生信相關矢量圖。微生信是一個在線作圖工具網站,主要包括本站在線工具、其他在線工具以尺掘及其他在線作圖等三大模塊。
⑸ 國際上三個大的生物信息中心有哪些
一 美國國家生物技術信息中心NCBI(National Center for
Biotechnology Information)
NCBI是一個極具人性化的網站,網站的主頁清晰的闡明了NCBI所做的工作及相關領域最新的熱點內容,新聞等。為了方便使用者更加熟練使用網站資源,NCBI在主頁清晰的標注了站點導航,非常便於初學者熟悉和掌握NCBI的站內資源。
另外,NCBI將其網站資源列於主頁左側,其中包括:SITE MAP, About NCBI, GenBank, Literature
databases, Molecular databases, Genomic biology, Tools, Research at
NCBI, Software engineering, Ecation, FTP site, Contact
information等等。
二EBI(European
Bioinformatics Institute)歐洲生物信息研究所The European
Bioinformatics Institute(EBI)是目前國際上幾個重要分子生物信息網站之一,位置座落於英國The Wellcome Trust
Genome Campus。EBI的任務就是確保分子生物與基因體的研究信息可以公開並且免費提供給科學社群,以促進科學進步。
EBI所提供的服務包括建立/維護資料庫、提供分子生物相關信息服務、執行分子生物與計算分子生物研究;所服務的對象與研究人員擴及各產業,包括分子生物、基因體、醫學與農業學術研究、農業、生物技術、化學與制葯工業。
三DDBJ(DNAData Bank of
Japan)日本核酸資料庫
DDBJ(DNA Data Bank of Japan)
設立在日本國家遺傳研究所(NIG),於1986年開始DNA資料庫的構建工作。從一開始,DDBJ就作為國際性DNA資料庫之一,發揮著重要的作用。它
首先反映的是日本國內資料庫的資源,並與NCBI,EBI進行頻繁的國際性合作。DNA序列中蘊含了大量的數據資源,比起其它生物學數據,它在闡述進化方面的作用更為直接。因此,探求DNA資料庫,不僅是在生命科學方面的研究,更是為人類的發展謀福利。
DDBJ是日本唯一的DNA資料庫,它從研究者那裡收集DNA 序列並且給數據提交者一個國際公認的編碼。DDBJ
主要從日本研究者那裡收集數據,當然,它也接受外國研究者的數據並給以編碼。
⑹ 蛋白序列、結構資料庫常用的有哪些
蛋白質資料庫介紹
蛋白質資料庫
1. PIR和PSDPIR國際蛋白質序列資料庫(PSD)是由蛋白質信息資源(PIR)、慕尼黑蛋白質序列信息中心(MIPS)和日本國際蛋白質序列資料庫(JIPID)共同維護的國際上最大的公共蛋白質序列資料庫。這是一個全面的、經過注釋的、非冗餘的蛋白質序列資料庫,包含超過142,000條蛋白質序列(至99年9月),其中包括來自幾十個完整基因組的蛋白質序列。所有序列數據都經過整理,超過99%的序列已按蛋白質家族分類,一半以上還按蛋白質超家族進行了分類。PSD的注釋中還包括對許多序列、結構、基因組和文獻資料庫的交叉索引,以及資料庫內部條目之間的索引,這些內部索引幫助用戶在包括復合物、酶-底物相互作用、活化和調控級聯和具有共同特徵的條目之間方便的檢索。每季度都發行一次完整的資料庫,每周可以得到更新部分。
PSD資料庫有幾個輔助資料庫,如基於超家族的非冗餘庫等。PIR提供三類序列搜索服務:基於文本的互動式檢索差鎮;標準的序列相似性搜索,包括BLAST、FASTA等;結合序列相似性、注釋信息和蛋白質家族信息的高級搜索,包括按注釋分類的相似性搜索、結構域搜索GeneFIND等。
PIR和PSD的網址是:http://pir.georgetown.e/。
資料庫下載地址是:ftp://nbrfa.georgetown.e/pir/。
2. SWISS-PROT
SWISS-PROT是經過注釋的蛋白質序列資料庫,由歐洲生物信息學研究所(EBI)維護。資料庫由蛋白質序列條目構成,每個條目包含蛋白質序列、引用文獻碼慶伍信息、分類學信息、注釋等,注釋中包括蛋白質的功能、轉錄後修飾、特殊位點和區域、二級結構、四級結構、與其它序列的相似性、序列殘缺與疾病的關系、序列變異體和沖突等信息。SWISS-PROT中盡可能減少了冗餘序列,並與其它30多個數據建立了交叉引用,其中包括核酸序列庫、蛋白質序列庫和蛋白質結構庫等。
利用序列提取系統(SRS)可以方便地檢索SWISS-PROT和其它EBI的資料庫。
SWISS-PROT只接受直接測序獲得的蛋白質序列,序列提交可以在其Web頁面上完成。
SWISS-PROT的網址是:http://www.ebi.ac.uk/swissprot/。
3. PROSITE
PROSITE資料庫收集了生物學有顯著意義的蛋白質位點和序列模式,並能根據這些位點和模式快速和可靠地鑒別一個未知功能的蛋白質序列應該屬於哪一個蛋白質家族。有的情況下,某個蛋白質與已知功能蛋白質的整體序列相似性很低,但由於功能的需要保留了與功能密切相關的序列模式,這樣就可能通過PROSITE的搜索找到隱含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位點、配體結合位點、與金屬離子結合的殘基、二硫鍵的半胱氨酸、與小分子或其它蛋白質結合的區域等;除了序列模式之外,PROSITE還包括由多序列比對構建的profile,能更敏感地發現序列與profile的相似性。PROSITE的主頁上提供各種相關檢索服務。
PROSITE的網址是:http://www.expasy.ch/prosite/。
4. PDB
蛋白質數據倉庫(PDB)是國際上唯一的生物大分子結構數據檔案庫,由美國Brookhaven國家實驗室建立。PDB收集的數據來源於X光晶體衍射和核磁共振(NMR)的數據,經過整理和確認後存檔而成。目前PDB資料庫的維護由結構遲或生物信息學研究合作組織(RCSB)負責。RCSB的主伺服器和世界各地的鏡像伺服器提供資料庫的檢索和下載服務,以及關於PDB數據文件格式和其它文檔的說明,PDB數據還可以從發行的光碟獲得。使用Rasmol等軟體可以在計算機上按PDB文件顯示生物大分子的三維結構。
RCSB的PDB資料庫網址是:http://www.rcsb.org/pdb/。
5. SCOP
蛋白質結構分類(SCOP)資料庫詳細描述了已知的蛋白質結構之間的關系。分類基於若干層次:家族,描述相近的進化關系;超家族,描述遠源的進化關系;折疊子(fold),描述空間幾何結構的關系;折疊類,所有折疊子被歸於全α、全β、α/β、α+β和多結構域等幾個大類。SCOP還提供一個非冗餘的ASTRAIL序列庫,這個庫通常被用來評估各種序列比對演算法。此外,SCOP還提供一個PDB-ISL中介序列庫,通過與這個庫中序列的兩兩比對,可以找到與未知結構序列遠緣的已知結構序列。
SCOP的網址是:http://scop.mrc-lmb.cam.ac.uk/scop/。
6. COG
蛋白質直系同源簇(COGs)資料庫是對細菌、藻類和真核生物的21個完整基因組的編碼蛋白,根據系統進化關系分類構建而成。COG庫對於預測單個蛋白質的功能和整個新基因組中蛋白質的功能都很有用。利用COGNITOR程序,可以把某個蛋白質與所有COGs中的蛋白質進行比對,並把它歸入適當的COG簇。COG庫提供了對COG分類數據的檢索和查詢,基於Web的COGNITOR服務,系統進化模式的查詢服務等。
COG庫的網址是:http://www.ncbi.nlm.nih.gov/COG。
下載COG庫和COGNITOR程序在:ftp://ncbi.nlm.nih.gov/pub/COG。
⑺ 常用生物信息學在線分析工具匯總(記錄中...)
NCBI主站攜塌: https://www.ncbi.nlm.nih.gov/
擬南芥: https://www.arabidopsis.org/
AmiGO2
STRING
Pham
BLAST: https://blast.ncbi.nlm.nih.gov/Blast.cgi
ProParam: https://us.expasy.org/tools/protparam.html
ProScale:辯悉圓陸蔽 http://expasy.org/cgi-bin/protscale.pl/
TMHMM2.0: http://www.cbs.dtu.dk/services/TMHMM-2.0/
TMPred: http://www.ch.embnet.org/software/TMPRED_form.html
PSORT: http://psort.hgc.jp//
Prosite: http://www.expasy.org/prosite/
ProScan: http://www.ebi.ac.uk/InterProScan/
SMART: http://smart.embl-heidelberg.de/#
MEME: http://meme-suite.org/tools/meme
SOMPA: http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html
SWISS-MODEL: http://swissmodel.expasy.org/
⑻ 在你看來學習生物信息學有哪些比較好的網站或論壇
國外與生物信息學相關的網站有哪些
生物信息學高度依賴於網路。實際上,你需要的幾乎所有資源,都可以從網上下到。你需要關注你研究領域所需要的那些,而不是全部的資源。
我原來常用的:
NCBI:持有INSDC的節點。網站上有核酸、蛋白、基因名、基因組名等等的搜索工具,以及BLAST序列比對搜索工具,PUBMED文獻資料庫,Taxonomy數據,COG蛋白家族庫等等。FTP可以下到它全部的資料庫,BLAST的單機程序,以及各種工具程序。
EBI:和NCBI類似,歐洲搞的對等物。感覺EBI網站比NCBI要清楚簡潔。另外EBI網站整合了更多的工具,比如多序列比對。
Uniprot:全蛋白庫。NCBI和EBI的蛋白庫來源於此。目前包括兩部分:SwissProt是人工校對過的,TrEMBL是自動校對的。
Pfam:蛋白家族庫。可以使用配套的HMMER進行搜索。比BLAST能找到更遠緣的東西,而且找到的東西是結構域。
Rfam:RNA的,類似Pfam。
RDP:16S rRNA庫。除了序列,它還有一個基於K-mer naive Bayesian model的rdp classifier,可以對輸入序列進行物種分類,效率和准確性較直接使用BLAST更高。
GreenGenes:也是16S庫,不過它只收集比較全的序列。它提供了一個16S的標准化比對,並基於這個東西搞了個物種分類工具。
EMBOSS:一個工具包,提供了幾百個進行序列操作的工具。
BioPerl、BioPython:Perl和Python的生物學模塊。
R:類似matlab的語言,有一大堆的生物學包。
SOAP:華大基因搞的高通量測序工具包,有de-novo拼接的,有mapping的,還有一些後續分析的。
bowtie:一個用於序列mapping的軟體。
samtools:用於操縱、分析高通量序列mapping的結果。功能非常靈活,但有點復雜。
fastx toolkit:用來操縱高通量測序序列的工具包。
⑼ 生物信息學常用網站
丁香園,生命經緯,生命科學論壇,生物谷,生物在線,中國開放教育資源協會,生物通,科學網,小木蟲,生物秀,中國學術會改判議在線,中拍殲搭國細胞生物學學襲拿報......這些在網路上搜索,一般第一個就是!
http://..com/question/128332981.html?si=2