⑴ 常用的生物信息學軟體包(BLAST,Uniprot,POB,RiceGAAS等)怎麼用,具體操作,結果怎麼看
也太多軟體了吧,相互學習吧,NCBI也不錯
⑵ 生物信息學一些基本的常用軟體有哪些
序列拼接軟體:velvet,SOAPdenvoo,SSAKE,ABySS,Trinity 等
短序列比對軟體: bwa,bowtie,tophat,SOAPAligner 等
局部比對軟體:Blast,blat,CorssMatch 等
多序列全局比對軟體:Muscle,clustalw 等
基因預測軟體:Glimmer,GeneMark,Augustus,FgeneSH,SNAP,GeneScan,EuGENE,Glean等
重復序列預測軟體:RepeatMasker,TRF等
聚類軟體:MCL,hcluster_sg等
統計軟體:pLINK,TASSEL,R,SPSS等
...
⑶ 生物信息學安裝哪個版本的linux
本人自大三就開始做生物信息,現在即將讀博士,希望我的經驗可以幫助到你。
既然你是想做生物信息學,那麼相關背景什麼的會了解一些,我在這就不多說了。
首先,確定你自己的背景專業,現在很多學校本科都沒有專門的生物信息學專業,都是掛靠在生命學院或者計算機學院的。所以背景專業一般都是生物學或計算機學,不同的專業將來做生信區別會很大。當然,做什麼方向和背景專業並沒有絕對關系。
如果是生物學背景,那麼將來大部分的工作將會是使用專門的生物信息學分析軟體。所以難度會降低。自學的話,主要學幾下幾點就好:
1、一門腳本語言,個人推薦Python(Perl也可以,各有利弊,Python更新興一些)。
2、Linux系統。這個也不是百分百要求,但是專業的生信人,都是用Linux的,而且很多軟體都是不支持Windows的。
3、常用的生物信息學資料庫,這里列出幾個,NCBI,Ensembl,EBI,GENEbank等等,這些資料庫下面還分子資料庫,像GEO,GWAS catalog等。當然,還有方向更細的,像miRBase(miRNA資料庫)等。
4、R,這也是一種編程語言,但更加側重結果的展示,實際上也就是畫圖。
5、常用生信分析軟體,這個沒必要專門去學,需要用到他們的時候再學也不晚,都是很簡單的東西。
如果是計算機背景,那麼以後的工作可能主要是演算法分析,創造新的生信分析軟體,做資料庫等。需要自學的就是以上的那些,再加一門工程語言,C,C++,C#,Java都可以。
⑷ 生物信息學常用的軟體有哪些
NCBI(www.ncbi.nlm.nih.gov)-GenBank資料庫
資料庫相似性搜索——核酸序列與核酸資料庫比較(BLASTN)
蛋白質序列與資料庫中蛋白質序列比較(BLASTP)
兩序列比對(Align two sequences)
DNA序列分析——ORF Finder(www.ncbi.nlm.nih.gov/gorf/gorf.html)
分析實驗序列外顯子部分——GENSCAN(http://genes.mit.e/GENSCAN.html)
分析實驗序列的可能酶切位點——NEBcutter2.0 (http://tools.neb.com/NEBcutter2/index.php)
註: Custom digest -- view gel
限制性內切酶資料庫——REBASE(http://rebase.neb.com/rebase/rebase.html)
設計引物擴增實驗序列——Genefisher
Primer 3
蛋白質序列分析及結構預測:
1.預測蛋白質的分子量及等電點:ExPASy(Compute pI/Mw)
2.分析蛋白質的基本物理化學性質:ExPASy(ProtParam)
3.分析蛋白質的親水性和疏水性:ExPASy(ProtScale)
4.分析蛋白質在各種蛋白酶和各種化學試劑處理後的內切產物:ExPASy(PeptideMass) [* :kinase K]
5.分析蛋白質的信號肽:ExPASy(SignalP)
6.預測蛋白質的二級結構:ExPASy(Jpred 3)
多物種分子系統發育分析:EMBL(www.ebi.ac.uk/embl/)--Toolbox--Clustal2W
人脂聯素蛋白質序列:NP_004788
人類胰島素生長因子IB前體:P05019
⑸ 列舉常用的生物信息學資料庫及序列對比常用軟體及特點
一般來說所用的分析工具有在線跟下載的 下面簡要列舉一些常用在線軟體的使用 1、使用VecScreen工具,分析下列未知序列,輸出序列長度、載體序列的區域、可能使用的克隆載體都有哪些。一、步驟:
打開google 首頁,搜索VecScreen,進入VecScreen首頁,復制序列,運行,View report。
二、結果:
輸出序列長度918bp,
載體序列的區域456bp——854bp.
克隆載體:M13mp18 phage,pGEM-13Zf(+),pBR322,pRKW2。
2、使用相應工具,分析下列未知序列的重復序列情況,輸出重復序列的區域、包含的所有重復序列的類型、重復序列的總長度及Masked Sequence。
一、步驟:
進入google首頁,進入ICBI主頁,對序列進行BLAST。得出序列是human的。
進入google首頁,搜索RepeatMasker,進入RepeatMasker主頁,進入RepeatMasking,復制序列,DNA source選擇human,運行!點擊超鏈接,在結果中選擇
Annotation File :RM2sequpload_1287631711.out.html
3、使用CpGPlot/CpGReport/Isochore工具,分析下列未知序列,輸出CpG島的長度、區域、GC數量、所佔的百分比及Obs/Exp值。一、步驟:
進入google首頁,搜索CpGPlot,進入CpGPlot主頁,program中選擇cpgreport復制序列,運行!
二、結果:
CpG島的長度:385bp
區域:48——432;
GC數量:Sum C+G=297,百分數=77.14
Obs/Exp:1.01
4、預測下面序列的啟動子,輸出可能的啟動子序列及相應的位置。一、步驟:
進入google首頁,進入ICBI主頁,對序列進行BLAST。得出序列是human的
進入google首頁,搜索Neural Network Promoter Prediction,進入主頁,復制序列,選擇eukaryote,運行!
二、結果:
位置:711—761 ,1388—1438,1755—1805;
5、運用Splice Site Prediction工具分析下面序列,分別輸出內含子-外顯子剪接位點給體和受體的區域及剪接處位置的鹼基。一、步驟:
進入google首頁,進入ICBI主頁,對序列進行BLAST。得出序列是human的
進入google首頁,搜索Splice Site Prediction,進入主頁,復制序列。Organism選擇Human or other。其他默認,運行!
二、結果:
供體:
受體:
6、對下面序列進行六框翻譯,利用GENESCAN綜合分析(首先確定給定序列的物種來源)哪個ORF是正確的,輸出六框翻譯(抓圖)和GENESCAN結果(包括predicted genes/exons 和 predicted peptide sequence(s) 兩個部分)。一、步驟:
進入google首頁,進入ICBI主頁,對序列進行BLAST。得出序列是Zea的
進入google首頁;搜索NCBI,進入主頁,選擇all resources(A~Z),選擇O,選擇ORF finder。復制序列,默認,運行!
二、結果:ORF圖
三、步驟:進入google首頁,搜索GENESCAN,進入主頁,Organism:Maize, ,其他默認,運行!
四、結果:
G7、進入REBASE限制性內切酶資料庫,輸出AluI、MboI、EcoI三種內酶的Recognition Sequence和Type。
一、步驟:進入google首頁,google in English,搜索REBASE,進入主頁, 分別輸入AluI、MboI、EcoI,運行!
在MboI中選擇第一個,EcoI選擇第二個。
二、結果:
ENSCAN圖
8、使用引物設計工具,針對下列未知序列設計一對引物,要求引物長度為20-25bp,擴增產物長度300-500bp,退火溫度為50-60℃。請寫出選擇的一對引物(Forward Primer and Reverse Primer)、及相應的GC含量、引物的位點、Tm值和產物長度。一、步驟:進入google首頁,搜索genefisher,進入主頁,復制fasta格式,chechk input, sunmit, ; ;設置一下引物長度為20-25bp,擴增產物長度300-500bp,退火溫度為50-60℃; 。
二、結果:
GC含量:
引物的位點:
Tm值:
產物長度:。
9、將下面的序列用NEBcutter 2.0工具分析,用產生平末端及有四個酶切位點的酶進行酶切,並用抓圖提交膠圖(view gel),要求1.4% agarose和Marker為100bp DNA Ladder。
一、步驟:
進入google首頁,進入ICBI主頁,對序列進行BLAST,得知是linear。
進入google首頁,搜索NEBcutter 2.0,進入主頁,選擇linear,運行!選擇custom digest, ,把「1」改為「4」,選擇平末端,後digest。View gel。選擇1.4% agarose和Marker為100bp。
二、結果:
然後就是蛋白質的了一般都在expasy里swiss-prot 適用於檢索的 compute pi/mw 求理論分子量 分子量 protparam物理化學性質 protscale親水性疏水性 peptidemass分析蛋白酶和化學試劑處理後的內切產物
NCBI(www.ncbi.nlm.nih.gov)-GenBank資料庫
資料庫相似性搜索——核酸序列與核酸資料庫比較(BLASTN)
蛋白質序列與資料庫中蛋白質序列比較(BLASTP)
兩序列比對(Align two sequences)
DNA序列分析——ORF Finder(www.ncbi.nlm.nih.gov/gorf/gorf.html)
分析實驗序列外顯子部分——GENSCAN(http://genes.mit.e/GENSCAN.html)
分析實驗序列的可能酶切位點——NEBcutter2.0 (http://tools.neb.com/NEBcutter2/index.php)
註: Custom digest -- view gel
限制性內切酶資料庫——REBASE(http://rebase.neb.com/rebase/rebase.html)
設計引物擴增實驗序列——Genefisher
Primer 3
蛋白質序列分析及結構預測:
1.預測蛋白質的分子量及等電點:ExPASy(Compute pI/Mw)
2.分析蛋白質的基本物理化學性質:ExPASy(ProtParam)
3.分析蛋白質的親水性和疏水性:ExPASy(ProtScale)
4.分析蛋白質在各種蛋白酶和各種化學試劑處理後的內切產物:ExPASy(PeptideMass) [* :kinase K]
5.分析蛋白質的信號肽:ExPASy(SignalP)
6.預測蛋白質的二級結構:ExPASy(Jpred 3)
多物種分子系統發育分析:EMBL(www.ebi.ac.uk/embl/)--Toolbox--Clustal2W
人脂聯素蛋白質序列:NP_004788
人類胰島素生長因子IB前體:P05019
⑹ 網上的生物信息學資源都有哪些
生物信息學高度依賴於網路。實際上,你需要的幾乎所有資源,都可以從網上下到。你需要關注你研究領域所需要的那些,而不是全部的資源。
我原來常用的:
NCBI:持有INSDC的節點。網站上有核酸、蛋白、基因名、基因組名等等的搜索工具,以及BLAST序列比對搜索工具,PUBMED文獻資料庫,Taxonomy數據,COG蛋白家族庫等等。FTP可以下到它全部的資料庫,BLAST的單機程序,以及各種工具程序。
EBI:和NCBI類似,歐洲搞的對等物。感覺EBI網站比NCBI要清楚簡潔。另外EBI網站整合了更多的工具,比如多序列比對。
Uniprot:全蛋白庫。NCBI和EBI的蛋白庫來源於此。目前包括兩部分:SwissProt是人工校對過的,TrEMBL是自動校對的。
Pfam:蛋白家族庫。可以使用配套的HMMER進行搜索。比BLAST能找到更遠緣的東西,而且找到的東西是結構域。
Rfam:RNA的,類似Pfam。
RDP:16S rRNA庫。除了序列,它還有一個基於K-mer naive Bayesian model的rdp classifier,可以對輸入序列進行物種分類,效率和准確性較直接使用BLAST更高。
GreenGenes:也是16S庫,不過它只收集比較全的序列。它提供了一個16S的標准化比對,並基於這個東西搞了個物種分類工具。
EMBOSS:一個工具包,提供了幾百個進行序列操作的工具。
BioPerl、BioPython:Perl和Python的生物學模塊。
R:類似matlab的語言,有一大堆的生物學包。
SOAP:華大基因搞的高通量測序工具包,有de-novo拼接的,有mapping的,還有一些後續分析的。
bowtie:一個用於序列mapping的軟體。
samtools:用於操縱、分析高通量序列mapping的結果。功能非常靈活,但有點復雜。
fastx toolkit:用來操縱高通量測序序列的工具包。
⑺ 用 生物信息學軟體 解決 一個生物學問題
下個mega4.1
去NCBI或者Eztaxon或者www.bacterio.cict.fr或者其他能鏈接到資料庫地方下載一些細菌的16sDNA序列。
然後用mega比對就可以做一個系統樹了。
比如可以做一個假單胞菌屬的系統發育樹,選擇幾個假單胞菌的序列,選擇合適的計算方法,用軟體計算出系統樹。記得還要放一個屬外種作為參考啊。
別指望有多人回答,這里大多都是中學生。
⑻ 請問 生物信息學的常用軟體有哪些啊 能給鏈接最好了 謝謝
這個太多了 我有一本電子書 上面很全 有意的話 聯系我qq
⑼ 生物信息學的分析工作,基因組組裝,轉錄組組裝需要什麼電腦軟體
組學omics,研究的是整體.按照分析目標不同主要分為基因組學,轉錄組學,蛋白質組學,代謝組學.基因組學研究的主要是基因組DNA,使用方法目前以二代測序為主,將基因組拆成小片段後再用生物信息學演算法進行迭代組裝.當然這僅僅是第一步,隨後還有繁瑣的基因注釋等數據分析工作.轉錄組學研究的是某個時間點的mRNA總和,可以用晶元,也可以用測序.晶元是用已知的基因探針,測序則有可能發現新的mRNA,蛋白組學針對的是全體蛋白,組要以2D-Gel和質譜為主,分為top-down和bottom-up分析方法.理念和基因組類似,將蛋白用特定的物料化學手段分解成小肽段,在通過質量反推蛋白序列,最後進行搜索,標識已知未知的蛋白序列.代謝組分析的代謝產物,是大分子和小分子的混合物,主要也是用液相和質譜.總而言之,這些技術都想從全局找變數,都是一種top-down的研究方法,原因很簡單:避免『只緣身在此山中』的尷尬.但因為技術局限,都各有缺點,尤其是轉錄組和蛋白組數據,基本上顛覆了以前一直認為的mRNA水平能代表蛋白水平的觀念,因為這兩組數據的重合度太低.所以目前很多研究都開始使用交叉驗證方法.
⑽ 常用的生物信息學python庫有哪些
常用的生物信息學python庫:
Tkinter
Python默認的圖形界面介面。Tkinter是一個和Tk介面的Python模塊,Tkinter庫提供了對Tk API的介面,它屬於Tcl/Tk的GUI工具組。
PyGTK
用於python GUI程序開發的GTK+庫。GTK就是用來實現GIMP和Gnome的庫。
PyQt
用於python的Qt開發庫。QT就是實現了KDE環境的那個庫,由一系列的模塊組成,有qt, qtcanvas, qtgl, qtnetwork, qtsql, qttable, qtui and qtxml,包含有300個類和超過5750個的函數和方法。PyQt還支持一個叫qtext的模塊,它包含一個QScintilla庫。該庫是Scintillar編輯器類的Qt介面。
wxPython
GUI編程框架,熟悉MFC的人會非常喜歡,簡直是同一架構(對於初學者或者對設計要求不高的用戶來說,使用Boa Constructor可以方便迅速的進行wxPython的開發)
PIL
python提供強大的圖形處理的能力,並提供廣泛的圖形文件格式支持,該庫能進行圖形格式的轉換、列印和顯示。還能進行一些圖形效果的處理,如圖形的放大、縮小和旋轉等。是Python用戶進行圖象處理的強有力工具。
Psyco
一個Python代碼加速度器,可使Python代碼的執行速度提高到與編譯語言一樣的水平。
xmpppy
Jabber伺服器採用開發的XMPP協議,Google Talk也是採用XMPP協議的IM系統。在Python中有一個xmpppy模塊支持該協議。也就是說,我們可以通過該模塊與Jabber伺服器通信,是不是很Cool。
PyMedia
用於多媒體操作的python模塊。它提供了豐富而簡單的介面用於多媒體處理(wav, mp3, ogg, avi, divx, dvd, cdda etc)。可在Windows和Linux平台下使用。
Pmw
Python megawidgets,Python超級GUI組件集,一個在python中利用Tkinter模塊構建的高級GUI組件,每個Pmw都合並了一個或多個Tkinter組件,以實現更有用和更復雜的功能。
PyXML
用Python解析和處理XML文檔的工具包,包中的4DOM是完全相容於W3C DOM規范的。它包含以下內容:
xmlproc: 一個符合規范的XML解析器。Expat: 一個快速的,非驗證的XML解析器。還有其他和他同級別的還有 PyHtml PySGML。
PyGame
用於多媒體開發和游戲軟體開發的模塊。
PyOpenGL
模塊封裝了「OpenGL應用程序編程介面」,通過該模塊python程序員可在程序中集成2D和3D的圖形。
NumPy、NumArray、SAGE
NumArray是Python的一個擴展庫,主要用於處理任意維數的固定類型數組,簡單說就是一個矩陣庫。它的底層代碼使用C來編寫,所以速度的優勢很明顯。SAGE是基於NumPy和其他幾個工具所整合成的數學軟體包,目標是取代Magma, Maple, Mathematica和Matlab 這類工具。
MySQLdb
用於連接MySQL資料庫。還有用於zope的ZMySQLDA模塊,通過它就可在zope中連接mysql資料庫。
Sqlite3
用於連接sqlite資料庫。
Python-ldap
提供一組面向對象的API,可方便地在python中訪問ldap目錄服務,它基於OpenLDAP2.x。
smtplib
發送電子郵件。
ftplib
定義了FTP類和一些方法,用以進行客戶端的ftp編程。如果想了解ftp協議的詳細內容,請參考RFC959。
PyOpenCL
OpenCL的Python介面,通過該模塊可以使用GPU實現並行計算。