导航:首页 > 生物信息 > 生物信息分析软件有哪些

生物信息分析软件有哪些

发布时间：2022-10-07 17:23:38

Ⅰ 生物信息学一些基本的常用软件有哪些

最常用的东西：1，你需要会用Linux，会使用bash2，高于入门级的统计学知识，以及一门统计语言，比如R3，至少一门编程语言，一般来讲C++,Perl,Python,Java这几种中的一种。4，对于你工作的领域，需要懂这方面的生物学知识，也需要知道目前人们在这个领域里都用什么其他软件。以上四点我觉得必不可少。其他的知识则取决于你是什么领域。比如如果你要研发高性能的序列比对软件，则算法和并行计算的知识必不可少。——本人自己算法很渣，所以没有把算啊列在以上必备的知识里。如果要频繁存取大量数据，则懂得一种数据库必不可少，比如MySQL。

Ⅱ 生物信息学常用的软件有哪些

NCBI(www.ncbi.nlm.nih.gov)-GenBank数据库

数据库相似性搜索——核酸序列与核酸数据库比较（BLASTN）
蛋白质序列与数据库中蛋白质序列比较（BLASTP）
两序列比对（Align two sequences）

DNA序列分析——ORF Finder(www.ncbi.nlm.nih.gov/gorf/gorf.html)

分析实验序列外显子部分——GENSCAN（http://genes.mit.e/GENSCAN.html）
分析实验序列的可能酶切位点——NEBcutter2.0 (http://tools.neb.com/NEBcutter2/index.php)
注： Custom digest -- view gel

限制性内切酶数据库——REBASE(http://rebase.neb.com/rebase/rebase.html)

设计引物扩增实验序列——Genefisher
Primer 3

蛋白质序列分析及结构预测：
1.预测蛋白质的分子量及等电点:ExPASy（Compute pI/Mw）
2.分析蛋白质的基本物理化学性质：ExPASy（ProtParam）
3.分析蛋白质的亲水性和疏水性：ExPASy（ProtScale）
4.分析蛋白质在各种蛋白酶和各种化学试剂处理后的内切产物：ExPASy（PeptideMass） [* ：kinase K]
5.分析蛋白质的信号肽：ExPASy（SignalP）
6.预测蛋白质的二级结构：ExPASy（Jpred 3）

多物种分子系统发育分析：EMBL（www.ebi.ac.uk/embl/)--Toolbox--Clustal2W

人脂联素蛋白质序列：NP_004788
人类胰岛素生长因子IB前体：P05019

Ⅲ 生物信息学一些基本的常用软件有哪些

最常用的东西：
1，你需要会用 Linux，会使用 bash

2，高于入门级的统计学知识，以及一门统计语言，比如 R

3，至少一门编程语言，一般来讲 C++, Perl, Python, Java 这几种中的一种。

4，对于你工作的领域，需要懂这方面的生物学知识，也需要知道目前人们在这个领域里都用什么其他软件。

以上四点我觉得必不可少。其他的知识则取决于你是什么领域。比如如果你要研发高性能的序列比对软件，则算法和并行计算的知识必不可少。——本人自己算法很渣，所以没有把算啊列在以上必备的知识里。如果要频繁存取大量数据，则懂得一种数据库必不可少，比如MySQL。

Ⅳ 网上的生物信息学资源都有哪些

生物信息学高度依赖于网络。实际上，你需要的几乎所有资源，都可以从网上下到。你需要关注你研究领域所需要的那些，而不是全部的资源。

我原来常用的：

NCBI：持有INSDC的节点。网站上有核酸、蛋白、基因名、基因组名等等的搜索工具，以及BLAST序列比对搜索工具，PUBMED文献数据库，Taxonomy数据，COG蛋白家族库等等。FTP可以下到它全部的数据库，BLAST的单机程序，以及各种工具程序。

EBI：和NCBI类似，欧洲搞的对等物。感觉EBI网站比NCBI要清楚简洁。另外EBI网站整合了更多的工具，比如多序列比对。

Uniprot：全蛋白库。NCBI和EBI的蛋白库来源于此。目前包括两部分：SwissProt是人工校对过的，TrEMBL是自动校对的。

Pfam：蛋白家族库。可以使用配套的HMMER进行搜索。比BLAST能找到更远缘的东西，而且找到的东西是结构域。
Rfam：RNA的，类似Pfam。

RDP：16S rRNA库。除了序列，它还有一个基于K-mer naive Bayesian model的rdp classifier，可以对输入序列进行物种分类，效率和准确性较直接使用BLAST更高。
GreenGenes：也是16S库，不过它只收集比较全的序列。它提供了一个16S的标准化比对，并基于这个东西搞了个物种分类工具。

EMBOSS：一个工具包，提供了几百个进行序列操作的工具。

BioPerl、BioPython：Perl和Python的生物学模块。
R：类似matlab的语言，有一大堆的生物学包。

SOAP：华大基因搞的高通量测序工具包，有de-novo拼接的，有mapping的，还有一些后续分析的。
bowtie：一个用于序列mapping的软件。
samtools：用于操纵、分析高通量序列mapping的结果。功能非常灵活，但有点复杂。
fastx toolkit：用来操纵高通量测序序列的工具包。

Ⅳ 生物信息学的分析工作，基因组组装，转录组组装需要什么电脑软件

组学omics,研究的是整体.按照分析目标不同主要分为基因组学,转录组学,蛋白质组学,代谢组学.基因组学研究的主要是基因组DNA,使用方法目前以二代测序为主,将基因组拆成小片段后再用生物信息学算法进行迭代组装.当然这仅仅是第一步,随后还有繁琐的基因注释等数据分析工作.转录组学研究的是某个时间点的mRNA总和,可以用芯片,也可以用测序.芯片是用已知的基因探针,测序则有可能发现新的mRNA,蛋白组学针对的是全体蛋白,组要以2D-Gel和质谱为主,分为top-down和bottom-up分析方法.理念和基因组类似,将蛋白用特定的物料化学手段分解成小肽段,在通过质量反推蛋白序列,最后进行搜索,标识已知未知的蛋白序列.代谢组分析的代谢产物,是大分子和小分子的混合物,主要也是用液相和质谱.总而言之,这些技术都想从全局找变量,都是一种top-down的研究方法,原因很简单：避免‘只缘身在此山中’的尴尬.但因为技术局限,都各有缺点,尤其是转录组和蛋白组数据,基本上颠覆了以前一直认为的mRNA水平能代表蛋白水平的观念,因为这两组数据的重合度太低.所以目前很多研究都开始使用交叉验证方法.

Ⅵ 列举常用的生物信息学数据库及序列对比常用软件及特点

一般来说所用的分析工具有在线跟下载的下面简要列举一些常用在线软件的使用 1、使用VecScreen工具，分析下列未知序列，输出序列长度、载体序列的区域、可能使用的克隆载体都有哪些。一、步骤：
打开google 首页，搜索VecScreen，进入VecScreen首页，复制序列，运行，View report。
二、结果：
输出序列长度918bp，
载体序列的区域456bp——854bp.
克隆载体：M13mp18 phage，pGEM-13Zf(+)，pBR322，pRKW2。
2、使用相应工具，分析下列未知序列的重复序列情况，输出重复序列的区域、包含的所有重复序列的类型、重复序列的总长度及Masked Sequence。
一、步骤：
进入google首页，进入ICBI主页，对序列进行BLAST。得出序列是human的。
进入google首页，搜索RepeatMasker，进入RepeatMasker主页，进入RepeatMasking，复制序列，DNA source选择human，运行！点击超链接，在结果中选择
Annotation File ：RM2sequpload_1287631711.out.html
3、使用CpGPlot/CpGReport/Isochore工具，分析下列未知序列，输出CpG岛的长度、区域、GC数量、所占的百分比及Obs/Exp值。一、步骤：
进入google首页，搜索CpGPlot，进入CpGPlot主页，program中选择cpgreport复制序列，运行！
二、结果：

CpG岛的长度：385bp
区域：48——432；
GC数量：Sum C+G=297，百分数=77.14
Obs/Exp：1.01
4、预测下面序列的启动子，输出可能的启动子序列及相应的位置。一、步骤：
进入google首页，进入ICBI主页，对序列进行BLAST。得出序列是human的
进入google首页，搜索Neural Network Promoter Prediction，进入主页，复制序列，选择eukaryote，运行！
二、结果：

位置：711—761 ，1388—1438，1755—1805；
5、运用Splice Site Prediction工具分析下面序列，分别输出内含子－外显子剪接位点给体和受体的区域及剪接处位置的碱基。一、步骤：
进入google首页，进入ICBI主页，对序列进行BLAST。得出序列是human的
进入google首页，搜索Splice Site Prediction，进入主页，复制序列。Organism选择Human or other。其他默认，运行！
二、结果：
供体：

受体：
6、对下面序列进行六框翻译，利用GENESCAN综合分析(首先确定给定序列的物种来源)哪个ORF是正确的，输出六框翻译（抓图）和GENESCAN结果(包括predicted genes/exons 和 predicted peptide sequence(s) 两个部分)。一、步骤：
进入google首页，进入ICBI主页，对序列进行BLAST。得出序列是Zea的
进入google首页；搜索NCBI，进入主页，选择all resources（A~Z），选择O，选择ORF finder。复制序列，默认，运行！
二、结果：ORF图
三、步骤：进入google首页，搜索GENESCAN，进入主页，Organism:Maize，，其他默认，运行！
四、结果：
G7、进入REBASE限制性内切酶数据库，输出AluI、MboI、EcoI三种内酶的Recognition Sequence和Type。
一、步骤：进入google首页，google in English，搜索REBASE，进入主页，分别输入AluI、MboI、EcoI，运行！
在MboI中选择第一个，EcoI选择第二个。
二、结果：
ENSCAN图
8、使用引物设计工具，针对下列未知序列设计一对引物，要求引物长度为20-25bp，扩增产物长度300-500bp，退火温度为50-60℃。请写出选择的一对引物（Forward Primer and Reverse Primer）、及相应的GC含量、引物的位点、Tm值和产物长度。一、步骤：进入google首页，搜索genefisher，进入主页，复制fasta格式，chechk input， sunmit，；；设置一下引物长度为20-25bp，扩增产物长度300-500bp，退火温度为50-60℃；。
二、结果：

GC含量：

引物的位点：

Tm值：

产物长度：。

9、将下面的序列用NEBcutter 2.0工具分析，用产生平末端及有四个酶切位点的酶进行酶切，并用抓图提交胶图（view gel），要求1.4% agarose和Marker为100bp DNA Ladder。
一、步骤：
进入google首页，进入ICBI主页，对序列进行BLAST，得知是linear。
进入google首页，搜索NEBcutter 2.0，进入主页，选择linear，运行！选择custom digest，，把“1”改为“4”，选择平末端，后digest。View gel。选择1.4% agarose和Marker为100bp。
二、结果：

然后就是蛋白质的了一般都在expasy里swiss-prot 适用于检索的 compute pi/mw 求理论分子量分子量 protparam物理化学性质 protscale亲水性疏水性 peptidemass分析蛋白酶和化学试剂处理后的内切产物
NCBI(www.ncbi.nlm.nih.gov)-GenBank数据库

数据库相似性搜索——核酸序列与核酸数据库比较（BLASTN）
蛋白质序列与数据库中蛋白质序列比较（BLASTP）
两序列比对（Align two sequences）

DNA序列分析——ORF Finder(www.ncbi.nlm.nih.gov/gorf/gorf.html)

分析实验序列外显子部分——GENSCAN（http://genes.mit.e/GENSCAN.html）
分析实验序列的可能酶切位点——NEBcutter2.0 (http://tools.neb.com/NEBcutter2/index.php)
注： Custom digest -- view gel

限制性内切酶数据库——REBASE(http://rebase.neb.com/rebase/rebase.html)

设计引物扩增实验序列——Genefisher
Primer 3

蛋白质序列分析及结构预测：
1.预测蛋白质的分子量及等电点:ExPASy（Compute pI/Mw）
2.分析蛋白质的基本物理化学性质：ExPASy（ProtParam）
3.分析蛋白质的亲水性和疏水性：ExPASy（ProtScale）
4.分析蛋白质在各种蛋白酶和各种化学试剂处理后的内切产物：ExPASy（PeptideMass） [* ：kinase K]
5.分析蛋白质的信号肽：ExPASy（SignalP）
6.预测蛋白质的二级结构：ExPASy（Jpred 3）

多物种分子系统发育分析：EMBL（www.ebi.ac.uk/embl/)--Toolbox--Clustal2W

人脂联素蛋白质序列：NP_004788
人类胰岛素生长因子IB前体：P05019

Ⅶ 网上的生物信息学资源都有哪些

有很多，你要是做生物信息学需要三个方面的资源
1，数据，网上现在的数据库很多，最常用的是NCBI，TCGA，千人基因组等，要是想找特定的数据，有tRNA数据库，PDB，NDB等，每个数据库的侧重点都不相同，但是以NCBI最全面，最准确。
2，算法，也可以说是分析方法，网上也有很多的在线分析软件以及能下载的软件，建议你看看《生物信息学分析与实践》这本书，绿色封皮的，书名大概是这个，我的这本书没找到。里面有各种网上软件的寻找和使用方法。
3，文献，当你了解了生物信息的基础知识之后，就可以看论文了，看论文的时候，尽量看近几年的高质量论文，比如bioinformatics等杂志的论文就很不错，建议看看。
我没有给你附上网站的地址，一是因为资料太多，根本说不完，二是尽量自己寻找，以后就知道怎么做了，如果你不知道怎么找的话，就去小木虫上搜一下生物信息学，会有很多相关的较好的方法和建议。

Ⅷ 生物信息学一些基本的常用软件有哪些

photoshop

**************************************************************
如果你对这个答案有什么疑问，请追问，
另外如果你觉得我的回答对你有所帮助，请千万别忘记采纳哟！
***************************************************************

Ⅸ 生物信息学一些基本的常用软件有哪些

必学：1、计算机基础（linux+perl+R 或者 python+matlab）
2、生信基础知识（测序+数据库+数据格式）
3、生信研究领域（全基因组，全转录组，全外显子组，捕获目标区域测序）
4、生信应用领域（肿瘤筛查，产前诊断，流行病学，个性化医疗）
分而治之：
一、计算机基础，需要看三本书，一步步的学会学通，不需要刻意去找哪个书，一般linux是鸟哥私房菜，perl是小骆驼咯，R是R in action，但是看一本书只能入门，真正想成为菜鸟，必须每个要看五本书以上！我云盘里面有这基本上的高清打印版，大家可以去淘宝打印一下才几十块钱还包邮，对书比较讲究的也可以买正版，也不过是一百多块钱而已！
二、生信基础知识，测序方面，在网络文库找十几篇一代二代三代测序仪资料仔细研读，然后去优酷下载各大主流测序仪的动画讲解，再看看陈巍学基因的讲解；数据库先看看三大主流数据库——NCBI,ENSEMBL,UCSC，还有一些也可以了解一些（uniprot,IMGT,KEGG，OMIN，TIGR，GO）同样也是网络文库自己搜索资料，但是这次需要自己去官网一个个页面点击看，一个个翻译成中文理解吃透；数据格式讲起了就多了，这个主要是在项目流程中慢慢学，或者你有机会去上课，不然你看来也是立马忘记的，主要有sam,vcf,fasta,fastq,bed,gtf,gff,genbank,ensembl,psl等等
三、生信研究领域，各个领域主要是软件繁多，合起来常用的估计有上百个软件了，一般只有从业五六年以上的人才有可能把它们全部用过一遍，而且这也完全需要项目来训练，而不能仅仅是看看软件手册，但是研究领域最重要的是背后的原理，需要看各大牛的综述。
a) 生信基础软件(blast++套件，fastqc，flash，blast，solexaQA，NGS-QC-toolkit，SRA-toolkit，fastx-toolkit)
b) snp-calling相关软件（bwa，bowtie，samtools，GATK，VarScan.jar，annovar）
c) 基因组相关软件（velvet，SOAPdenovo2，repeatmasker,repeatscount,piler，orthMCL，inparanoid,clustw,muscle，MAFFT，quickparanoid，blast2go，RAxML，phyML）
d) 转录组相关软件（trinity，tophat，cufflinks，RseQC，RNAseq，GOseq，MISO，RSEM，khmer，screed，trimmomatic，transDecoder，vast-tools，picard-tools，htseq，cuffdiff，edgeR，DEseq，funnet，davidgo，wego，kobas，KEGG，Amigo，go）

Ⅹ 用于生物信息分析该如何安装ubuntu系统

1. 生信软件系统的选择——Linux（ubuntu）

对于生信分析人员来说，日常工作，软件运行，跑流程，均在linux下操作。当然，也有基于云端的生信分析平台，如免费的Galaxy，或者某些公司的一站式云平台。

比较初学者学生物信息还是使用开源软件、学原理、一步一步运行才有意思。这路子，一定要适应Linux的命令行界面。

选择windows还是linux？一定是linux，windows太多的生物软件不兼容了。
选择linux的哪个版本？推荐桌面版的Ubuntu——稳定，美观，适合初学者之称；次之，Centos——免费、稳定的服务器linux版本之称。
用那种方式安装linux好？推荐虚拟机安装。不太建议双系统，云端这种。因为，对于初学者在系统中，需要反复折腾，测试，搞垮系统是常事。
选择开源的VMbox还是商业版VMware？两者都可以，但各有缺点。VMbox更新比较快，经常更新后，可能会出现报错，系统无法打开的现象，较低版本的反而比较稳定，如果用好了，不建议经常更新。还有一点是，VMbox在鼠标控制上，没有VMware流畅。VMware十分稳定，流程好用。最新版一般要收费。可以选择比最新版版本稍低的，上网搜注册码，免费使用。还是那样，用好了，不要经常更新。某些生信软件会提供VMbox的镜像，如qiime。
VMbox的镜像能不能转到VMware上使用？，答案是可以的，使用VMbox的镜像导出功能，然后使用VMware进行导入，保持两者格式相同。

阅读全文

与生物信息分析软件有哪些相关的资料

热点内容

word中化学式的数字怎么打出来发布：2023-08-31 22:06:02 浏览：740

乙酸乙酯化学式怎么算发布：2023-08-31 21:59:55 浏览：1406

沈阳初中的数学是什么版本的发布：2023-08-31 21:59:06 浏览：1353

华为手机家人共享如何查看地理位置发布：2023-08-31 21:53:00 浏览：1045

一氧化碳还原氧化铝化学方程式怎么配平发布：2023-08-31 21:52:13 浏览：886

数学c什么意思是什么意思是什么发布：2023-08-31 21:44:12 浏览：1411

中考初中地理如何补发布：2023-08-31 21:29:55 浏览：1300

360浏览器历史在哪里下载迅雷下载发布：2023-08-31 21:20:27 浏览：703

数学奥数卡怎么办发布：2023-08-31 21:18:51 浏览：1388

如何回答地理是什么发布：2023-08-31 21:14:54 浏览：1025

win7如何删除电脑文件浏览历史发布：2023-08-31 21:11:42 浏览：1058

大学物理实验干什么用的到发布：2023-08-31 21:07:03 浏览：1487

二年级上册数学框框怎么填发布：2023-08-31 21:05:06 浏览：1701

西安瑞禧生物科技有限公司怎么样发布：2023-08-31 21:04:01 浏览：976

武大的分析化学怎么样发布：2023-08-31 21:03:06 浏览：1250

ige电化学发光偏高怎么办发布：2023-08-31 21:02:12 浏览：1339

学而思初中英语和语文怎么样发布：2023-08-31 20:59:29 浏览：1653

下列哪个水飞蓟素化学结构发布：2023-08-31 20:50:46 浏览：1425

化学理学哪些专业好发布：2023-08-31 20:46:41 浏览：1488

数学中的棱的意思是什么发布：2023-08-31 20:45:44 浏览：1059