⑴ 网上的生物信息学资源都有哪些
有很多,你要是做生物信息学需要三个方面的资源
1,数据,网上现在的数据库很多,最常用的是NCBI,TCGA,千人基因组等,要是想找特定的数据,有tRNA数据库,PDB,NDB等,每个数据库的侧重点都不相同,但是以NCBI最全面,最准确。
2,算法,也可以说是分析方法,网上也有很多的在线分析软件以及能下载的软件,建议你看看《生物信息学分析与实践》这本书,绿色封皮的,书名大概是这个,我的这本书没找到。里面有各种网上软件的寻找和使用方法。
3,文献,当你了解了生物信息的基础知识之后,就可以看论文了,看论文的时候,尽量看近几年的高质量论文,比如bioinformatics等杂志的论文就很不错,建议看看。
我没有给你附上网站的地址,一是因为资料太多,根本说不完,二是尽量自己寻找,以后就知道怎么做了,如果你不知道怎么找的话,就去小木虫上搜一下生物信息学,会有很多相关的较好的方法和建议。
⑵ 学习生物信息学有哪些比较好的网站或论坛
生信菜鸟团上大学之后,我上网找资料时发现的第一个博客就是生信菜鸟团,里面包罗万象,涵盖很多方面(初次发现时,就感觉自己进入了新的天地)rabbit gao's blog 我超喜欢这个师兄的博客里面的笔记,很直观,尤其是python那部分。他是以代码的形式展示内容。沈梦圆博客梦圆师姐,和我一样喜欢用熊猫头像,她的博客也是刚刚建立不长时间。师姐的文笔很赞,看里面博文相信对你有帮助的。生信日志|鸣一道鸣一道师兄的博客我比较喜欢的是R做图那一块plob这个我比较少看,不过内容也不错,我后续再写上这个博客的描述。陈连福博客听说连福老师有开培训班,实力自然也不差。糗世界←欢迎来到糗糗的世界糗世界主要包括:序列比对与NGS R/bioconctorcircos教程,其中糗世界关于R和bioconctor以及NGS的归纳总结特别详尽生信客部落生信客部落是我自己的博客,刚建不久(2016.9.3建的),我目前在准备考研,打理的时间不多。但相信是一只潜力股,有提升的空间。也欢迎博友们交换 "友情链接".hope博客 hope 他(她)有一篇关于生物信息学在线工具的总结,我特别喜欢科研动力“endnote使用宝典”,专注写endnote相关的内容。(注:endnote 是文献管理的软件,插入引用文献的神器)biochen生物伯臣生物里也蛮多归纳整理的Bob's Blog bob这位兄弟的博客我接触不多,我后续补上描述.论坛(包括生信论坛和其他一些相关的网站):生信技能树生信技能树前面那个师兄有详细描述过。我也亲眼见证了它从无到有的过程,看着生信技能树感觉特别亲切,感觉就像自家的孩子一样。我自己由于准备考研和书写毕业论文的事情,在生信技能树建设的参与度不高。总之,好喜欢......生物信息学天空内容超全的一个生信论坛丁香园(生信板块)丁香园,就不解释了,一个国内最成功的论坛之一。医学生基本都知道的一个论坛。小木虫小木虫,里面蛮多资源的,也是国内最成功的论坛之一生物统计家园描述待输入...基因堂描述待输入biostars这是一个生信问答网站生信刷题网站ROSALIND | About 这个是一个生物信息的刷题网站,超多实战题(纯英文,既提高英语水平,又训练了自己的实战能力,何乐而不为)。实战走起......生物信息学在线工具网站生信客部落生物信息工具整合(包含在线工具与离线工具)–更新中这里面包含了一些生物信息学可视化工具,包含在线的工具和一些离线的可视化工具,由于目前个人水平有限,所以还有待继续完善
⑶ 网上的生物信息学资源都有哪些
生物信息资源简介
生物信息(bioinformatics)中的“信息(-informatics)”指的是从海量的数据中进行挖掘,从而得到知识的过程,如下图所示。在这个过程中,会涉及到数据的管理,数据的运算,数据挖掘和建模仿真。其中,数据管理部分主要是数据库(database),数据的运算部分主要是指各种生物信息的软件(software tools)。这两部分是生物信息研究非常重要的资源,也是生信入门需要了解的基础知识。下面简要介绍一下这些资源。(本文根据北京大学生物信息学公开课程视频整理,图片来自视频截图)
根据不同的特点,可以把这些资源分成不同的类别。比如根据数据性质可以将database分为原始数据(Original data)数据库和二级数据(Secondary data)数据库。再比如根据软件是独立的工具还是网络服务器,可以将software tools分为standalone programs和web servers。
根据发布者的类别可以分为centralized resources和indivial resources。比较大的centralized resources主要有NCBI(National Center for Biotechnology Information), EBI(European Bioinformatics Institute)和UCSC(University of California Santa Cruz)Genome Browser。下面将分别介绍这三个最大的数据库以及其他的生物信息学数据资源。
1.NCBI简介
NCBI-Genome Database:
存储了目前绝大多数的被测序出来的基因组,目前有1000+基因组被测序出来。
NCBI-Nucleotide/protein (RefSeq):
将不同的版本作了整合之后的参考序列。其中NM_*表示核酸序列,NP_*表示蛋白序列。其中核酸给出了ID号,名称,物种,特征,编码区,序列等信息。蛋白还给出了功能区间信息。
NCBI-Gene:
以基因为单位,整合了pathway、variations、phenotype等信息。
对于Human genes而言,GeneCards比NCBI有更好的对人类基因、蛋白的注释(表达、相互作用、同源蛋白、功能、遗传变异等)。
NCBI-SRA
新一代测序技术的短序列database,每5个月数据就会翻倍。
NCBI-Taxonomy
把所有至少有一个基因被测序过的物种做的物种分类树,在所有被描述过的物种中有10%被测序过。
NCBI-PubMed
用于查阅文献。
NCBI-MeSH
(Medical Subject Heading)controlled vocabulary used for indexing articles for PubMed 结构化的词库。
NCBI-My NCBI
对于感兴趣的关键词,在NBCI设定之后,每周会推送相关文献,对于项目中跟踪文献非常有用。
NCBI-BLAST
NCBI最着名的工具,关于BLAST的两篇文章已经被引用了四万两千多次。不同版本的BLAST包括:
Online:NCBI-BLAST
Standalone:BLAST+
Embedded in webpage:wwwblast
2. EBI简介
EBI中的一些资源如表中所示:
EBI-Ensembl:
介于NCBI和UCSC之间的资源,整合很多物种的不同的资源。Ensembl中数量的类型包括:
EBI-UniProtKB
The Universal Protein Resource (UniProt) is a comprehensive resource for protein sequence and annotation data.
(The UniProt Knowledgebase (UniProtKB) is the central hub for the collection of functional information on proteins, with accurate, consistent and rich annotation. )
UniProtKB -Swiss-Prot(已经过人工校对)
UniProtKB -TrEMBL(无人工校对)
EBI-IntAct
分子之间相互作用
EBI-Clustal Omega
多序列比对
EBI-InterProScan
输入一个序列,看是否包含目前已经知道功能的蛋白的区域
3 UCSC简介
以基因组为坐标。包含很多的track,包括:SNP,mRNA,剪切的EST,没剪切的EST,高通量的,通过Chi
⑷ 微生信免费吗
免费哪枯。微生信免费。微生信是一个免费在线生物信息陵缓核学数据可视化工具,能做文献中常见的50多种生信相关矢量图。微生信是一个在线作图工具网站,主要包括本站在线工具、其他在线工具以尺掘及其他在线作图等三大模块。
⑸ 国际上三个大的生物信息中心有哪些
一 美国国家生物技术信息中心NCBI(National Center for
Biotechnology Information)
NCBI是一个极具人性化的网站,网站的主页清晰的阐明了NCBI所做的工作及相关领域最新的热点内容,新闻等。为了方便使用者更加熟练使用网站资源,NCBI在主页清晰的标注了站点导航,非常便于初学者熟悉和掌握NCBI的站内资源。
另外,NCBI将其网站资源列于主页左侧,其中包括:SITE MAP, About NCBI, GenBank, Literature
databases, Molecular databases, Genomic biology, Tools, Research at
NCBI, Software engineering, Ecation, FTP site, Contact
information等等。
二EBI(European
Bioinformatics Institute)欧洲生物信息研究所The European
Bioinformatics Institute(EBI)是目前国际上几个重要分子生物信息网站之一,位置座落于英国The Wellcome Trust
Genome Campus。EBI的任务就是确保分子生物与基因体的研究信息可以公开并且免费提供给科学社群,以促进科学进步。
EBI所提供的服务包括建立/维护数据库、提供分子生物相关信息服务、执行分子生物与计算分子生物研究;所服务的对象与研究人员扩及各产业,包括分子生物、基因体、医学与农业学术研究、农业、生物技术、化学与制药工业。
三DDBJ(DNAData Bank of
Japan)日本核酸数据库
DDBJ(DNA Data Bank of Japan)
设立在日本国家遗传研究所(NIG),于1986年开始DNA数据库的构建工作。从一开始,DDBJ就作为国际性DNA数据库之一,发挥着重要的作用。它
首先反映的是日本国内数据库的资源,并与NCBI,EBI进行频繁的国际性合作。DNA序列中蕴含了大量的数据资源,比起其它生物学数据,它在阐述进化方面的作用更为直接。因此,探求DNA数据库,不仅是在生命科学方面的研究,更是为人类的发展谋福利。
DDBJ是日本唯一的DNA数据库,它从研究者那里收集DNA 序列并且给数据提交者一个国际公认的编码。DDBJ
主要从日本研究者那里收集数据,当然,它也接受外国研究者的数据并给以编码。
⑹ 蛋白序列、结构数据库常用的有哪些
蛋白质数据库介绍
蛋白质数据库
1. PIR和PSDPIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,包含超过142,000条蛋白质序列(至99年9月),其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。
PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索差镇;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
PIR和PSD的网址是:http://pir.georgetown.e/。
数据库下载地址是:ftp://nbrfa.georgetown.e/pir/。
2. SWISS-PROT
SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献码庆伍信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。
利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。
SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。
SWISS-PROT的网址是:http://www.ebi.ac.uk/swissprot/。
3. PROSITE
PROSITE数据库收集了生物学有显着意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下,某个蛋白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE的搜索找到隐含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;除了序列模式之外,PROSITE还包括由多序列比对构建的profile,能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。
PROSITE的网址是:http://www.expasy.ch/prosite/。
4. PDB
蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库,由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振(NMR)的数据,经过整理和确认后存档而成。目前PDB数据库的维护由结构迟或生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务,以及关于PDB数据文件格式和其它文档的说明,PDB数据还可以从发行的光盘获得。使用Rasmol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。
RCSB的PDB数据库网址是:http://www.rcsb.org/pdb/。
5. SCOP
蛋白质结构分类(SCOP)数据库详细描述了已知的蛋白质结构之间的关系。分类基于若干层次:家族,描述相近的进化关系;超家族,描述远源的进化关系;折叠子(fold),描述空间几何结构的关系;折叠类,所有折叠子被归于全α、全β、α/β、α+β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL序列库,这个库通常被用来评估各种序列比对算法。此外,SCOP还提供一个PDB-ISL中介序列库,通过与这个库中序列的两两比对,可以找到与未知结构序列远缘的已知结构序列。
SCOP的网址是:http://scop.mrc-lmb.cam.ac.uk/scop/。
6. COG
蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序,可以把某个蛋白质与所有COGs中的蛋白质进行比对,并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询,基于Web的COGNITOR服务,系统进化模式的查询服务等。
COG库的网址是:http://www.ncbi.nlm.nih.gov/COG。
下载COG库和COGNITOR程序在:ftp://ncbi.nlm.nih.gov/pub/COG。
⑺ 常用生物信息学在线分析工具汇总(记录中...)
NCBI主站携塌: https://www.ncbi.nlm.nih.gov/
拟南芥: https://www.arabidopsis.org/
AmiGO2
STRING
Pham
BLAST: https://blast.ncbi.nlm.nih.gov/Blast.cgi
ProParam: https://us.expasy.org/tools/protparam.html
ProScale:辩悉圆陆蔽 http://expasy.org/cgi-bin/protscale.pl/
TMHMM2.0: http://www.cbs.dtu.dk/services/TMHMM-2.0/
TMPred: http://www.ch.embnet.org/software/TMPRED_form.html
PSORT: http://psort.hgc.jp//
Prosite: http://www.expasy.org/prosite/
ProScan: http://www.ebi.ac.uk/InterProScan/
SMART: http://smart.embl-heidelberg.de/#
MEME: http://meme-suite.org/tools/meme
SOMPA: http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html
SWISS-MODEL: http://swissmodel.expasy.org/
⑻ 在你看来学习生物信息学有哪些比较好的网站或论坛
国外与生物信息学相关的网站有哪些
生物信息学高度依赖于网络。实际上,你需要的几乎所有资源,都可以从网上下到。你需要关注你研究领域所需要的那些,而不是全部的资源。
我原来常用的:
NCBI:持有INSDC的节点。网站上有核酸、蛋白、基因名、基因组名等等的搜索工具,以及BLAST序列比对搜索工具,PUBMED文献数据库,Taxonomy数据,COG蛋白家族库等等。FTP可以下到它全部的数据库,BLAST的单机程序,以及各种工具程序。
EBI:和NCBI类似,欧洲搞的对等物。感觉EBI网站比NCBI要清楚简洁。另外EBI网站整合了更多的工具,比如多序列比对。
Uniprot:全蛋白库。NCBI和EBI的蛋白库来源于此。目前包括两部分:SwissProt是人工校对过的,TrEMBL是自动校对的。
Pfam:蛋白家族库。可以使用配套的HMMER进行搜索。比BLAST能找到更远缘的东西,而且找到的东西是结构域。
Rfam:RNA的,类似Pfam。
RDP:16S rRNA库。除了序列,它还有一个基于K-mer naive Bayesian model的rdp classifier,可以对输入序列进行物种分类,效率和准确性较直接使用BLAST更高。
GreenGenes:也是16S库,不过它只收集比较全的序列。它提供了一个16S的标准化比对,并基于这个东西搞了个物种分类工具。
EMBOSS:一个工具包,提供了几百个进行序列操作的工具。
BioPerl、BioPython:Perl和Python的生物学模块。
R:类似matlab的语言,有一大堆的生物学包。
SOAP:华大基因搞的高通量测序工具包,有de-novo拼接的,有mapping的,还有一些后续分析的。
bowtie:一个用于序列mapping的软件。
samtools:用于操纵、分析高通量序列mapping的结果。功能非常灵活,但有点复杂。
fastx toolkit:用来操纵高通量测序序列的工具包。
⑼ 生物信息学常用网站
丁香园,生命经纬,生命科学论坛,生物谷,生物在线,中国开放教育资源协会,生物通,科学网,小木虫,生物秀,中国学术会改判议在线,中拍歼搭国细胞生物学学袭拿报......这些在网络上搜索,一般第一个就是!
http://..com/question/128332981.html?si=2