导航:首页 > 生物信息 > 如何自学生物信息

如何自学生物信息

发布时间:2022-06-03 20:07:07

⑴ 如何学习生物信息

生物信息学专业好吗
还不错,但是不好就业
生物信息学(Bioinformatics)是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学(Genomics)和蛋白质组学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。

⑵ 如何自学生物信息学

无论自学什么,都要从一本最基础的,比较权威的教材入手,要是没有教材的话,先从一些大牛的文献综述开始了解,再从硕士博士论文一步步深入,还有就是看看网上有没有课程,比如爱课程,还可以去网盘搜搜试试看。望采纳

⑶ 自学生物信息学真的有效吗

从工科转到生物信息学来,讲一下自己的经历。首先得了解生物信息学做什么。推荐一本入门的书:《探索基因组学、蛋白质组学和生物信息学》,这本书基本上把现在用到的生物信息的基本技术讲了一遍。然后是学会如何应用现有的工具。现在有很多已经写好的工具,只要会看帮助文档,对于解决手头的工作是提供了相当大的帮助。学习一门语言python,perl,R,都可以,只要能够帮自己解决问题就好。因为你是生物学出身,所以能够理解工具背后的含义。对于像我一样从工科转到生物信息方向的,需要好好了解生物学的意义。有助于更好的完成工作。国内的相关论坛确实不多,相应的帮助可以去查看工具和数据库的文献。

⑷ 如何从零开始学习生物基因类相关学科


生物技术是现代生物学发展及其与相关学科交差融和的产物,其核心是以DNA重组技术为中心的基因工程,还包括微生物工程、生化工程、细胞工程及生物制品等领域。培养掌握现代生物学和生物技术的基本理论、基本知识和基本技能,获得应用基础研究和科技开发研究的初步训练,具有良好的科学素质、较强的创新意识和实践能力的生物技术高级专门人才。
课程主要包括生物化学、植物生物学、动物生物学、微生物学、遗传学、细胞生物学、分子
生物学、生化技术、免疫学技术、基因工程细胞工程、发酵工程、蛋白质化学及研究技术、
药用植物化学、生化药物以及数、理、化、计算机应用等必修和选修课。生物技术专业就业
前景之培养目标本专业培养具备生命科学的基本理论和较系统的生物技术的基本理论、基础知识、基本技能,能在科研机构或高等学校从事科学研究或教学工作,能在工业、医药、食品、农、林、牧、渔、环保、园林等行业的企业、事业和行政管理部门从事与生物技术有关的应用研究、技术开发、生产管理和行政管理等工作的高级专门人才。

⑸ 想自学生物信息学,不知道怎么开始,有没有什么好的推荐

想学习生物信息学可以首先购买相应的书籍,其次可以关注慕课或者是一些其他的网站,上面有很多免费的一些课程可以自己看。

⑹ 如何自学生物信息学

本人自大三就开始做生物信息,现在即将读博士,希望我的经验可以帮助到你。
既然你是想做生物信息学,那么相关背景什么的会了解一些,我在这就不多说了。

首先,确定你自己的背景专业,现在很多学校本科都没有专门的生物信息学专业,都是挂靠在生命学院或者计算机学院的。所以背景专业一般都是生物学或计算机学,不同的专业将来做生信区别会很大。当然,做什么方向和背景专业并没有绝对关系。
如果是生物学背景,那么将来大部分的工作将会是使用专门的生物信息学分析软件。所以难度会降低。自学的话,主要学几下几点就好:
1、一门脚本语言,个人推荐Python(Perl也可以,各有利弊,Python更新兴一些)。
2、Linux系统。这个也不是百分百要求,但是专业的生信人,都是用Linux的,而且很多软件都是不支持Windows的。
3、常用的生物信息学数据库,这里列出几个,NCBI,Ensembl,EBI,GENEbank等等,这些数据库下面还分子数据库,像GEO,GWAS catalog等。当然,还有方向更细的,像miRBase(miRNA数据库)等。
4、R,这也是一种编程语言,但更加侧重结果的展示,实际上也就是画图。
5、常用生信分析软件,这个没必要专门去学,需要用到他们的时候再学也不晚,都是很简单的东西。
如果是计算机背景,那么以后的工作可能主要是算法分析,创造新的生信分析软件,做数据库等。需要自学的就是以上的那些,再加一门工程语言,C,C++,C#,Java都可以。

⑺ 如何系统的学习生物信息学

生物信息学,是一门综合学科。涉及到数学,生物学和计算机的内容。但在我看来,计算机的基础需要,但要求不是很高,关键是要有很好的生物学知识,包括遗传学的、生物化学的、发育生物学的、分子生物学的、植物生理学的知识等等,也就说需要达到这样的一个要求:在进行数据分析时,能对各种分析结果进行生物学的评价,并给出最优的分析策略。同时也应该有纯熟的数理基础,包括统计学的、拓扑学的,这样才能把待分析的问题转换成可计算的模型,最后能给出实现的程序。
从个人来说,因为生物信息学是一个非常大的领域,所以,关键是要确定自己的研究方向。比如,以关联分析为方向的生物信息学,那么就要掌握好各种关联分析的统计分析方法,有很强的数据管理能力,足够好的序列分析能力(这是进行variation查找和分析的基础)。
回到6年以前,如果决定在生物信息学上发展,那么我也许会做下面这些事情:
首先,从最不重要的计算机这个方面来说:
(1)要掌握好bash等脚本语言,一般的linux问题都能很好的解决
(2)熟练使用apache,mysql等基础软件工具,用joomla等CMS配置搭建网站
(3)应该努力精通perl,bioperl,以基于此的各种分析工具,比如gbrowser,cmap等
(4)足够好的c/c++语言能力,这是实现新算法的最高效语言。
(5)应该努力精通R语言,这是进行统计分析的基础工具
(6)如果有机会,学学erlang这样一些函数式语言吧
其次,从数学基础来说,我觉得应该:
(1)学好线性代数
(2)学好高等数学,或者数学分析
(3)学好统计学
(4)学好离散数学
(5)学好计算机算法和数据结构
其次,从生物学来说:
(1)如果没有进化论的基层,请把进化论学好
(2)学好发育生物学,植物生理学
(3)学好基因组学、遗传学等
千万不要认为这些没有什么用,当你在数据分析,怎么判断结果的合理性,或者对结果进行解释时候,都离不开这些生物学问题。最后,你对这些问题的理解成度,决定了你的生物信息学水平:只是一个有生物学知识的、会进行计算机操作的技术员,还是一个能给出解决方案的有良好计算机基础的能把握生物学问题的生物信息学家。
最后,从生物信息学的角度来说:
(1)对NCBI等各大数据库非常熟悉
(2)对各种生物学信息学的分析方法和策略非常的清楚,至少应该知道有那些工具软件,以及这些工具软件的原理和基于的生物学基础,包括:基因组学分析,表达谱分析,代谢组分析、调控网络分析、数据结果的整合展示等
最后,生物信息学是一个发展很快的学科,但因起涉及的内容比较多,因此,要想到底一定的要求,是需要付出巨大的努力的。此外,在进行生物信息学学习的过程中,对自己感兴趣的方法工具,一定要把文献上的数据拿来,自己独立分析一遍,自己去体会分析的过程,从而对这些方法和工具有更深入的理解。

⑻ 如何学好生物信息学

我硕士读的是细胞生物学,今年4月开始在boss要求下自学perl,打听了下,<learning perl>这本书不错,就买来开始看,等5月份去北京参加公司的培训班时,<learning perl>读了一遍,<intermediate perl>看了一部分。培训回来,我们的项目就开始做了,9月拿到所有原始数据和分析结果。然后,我对照着公司的分析报告,试着自己走一边分析流程,中间遇到问题,自己解决不了的,就发邮件求助。有几点需要注意:1. 我能理解你想早些玩儿数据的愿望,但是在这之前,最好要有一个outline.需要知道数据从哪儿来的,怎么产生的?其实就是测序仪的工作原理。然后是数据质量检验,为什么需要数据过滤?接着是reads拼接和组装。总之,要对整个流程有一个认识,而后在学习的过程中,再不断回头对比这个流程,这样才不会有迷失的感觉。2. 有了基础知识的铺垫,就可以尝试着自己做些练习了,paper上面都会给出他们的数据、原码地址,可以找来自己试试,先看看自己能不能做出一样的效果。当然,这时要是你手里正好有项目,那就更好了。3. 学生物信息,paper肯定是要跟踪的。覆盖生物信息有趣的论文, 算法,以及生物科学问题。这个网站还汇集了很多生物信息领域科学家的博客。再如BGI的主程罗瑞邦, SAMtools、BWA的作者Heng Li都有在这里出现。[RNA-Seq Blog](RNA-Seq Blog) 推荐新的论文、工作、培训课程、大型会议等。如果你是生物背景的,那么计算机方面的知识需要补一下:需要能在linux环境下舒服的工作。比如从源码编译安装软件PATH配置,再比如舒服地使用google找到问题的答案。学会使用python/perl。比如有的时候运行一个软件老是报错,可能就是因为在一个包含几十万行的文本文件里,有随机的那么几千行的末个位置,多一个冒号, 这时候你知道需要怎么做了? 学会R。要从一大堆基因里面找出表达水平变化的基因来,需要统计分析和显着检验;而要把我们的数据更直观地展示出来,最好的方式就是图形了吧。这两个需要,R都能满足。当然matlab也是可以的,区别在于R是开源工具。具备了上述技能,那么常用的软件就能用起来了。随着学习的深入,可能你的问题别人也没遇到过,这时候就需要自己动手,要么修改现成的工具,要么自己做一个出来。这时候,除了python/perl,或许还可以学C/C++/java,或许需要研究下比如BWT、De Bruijn Graph背后的原理。

⑼ 生物信息学入门需要具备什么能力

1.编程

Linux:会用Editor(e.g. VIM) 和 Shell Script (e.g. bash);推荐《鸟哥的Linux私房菜-基础学习篇》

Python/Perl:《Python编程入门(第3版)》,Perl推荐小骆驼

R/MATLAB:《R语言实战(R in action)》

如果做数据库或者server,推荐再学PHP,MySQL,JavaScript

2.课程

Bioinformatics: 生物信息导论和方法(北大高歌老师的课程,讲解逻辑清晰,由浅入深),MOOC。

因为生信有好多分支,如对基因组、蛋白质组学数据分析并给出生物学解释;在研究算法方面,如利用机器学习的各种原理来解决生物学问题(对基因序列原件的注释,如对TSS,splicing sites,promoters,enhancers,positioned nucleosomes等功能区域的注释;通过对RNA-seq,microarray,ChIP-seq等数据的分析,区分不同的疾病类型或疾病的分子标志物(biomarkers);对基因功能的注释,如Gene Ontology term;以及基因间互作调控网络的分析);比如运用统计学知识改进已有的生信软件的算法,等等。可以根据将来要做什么继续补充知识,比如看一下斯坦福大学的Andrew Ng在coursera的机器课程呀 ,看一下统计学原理呀之类的。

3.文献和实战练习

如果是做基因组学的生信公司

3.1 RNA数据分析流程

RNA-seq:可以重复一下文章中的分析Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks当然入门之后可以更多了解相关软件啦,比如STAR,feature counts, Gfold, EdgeR, DESeq2,
DESeq等。

找lncRNA:Recurrently deregulated lncRNAs in hepatocellular carcinoma. 这篇文章中有如何找新lncRNA的流程,可以根据文章提供的方法重复一下。

3.2 DNA数据分析流程

GATK那一套流程检测

同时variant与疾病、eQTL等关联分析的话,可以了解一下STATA

3.3
结合机器学习和基因组学的话,可以看一下以下文献:

DeepVariant:由谷歌Deep mind公司研发,利用卷积神经网络(convolutional neural network, CNN)检测基因组上单碱基突变(SNP)和小的插入缺失(Indel),比现有的GATK软件有更高的精确度。

DeepWAS:根据功能单元选择出一组SNP的集合,与现有的基因组关联分析(GWAS)检测基因组上一个SNP与疾病的关系相比,DeepWAS能够更综合地分析致病基因突变,在寻找调控区域的基因突变也更为直接。
DeepSEA:预测人类基因组非编码区有功能的变异。

DeepBind:预测DNA,RNA结合蛋白的序列特征,并能识别有害的基因突变。

DeepCpG:在表观遗传学层面上,应用深度神经网络算法,研发了通过单细胞测序的DNA序列和不完整的甲基化修饰数据的,用来预测细胞细胞层面是否会发生甲基化,其效果优于现有软件。

⑽ 如何自学生物信息学

一、计算机基础,需要看三本书,一步步的学会学通,不需要刻意去找哪个书,一般linux是鸟哥私房菜,perl是小骆驼咯,R是R in action,但是看一本书只能入门,真正想成为菜鸟,必须每个要看五本书以上!我云盘里面有这基本上的高清打印版,大家可以去淘宝打印一下才几十块钱还包邮,对书比较讲究的也可以买正版,也不过是一百多块钱而已!

二、生信基础知识,测序方面,在网络文库找十几篇一代二代三代测序仪资料仔细研读,然后去优酷下载各大主流测序仪的动画讲解,再看看陈巍学基因的讲解;数据库先看看三大主流数据库——NCBI,ENSEMBL,UCSC,还有一些也可以了解一些(uniprot,IMGT,KEGG,OMIN,TIGR,GO)同样也是网络文库自己搜索资料,但是这次需要自己去官网一个个页面点击看,一个个翻译成中文理解吃透;数据格式讲起了就多了,这个主要是在项目流程中慢慢学,或者你有机会去上课,不然你看来也是立马忘记的,主要有sam,vcf,fasta,fastq,bed,gtf,gff,genbank,ensembl,psl等。

三、生信研究领域,各个领域主要是软件繁多,合起来常用的估计有上百个软件了,一般只有从业五六年以上的人才有可能把它们全部用过一遍,而且这也完全需要项目来训练,而不能仅仅是看看软件手册,但是研究领域最重要的是背后的原理,需要看各大牛的综述。

a) 生信基础软件(blast++套件,fastqc,flash,blast,solexaQA,NGS-QC-toolkit,SRA-toolkit,fastx-toolkit)。

b) snp-calling相关软件(bwa,bowtie,samtools,GATK,VarScan.jar,annovar)。

c) 基因组相关软件(velvet,SOAPdenovo2,repeatmasker,repeatscount,piler,orthMCL,inparanoid,clustw,muscle,MAFFT,quickparanoid,blast2go,RAxML,phyML)。

d) 转录组相关软件(trinity,tophat,cufflinks,RseQC,RNAseq,GOseq,MISO,RSEM,khmer,screed,trimmomatic,transDecoder,vast-tools,picard-tools,htseq,cuffdiff,edgeR,DEseq,funnet,davidgo,wego,kobas,KEGG,Amigo,go)。

四、生信应用领域,讲这一块其实已经脱离了生信菜鸟的解释范围了,主要是想说社会上为什么需要搞生信的人才,全是因为在肿瘤筛查,产前诊断,流行病学,个性化医疗等领域有所应用,可以造福人类!这方面政策不确定,产业不定型,所以也这绝对是蓝海,但是也绝对不会有现成的资料直接培训人才,我们必须关注各种微信公众号,逛各种测序,医学相关论坛,紧跟业界精英的脚本,同时追着大牛的文献阅读,如此这般才能保住菜鸟的身份!

阅读全文

与如何自学生物信息相关的资料

热点内容
word中化学式的数字怎么打出来 浏览:746
乙酸乙酯化学式怎么算 浏览:1411
沈阳初中的数学是什么版本的 浏览:1363
华为手机家人共享如何查看地理位置 浏览:1054
一氧化碳还原氧化铝化学方程式怎么配平 浏览:894
数学c什么意思是什么意思是什么 浏览:1422
中考初中地理如何补 浏览:1312
360浏览器历史在哪里下载迅雷下载 浏览:712
数学奥数卡怎么办 浏览:1402
如何回答地理是什么 浏览:1035
win7如何删除电脑文件浏览历史 浏览:1063
大学物理实验干什么用的到 浏览:1494
二年级上册数学框框怎么填 浏览:1713
西安瑞禧生物科技有限公司怎么样 浏览:1006
武大的分析化学怎么样 浏览:1256
ige电化学发光偏高怎么办 浏览:1345
学而思初中英语和语文怎么样 浏览:1667
下列哪个水飞蓟素化学结构 浏览:1430
化学理学哪些专业好 浏览:1493
数学中的棱的意思是什么 浏览:1071