Ⅰ 生物信息学中甲基化处理使用软件的Bismark是用Windows系统安装使用吗
最好在linux系统,多个线程跑。在windows下,你自己电脑吗?如果是的话,内存占的有点大,而且临时文件近1T
Ⅱ 为什么很多科研工作者用unix/linux系统而不是windows做生物信息学
linux速度快啊,很老的机器都可以跑linux,windows就不行
linux自由,可以自己裁剪、编译内核,可以自己定制、编译文件系统,可大可小。很多路由器就几M的存储空间,可以运行linux,装个windows试试。
linux有强大的命令行shell。比如要替换所有文件中的某个关键词,一个命令就完成了。
linux开放,本身源代码公开,linux上跑的绝大多数软件都是开源的
linux是免费的
Ⅲ 如何自学生物信息学
1,从现有的生物信息学工具开始,要熟悉如何利用先用的软件、网络服务器、数据库等等,为生物研究服务,不要做重复工作,能用现成的就不自己开发。
2,熟悉命令行的操作系统,DOS,Linux,可以编写简单的shell;进而能安装命令行级的程序,跑一些常规的流程。要学习如何寻找和安装软件,这是最重要也是最基本的技能。其实很多问题,如果找到合适的软件包,都是迎刃而解的。
3,熟悉一种简单的脚本语言,个人推荐用python,具体原因可以见我的帖子。在没有现成工具时,或需要数据格式转换时,小的脚本是非常有用的。一般的应用无需自己写太多的代码,要相信我们通常遇到的问题,别的高手可能早就遇到了,所以网络上有大量的工具包。至于更多的编程语言,一门精则门门通,R,perl等都是类似的。
4,熟悉简单的算法和数据结构的知识,这样就可以理解很多程序的内在机制,进而知道它们的优点和缺点,对自己写程序也有帮助。有精力的话,进而学习统计、机器学习等。。
5,在自己的生物领域内扩展,调研,分析,开发。
Ⅳ 学习生物信息学,需要配置怎样的电脑呢
首先的问题的是,我们需要什么样的计算机。
关于硬件:
需要至少4G内存,最好可以达到16G以上内存;
至少500G硬盘空间。通常一个RNA-seq的数据量为20G左右,如果再加上分析之后的结果,可能达到50G,所以即使你有500G的空间,也分析不了几组数据。所以硬盘空间越多越好,比如说2TB或者使用高速网络存贮界质。
CPU,至少2核。因为你在运行程序时,通常100%占到CPU,如果没有2核,计算机多半会假死在那里。如果有8核,或者以上更好。
GPU,很多程序开始使用GPU运算,如果能有好的GPU显卡,也是推荐的,但不是必须的。
为了达到以上的条件,入门极的比如说Mac Pro。进阶级的就是独立server,高级的是supercomputer clusters,支持qsub之类的。或者可以购买云计算服务。
对于操作系统,在工作站方面,推荐Mac OS。它运行稳定,与LINUX同源。需要下载安装Xcode和wget就可以了。当然你还可以很方便的安装office办公软件,以及photoshop,AI等工具。最后安装好R/Bioconctor,就可以开始工作了。如果买了兼容机,可以安装上Linux/UNIX系统。它在安装上R/Bioconctor之后基本上就可以了。它的缺点是办公软件,绘图软件的安装。最差的就是Windows了。需要安装比如GCC编译器,make工具,mingw64, perl, zip/unzip, tar, wget, ghostscript等等。
有了软件及硬件,接下来的工作就是了解一些常识以武装你的大脑,这是整个运行环境中最重要的一环。首先,你需要学习了掌握UNIX常用命令,并且不反感字符界面。其次学会安装,设置及构建网络服务,比如apache的websever,以及mysql的数据库服务。第三安装及设置一个Galaxy。当然,第二步及第三步可能会有难度,可以先使用Galaxy本身的服务,但是它有很多限制,所以最好还是自己安装一个比较好。第四步,学习一门计算机语言,比如c, python, ruby, java等,还有一门脚本式语言工具,比如perl。第五步,学习使用R/Bioconctor。第六步,统计学。
至此,你的NGS分析环境就设置完成了。如果快的话,你可以两三个月就设置完成,达到起步的阶段,之后就是漫长的学习过程。慢的话,四年本科也不一定学到多少。
Ⅳ 生物信息学安装哪个版本的linux
本人自大三就开始做生物信息,现在即将读博士,希望我的经验可以帮助到你。
既然你是想做生物信息学,那么相关背景什么的会了解一些,我在这就不多说了。
首先,确定你自己的背景专业,现在很多学校本科都没有专门的生物信息学专业,都是挂靠在生命学院或者计算机学院的。所以背景专业一般都是生物学或计算机学,不同的专业将来做生信区别会很大。当然,做什么方向和背景专业并没有绝对关系。
如果是生物学背景,那么将来大部分的工作将会是使用专门的生物信息学分析软件。所以难度会降低。自学的话,主要学几下几点就好:
1、一门脚本语言,个人推荐Python(Perl也可以,各有利弊,Python更新兴一些)。
2、Linux系统。这个也不是百分百要求,但是专业的生信人,都是用Linux的,而且很多软件都是不支持Windows的。
3、常用的生物信息学数据库,这里列出几个,NCBI,Ensembl,EBI,GENEbank等等,这些数据库下面还分子数据库,像GEO,GWAS catalog等。当然,还有方向更细的,像miRBase(miRNA数据库)等。
4、R,这也是一种编程语言,但更加侧重结果的展示,实际上也就是画图。
5、常用生信分析软件,这个没必要专门去学,需要用到他们的时候再学也不晚,都是很简单的东西。
如果是计算机背景,那么以后的工作可能主要是算法分析,创造新的生信分析软件,做数据库等。需要自学的就是以上的那些,再加一门工程语言,C,C++,C#,Java都可以。
Ⅵ 生物信息学什么计算机语言
编程语言按照重要程度排序:R语言、Python、Perl。
另外对Linux操作系统必须非常熟悉,因为生物信息学很多软件都在Linux系统运行
Ⅶ 生信为什么用linux
因为Linux 系统在很多方面都比 Windows 具有优势。例如:节省内存、系统的稳定性要比 Windows 好得多。Linux 系统尤其适合搭建各类服务器。
Ⅷ 生物信息学入门,Linux 系统
http://wenku..com/course/view/4fdf50e2524de518964b7d00 这里有视频教程 看看吧