1. 為什麼學習生物信息學要學習linux系統的基本操作
如果我猜的沒錯的話,應該是你學習的這個學科中,需要使用的軟體只提供Linux版本,我也學了很多需要用Linux來運行模擬和分析軟體的學科,一般只要你學會如何打開和執行軟體就可以了
2. 生物信息分析伺服器首選哪個版本的Linux
看你要不要用桌面,一般ubuntu的桌面做的好;不需要桌面的用centos或者redhat
免費提供最新Linux技術教程書籍,入門自學書籍《linux就該這么學》,為開源技術愛好者努力做得更多更好
3. 為什麼很多科研工作者用unix/linux系統而不是windows做生物信息學
linux速度快啊,很老的機器都可以跑linux,windows就不行
linux自由,可以自己裁剪、編譯內核,可以自己定製、編譯文件系統,可大可小。很多路由器就幾M的存儲空間,可以運行linux,裝個windows試試。
linux有強大的命令行shell。比如要替換所有文件中的某個關鍵詞,一個命令就完成了。
linux開放,本身源代碼公開,linux上跑的絕大多數軟體都是開源的
linux是免費的
4. linux哪個版本比較好,求大神分析
Debian。
有幾個優點:
1:包多:比Fedora多,有很多生物信息學工具。
2:支持時間長,不像其它一些linux,一年多就停止維護,逼你升級大版本。
3:如果使用stable,可以獲得良好的穩定性。如果使用testing,可以獲得比較新的包。
5. 生信為什麼用linux
因為Linux 系統在很多方面都比 Windows 具有優勢。例如:節省內存、系統的穩定性要比 Windows 好得多。Linux 系統尤其適合搭建各類伺服器。
6. 學習生物信息學,需要配置怎樣的電腦呢
首先的問題的是,我們需要什麼樣的計算機。
關於硬體:
需要至少4G內存,最好可以達到16G以上內存;
至少500G硬碟空間。通常一個RNA-seq的數據量為20G左右,如果再加上分析之後的結果,可能達到50G,所以即使你有500G的空間,也分析不了幾組數據。所以硬碟空間越多越好,比如說2TB或者使用高速網路存貯界質。
CPU,至少2核。因為你在運行程序時,通常100%佔到CPU,如果沒有2核,計算機多半會假死在那裡。如果有8核,或者以上更好。
GPU,很多程序開始使用GPU運算,如果能有好的GPU顯卡,也是推薦的,但不是必須的。
為了達到以上的條件,入門極的比如說Mac Pro。進階級的就是獨立server,高級的是supercomputer clusters,支持qsub之類的。或者可以購買雲計算服務。
對於操作系統,在工作站方面,推薦Mac OS。它運行穩定,與LINUX同源。需要下載安裝Xcode和wget就可以了。當然你還可以很方便的安裝office辦公軟體,以及photoshop,AI等工具。最後安裝好R/Bioconctor,就可以開始工作了。如果買了兼容機,可以安裝上Linux/UNIX系統。它在安裝上R/Bioconctor之後基本上就可以了。它的缺點是辦公軟體,繪圖軟體的安裝。最差的就是Windows了。需要安裝比如GCC編譯器,make工具,mingw64, perl, zip/unzip, tar, wget, ghostscript等等。
有了軟體及硬體,接下來的工作就是了解一些常識以武裝你的大腦,這是整個運行環境中最重要的一環。首先,你需要學習了掌握UNIX常用命令,並且不反感字元界面。其次學會安裝,設置及構建網路服務,比如apache的websever,以及mysql的資料庫服務。第三安裝及設置一個Galaxy。當然,第二步及第三步可能會有難度,可以先使用Galaxy本身的服務,但是它有很多限制,所以最好還是自己安裝一個比較好。第四步,學習一門計算機語言,比如c, python, ruby, java等,還有一門腳本式語言工具,比如perl。第五步,學習使用R/Bioconctor。第六步,統計學。
至此,你的NGS分析環境就設置完成了。如果快的話,你可以兩三個月就設置完成,達到起步的階段,之後就是漫長的學習過程。慢的話,四年本科也不一定學到多少。
7. 學習生物信息必須學習unix操作系統嗎
你想怎麼指點?基本上,是必須要掌握unix系統的,因為很多軟體的分析都是在linux下運行的
8. 為什麼生物軟體偏愛linux系統
和高端伺服器選用類UNIX系統是一樣的道理,Linux一直在進化,比起Windows那N久沒啥變化的內核,性能自然好很多。生物分析與大數據並行計算分不開,性能上要求高,不需要Windows那種傻瓜系統,而且真正意義上可以最大限度為操作系統定製軟體的話,肯定是開源的系統更好,可以最大程度的優化,而Windows平台的話只能用微軟提供的開發工具。國外大牛們多用Linux也是重要原因。
9. 生物信息學安裝哪個版本的linux
本人自大三就開始做生物信息,現在即將讀博士,希望我的經驗可以幫助到你。
既然你是想做生物信息學,那麼相關背景什麼的會了解一些,我在這就不多說了。
首先,確定你自己的背景專業,現在很多學校本科都沒有專門的生物信息學專業,都是掛靠在生命學院或者計算機學院的。所以背景專業一般都是生物學或計算機學,不同的專業將來做生信區別會很大。當然,做什麼方向和背景專業並沒有絕對關系。
如果是生物學背景,那麼將來大部分的工作將會是使用專門的生物信息學分析軟體。所以難度會降低。自學的話,主要學幾下幾點就好:
1、一門腳本語言,個人推薦Python(Perl也可以,各有利弊,Python更新興一些)。
2、Linux系統。這個也不是百分百要求,但是專業的生信人,都是用Linux的,而且很多軟體都是不支持Windows的。
3、常用的生物信息學資料庫,這里列出幾個,NCBI,Ensembl,EBI,GENEbank等等,這些資料庫下面還分子資料庫,像GEO,GWAS catalog等。當然,還有方向更細的,像miRBase(miRNA資料庫)等。
4、R,這也是一種編程語言,但更加側重結果的展示,實際上也就是畫圖。
5、常用生信分析軟體,這個沒必要專門去學,需要用到他們的時候再學也不晚,都是很簡單的東西。
如果是計算機背景,那麼以後的工作可能主要是演算法分析,創造新的生信分析軟體,做資料庫等。需要自學的就是以上的那些,再加一門工程語言,C,C++,C#,Java都可以。
10. 生物信息學一些基本的常用軟體有哪些
必學:1、計算機基礎(linux+perl+R 或者 python+matlab)
2、生信基礎知識(測序+資料庫+數據格式)
3、生信研究領域(全基因組,全轉錄組,全外顯子組,捕獲目標區域測序)
4、生信應用領域(腫瘤篩查,產前診斷,流行病學,個性化醫療)
分而治之:
一、計算機基礎,需要看三本書,一步步的學會學通,不需要刻意去找哪個書,一般linux是鳥哥私房菜,perl是小駱駝咯,R是R in action,但是看一本書只能入門,真正想成為菜鳥,必須每個要看五本書以上!我雲盤裡面有這基本上的高清列印版,大家可以去淘寶列印一下才幾十塊錢還包郵,對書比較講究的也可以買正版,也不過是一百多塊錢而已!
二、生信基礎知識,測序方面,在網路文庫找十幾篇一代二代三代測序儀資料仔細研讀,然後去優酷下載各大主流測序儀的動畫講解,再看看陳巍學基因的講解;資料庫先看看三大主流資料庫——NCBI,ENSEMBL,UCSC,還有一些也可以了解一些(uniprot,IMGT,KEGG,OMIN,TIGR,GO)同樣也是網路文庫自己搜索資料,但是這次需要自己去官網一個個頁面點擊看,一個個翻譯成中文理解吃透;數據格式講起了就多了,這個主要是在項目流程中慢慢學,或者你有機會去上課,不然你看來也是立馬忘記的,主要有sam,vcf,fasta,fastq,bed,gtf,gff,genbank,ensembl,psl等等
三、生信研究領域,各個領域主要是軟體繁多,合起來常用的估計有上百個軟體了,一般只有從業五六年以上的人才有可能把它們全部用過一遍,而且這也完全需要項目來訓練,而不能僅僅是看看軟體手冊,但是研究領域最重要的是背後的原理,需要看各大牛的綜述。
a) 生信基礎軟體(blast++套件,fastqc,flash,blast,solexaQA,NGS-QC-toolkit,SRA-toolkit,fastx-toolkit)
b) snp-calling相關軟體(bwa,bowtie,samtools,GATK,VarScan.jar,annovar)
c) 基因組相關軟體(velvet,SOAPdenovo2,repeatmasker,repeatscount,piler,orthMCL,inparanoid,clustw,muscle,MAFFT,quickparanoid,blast2go,RAxML,phyML)
d) 轉錄組相關軟體(trinity,tophat,cufflinks,RseQC,RNAseq,GOseq,MISO,RSEM,khmer,screed,trimmomatic,transDecoder,vast-tools,picard-tools,htseq,cuffdiff,edgeR,DEseq,funnet,davidgo,wego,kobas,KEGG,Amigo,go)