Ⅰ 如何向NCBI提交基因組序列
1.整理序列信息:包括病原採集地、病原的寄主、寄主症狀、採集人等基本信息;還有序列分析結果,包括序列全長大小,開放閱讀框(ORF)的長度、位置及特定ORF序列翻譯的氨基酸序列等基因水平的信息,這對於接下來的快速准確提交序列及提交成功後為全世界其他作者准確全面分享此類信息很重要;
2.登陸BackIt站點,注意到頁面右邊的「Sign in to use BankIt」標簽,點擊登錄進入。如果沒有賬號就注冊一個(注意,此賬號與NCBI賬號不通用)。
附 注冊賬號步驟,需要填寫的項目為:
Title:你的職位或頭銜
First name:名
last name:姓
login:登陸名
Affiliation:所屬機構地址,一般填寫自己學校地址
E-mail Address:通信電郵,填完後會發隨機密碼到此電郵地址,使用隨機密碼進行登陸,當然登陸後可對密碼進行重置;
3.登陸BankIt,看到如下圖所示界面,此時NCBI會自動分配一個SubmissionID,但不是最終的提交序列ID:
接下來共有九個步驟(好事多磨):
3.1 Contact Information
填寫個人姓名、機構、電郵等資料集聯系方式,如果錯誤該頁會有ERROR提示直到正確填寫,填寫完畢點擊CONTINUE;
3.2 Reference
填寫參考作者信息(Reference author)及序列相關信息,比如該序列是否對應有文章,如單純提交序列則只需選擇Unpublished即可(Reference title項可以填入「Direct Submission」),有的話就填寫已發表文章的信息(卷、期等),接下來會問你該序列的提交者是否是序列的發現者等信息,填寫完畢點擊CONTINUE;
※提示:新版的BankIt中,接下來會有「Sequencing Technology」一項,呈現有454、Illumina、SOLiD及Other等測序方法選擇,目前為「Sanger dideoxy sequencing」即一代測序方法測序,並且所提交的序列均為「assembled sequences」,目前的「assembly program」為「Lasergene,version 7.0」。
3.3 Nucleotide
包括三個小項:Submission Release Date(期望NCBI什麼時候公布你的序列)、16S
rRNA submissions(該序列是否為16S rRNA)、Sequence(s) and Definition
Line(s)(會提示問你該序列是否為全長genomic
DNA、線狀或環狀等、序列長度,需要復制序列或提交FASTA格式文件),如若序列長度與復制序列或FASTA文件長度不同則會有提示,需要重新提交序列,依次選擇即可。一般選擇「Immediately after Processing」,「非16S rRNA」,「genomic DNA」,「circular」,「complete」等信息,然後將全序列粘貼到下方的空格中,別忘了在上方寫上總核苷酸數。完後審查看有沒有錯誤,繼續CONTINUE;
3.4 Organism
填寫Organism(病原物)的名字,即序列公開顯示時候的標題(如MYVYNV分離物序列「Malvastrum yellow vein Yunnan virus isolate SC226-5, complete genome"),點擊CONTINUE後會出現自動檢索項目,核對後(有可能會進行選擇)繼續CONTINUE;
3.5 Submission Category
提交范疇,是否直接提交或通過第三方Annotation提交(不是太清楚什麼意思,可能指的是從EMBL和DDBJ中導入的數據吧),一般為直接提交,如下圖示選擇Original,繼續CONTINUE;
3.6 Source modifier
選擇該病原物的種類,比如質粒、線粒體等;
Source
modifier下拉菜單及後面的Value設置:進一步選擇該病原物獲取信息,比如Country、Host、Clone、Collection
date、Strain/Isolate等,至少三項(Organelle/Location為細胞器/位置,該項可以不填寫),否則該項不通過,盡量信息全面真實,需要繼續添加則點擊Add,填寫完畢查看下方已填寫表格進行信息核對,然後CONTINUE;
3.7 Primers
PCR引物項目,可選項目,不想填寫可CONTINUE;
3.8 Features(※)
該步驟重要!將用到之前准備的內容,比如序列內ORFs等信息的填寫,並根據之前的選項來填寫該步驟,比如需要將DNA翻譯為氨基酸序列並進行復制粘貼等,該步操作只需將之前准備信息錄入即可,比較耗時;
點擊下方「ADD」鍵,頁面將切換為↓
在這里我們需要錄入更多與該序列有關的信息,最主要的就是錄入之前已經整理好的序列裡面的開放閱讀框(ORF)信息:Genetic Code設置為」Standard「,5'和3'都勾選上,Protein Name/Protein Description項都填寫,將特定區域(ORF)的核苷酸序列翻譯為氨基酸序列後(除去末端的終止子)復制到下方的」Amino Acid Sequence「框中,依次錄入即可。在這里越詳細越好,具體參照實際操作;
3.9 Review and Correct
對已填寫信息進行復核及提交,並被告知在2個工作日之內會收到NCBI電郵,需要進一步對序列進行審查核對;
4.至此,基本序列提交已經完工,剩下的事情就是等待審核,大概兩個工作日後會收到來自NCBI工作人員的電郵,如有問題會通知你進一步修改信息直到完全無誤,包括以後的接受序列號,即你的序列會出現在NCBI裡面世界上唯一的一個界面里。
Ⅱ 如何向NCBI提交序列
1.整理序列信息:包括病原採集地、病原的寄主、寄主症狀、採集人等基本信息;還有序列分析結果,包括序列全長大小,開放閱讀框(ORF)的長度、位置及特定ORF序列翻譯的氨基酸 序列等基因水平的信息,這對於接下來的快速准確提交序列及提交成功後為全世界其他作者准確全面分享此類信息很重要;
2.登陸BackIt站點,注意到頁面右邊的「Sign in to use BankIt」標簽,點擊登錄進入。如果沒有賬號就注冊一個(注意,此賬號與ncbi 賬號不通用)。
附 注冊賬號步驟,需要填寫的項目為:
Title:你的職位或頭銜
First name:名
last name:姓
login:登陸名
Affiliation:所屬機構地址,一般填寫自己學校地址
E-mail Address:通信電郵,填完後會發隨機密碼到此電郵地址,使用隨機密碼進行登陸,當然登陸後可對密碼進行重置;
3.登陸BankIt,看到如下圖所示界面,此時NCBI會自動分配一個SubmissionID,但不是最終的提交序列ID:
接下來共有九個步驟(好事多磨):
3.1 Contact Information
填寫個人姓名、機構、電郵等資料集聯系方式,如果錯誤該頁會有ERROR提示直到正確填寫,填寫完畢點擊CONTINUE;
3.2 Reference
填寫參考作者信息(Reference author)及序列相關信息,比如該序列是否對應有文章,如單純提交序列則只需選擇Unpublished即可(Reference title項可以填入「Direct Submission」),有的話就填寫已發表文章的信息(卷、期等),接下來會問你該序列的提交者是否是序列的發現者等信息,填寫完畢點擊CONTINUE;
※提示:新版的BankIt中,接下來會有「Sequencing Technology」一項,呈現有454、Illumina、SOLiD及Other等測序方法選擇,目前為「Sanger dideoxy sequencing」即一代測序方法測序,並且所提交的序列均為「assembled sequences」,目前的「assembly program」為「Lasergene,version 7.0」。
Ⅲ 轉錄組測序所得的數據,怎樣傳到NCBI的SRA資料庫
xshell連接NCBI伺服器 輸入命令 ftp
連接成功後輸入賬號 密碼
mkdir命令創建一個文件夾,以你的BioProject accession命名
FTP 連接成功後連接成功後
進入剛才建立的BioProject文件夾
把原始數據拖進去即可
傳輸過程中,如果一定時間(五分鍾?)沒有激活傳輸界面,可能會導致連接斷開
進度可能會一直停在99%,重新連接成功後,也一直卡在99%,不過似乎數據還是上傳成功了的
傳輸成功的會顯示linked,同時FTP里對應的文件會消失 傳輸成功的會顯示linked,同時FTP里對應的文件會消失
全部文件夾都傳輸成功了會變成queued
然後就等NCBI處理了
Ⅳ 如何向NCBI提交測序數據
許多期刊在文章發表之前需要在文章中有序列的登錄號,並且要求你在文章發表時,序列可以被讀者索取。
NCBI的GenBank提供了兩個投遞方式:
1、在線投遞-BankIt,特點是比較方便。
2、本地投遞文件生成程序——Sequin。目前NCBI seqin有MAC, PC和UNIX不同版本。其輸出文件需要你通過電子郵件發給NCBI.
另外,上面所述一般適用於研究單個或多個功能基因的情況。如果大規模的測序如EST、 STS和GSS序列分別有專門的投遞途徑。
另外,提醒你的兩個問題:
1、對你所投序列所屬物種分類(拉丁名)要有所了解,這通常是出錯的地方(seqin)
2、在你投遞序列到發表文章之間,要注意NCBI發給你的電子郵件,它會詢問你在什麼時間將序列公布。
具體細節你可以瀏覽參考資料所指連接。
Ⅳ 怎樣將微生物菌落分析的宏基因組數據上傳到NCBI上
宏基因組學(Metagenomics)又叫微生物環境基因組學、元基因組學。它通過直接從環境樣品中提取全部微生物的DNA,構建宏基因組文庫,利用基因組學的研究策略研究環境樣品所包含的全部微生物的遺傳組成及其群落功能。它是在微生物基因組學的基礎上發展起來的一種研究微生物多樣性、開發新的生理活性物質(或獲得新基因)的新理念和新方法。其主要含義是: 對特定環境中全部微生物的總DNA(也稱宏基因組,metagenomic)進行克隆,並通過構建宏基因組文庫和篩選等手段獲得新的生理活性物質;或者根據rDNA資料庫設計引物,通過系統學分析獲得該環境中微生物的遺傳多樣性和分子生態學信息。
Ⅵ 如何將測序數據上傳到NCBI的SRA資料庫
一般上傳數據到NCBI SRA的過程需要6步:
1、Create a BioProject for this research
2、Create a BioSample submission for your biological sample(s)
3、Gather Sequence Data Files
4、Enter Metadata on SRA website
a、Create SRA submission
b、Create Experiment(s) and link to BioProject and BioSample
c、Create Run(s)
5、Transfer Data files to SRA
6、Update Submission with PubMed links, Release Date, or Metadata Changes
需要注意的一點是,上傳的過程中很多地方一旦保存或提交就不可以修改,尤其是各處的Alias。但是,可以聯系NCBI的工作人員修改內容。NCBI的工作效率是很高的,一般不超過48小時,就可以得到確認,並拿到登錄號。
Ⅶ 高通量數據怎麼上傳數據至ncbi
其實很簡單, 1.首先建立一個meta file,即包含實驗信息的文件 2.將測序的fastq(*.fq或*.fastq)文件准備好,此為原始數據(必須)。 3.將每個fastq文件處理後(去接頭,合並相同序列)的序列整理為SEQ COUNT兩列的文件即可,此為處理後數據(...