Ⅰ 如何向NCBI提交基因组序列
1.整理序列信息:包括病原采集地、病原的寄主、寄主症状、采集人等基本信息;还有序列分析结果,包括序列全长大小,开放阅读框(ORF)的长度、位置及特定ORF序列翻译的氨基酸序列等基因水平的信息,这对于接下来的快速准确提交序列及提交成功后为全世界其他作者准确全面分享此类信息很重要;
2.登陆BackIt站点,注意到页面右边的“Sign in to use BankIt”标签,点击登录进入。如果没有账号就注册一个(注意,此账号与NCBI账号不通用)。
附 注册账号步骤,需要填写的项目为:
Title:你的职位或头衔
First name:名
last name:姓
login:登陆名
Affiliation:所属机构地址,一般填写自己学校地址
E-mail Address:通信电邮,填完后会发随机密码到此电邮地址,使用随机密码进行登陆,当然登陆后可对密码进行重置;
3.登陆BankIt,看到如下图所示界面,此时NCBI会自动分配一个SubmissionID,但不是最终的提交序列ID:
接下来共有九个步骤(好事多磨):
3.1 Contact Information
填写个人姓名、机构、电邮等资料集联系方式,如果错误该页会有ERROR提示直到正确填写,填写完毕点击CONTINUE;
3.2 Reference
填写参考作者信息(Reference author)及序列相关信息,比如该序列是否对应有文章,如单纯提交序列则只需选择Unpublished即可(Reference title项可以填入“Direct Submission”),有的话就填写已发表文章的信息(卷、期等),接下来会问你该序列的提交者是否是序列的发现者等信息,填写完毕点击CONTINUE;
※提示:新版的BankIt中,接下来会有“Sequencing Technology”一项,呈现有454、Illumina、SOLiD及Other等测序方法选择,目前为“Sanger dideoxy sequencing”即一代测序方法测序,并且所提交的序列均为“assembled sequences”,目前的“assembly program”为“Lasergene,version 7.0”。
3.3 Nucleotide
包括三个小项:Submission Release Date(期望NCBI什么时候公布你的序列)、16S
rRNA submissions(该序列是否为16S rRNA)、Sequence(s) and Definition
Line(s)(会提示问你该序列是否为全长genomic
DNA、线状或环状等、序列长度,需要复制序列或提交FASTA格式文件),如若序列长度与复制序列或FASTA文件长度不同则会有提示,需要重新提交序列,依次选择即可。一般选择“Immediately after Processing”,“非16S rRNA”,“genomic DNA”,“circular”,“complete”等信息,然后将全序列粘贴到下方的空格中,别忘了在上方写上总核苷酸数。完后审查看有没有错误,继续CONTINUE;
3.4 Organism
填写Organism(病原物)的名字,即序列公开显示时候的标题(如MYVYNV分离物序列“Malvastrum yellow vein Yunnan virus isolate SC226-5, complete genome"),点击CONTINUE后会出现自动检索项目,核对后(有可能会进行选择)继续CONTINUE;
3.5 Submission Category
提交范畴,是否直接提交或通过第三方Annotation提交(不是太清楚什么意思,可能指的是从EMBL和DDBJ中导入的数据吧),一般为直接提交,如下图示选择Original,继续CONTINUE;
3.6 Source modifier
选择该病原物的种类,比如质粒、线粒体等;
Source
modifier下拉菜单及后面的Value设置:进一步选择该病原物获取信息,比如Country、Host、Clone、Collection
date、Strain/Isolate等,至少三项(Organelle/Location为细胞器/位置,该项可以不填写),否则该项不通过,尽量信息全面真实,需要继续添加则点击Add,填写完毕查看下方已填写表格进行信息核对,然后CONTINUE;
3.7 Primers
PCR引物项目,可选项目,不想填写可CONTINUE;
3.8 Features(※)
该步骤重要!将用到之前准备的内容,比如序列内ORFs等信息的填写,并根据之前的选项来填写该步骤,比如需要将DNA翻译为氨基酸序列并进行复制粘贴等,该步操作只需将之前准备信息录入即可,比较耗时;
点击下方“ADD”键,页面将切换为↓
在这里我们需要录入更多与该序列有关的信息,最主要的就是录入之前已经整理好的序列里面的开放阅读框(ORF)信息:Genetic Code设置为”Standard“,5'和3'都勾选上,Protein Name/Protein Description项都填写,将特定区域(ORF)的核苷酸序列翻译为氨基酸序列后(除去末端的终止子)复制到下方的”Amino Acid Sequence“框中,依次录入即可。在这里越详细越好,具体参照实际操作;
3.9 Review and Correct
对已填写信息进行复核及提交,并被告知在2个工作日之内会收到NCBI电邮,需要进一步对序列进行审查核对;
4.至此,基本序列提交已经完工,剩下的事情就是等待审核,大概两个工作日后会收到来自NCBI工作人员的电邮,如有问题会通知你进一步修改信息直到完全无误,包括以后的接受序列号,即你的序列会出现在NCBI里面世界上唯一的一个界面里。
Ⅱ 如何向NCBI提交序列
1.整理序列信息:包括病原采集地、病原的寄主、寄主症状、采集人等基本信息;还有序列分析结果,包括序列全长大小,开放阅读框(ORF)的长度、位置及特定ORF序列翻译的氨基酸 序列等基因水平的信息,这对于接下来的快速准确提交序列及提交成功后为全世界其他作者准确全面分享此类信息很重要;
2.登陆BackIt站点,注意到页面右边的“Sign in to use BankIt”标签,点击登录进入。如果没有账号就注册一个(注意,此账号与ncbi 账号不通用)。
附 注册账号步骤,需要填写的项目为:
Title:你的职位或头衔
First name:名
last name:姓
login:登陆名
Affiliation:所属机构地址,一般填写自己学校地址
E-mail Address:通信电邮,填完后会发随机密码到此电邮地址,使用随机密码进行登陆,当然登陆后可对密码进行重置;
3.登陆BankIt,看到如下图所示界面,此时NCBI会自动分配一个SubmissionID,但不是最终的提交序列ID:
接下来共有九个步骤(好事多磨):
3.1 Contact Information
填写个人姓名、机构、电邮等资料集联系方式,如果错误该页会有ERROR提示直到正确填写,填写完毕点击CONTINUE;
3.2 Reference
填写参考作者信息(Reference author)及序列相关信息,比如该序列是否对应有文章,如单纯提交序列则只需选择Unpublished即可(Reference title项可以填入“Direct Submission”),有的话就填写已发表文章的信息(卷、期等),接下来会问你该序列的提交者是否是序列的发现者等信息,填写完毕点击CONTINUE;
※提示:新版的BankIt中,接下来会有“Sequencing Technology”一项,呈现有454、Illumina、SOLiD及Other等测序方法选择,目前为“Sanger dideoxy sequencing”即一代测序方法测序,并且所提交的序列均为“assembled sequences”,目前的“assembly program”为“Lasergene,version 7.0”。
Ⅲ 转录组测序所得的数据,怎样传到NCBI的SRA数据库
xshell连接NCBI服务器 输入命令 ftp
连接成功后输入账号 密码
mkdir命令创建一个文件夹,以你的BioProject accession命名
FTP 连接成功后连接成功后
进入刚才建立的BioProject文件夹
把原始数据拖进去即可
传输过程中,如果一定时间(五分钟?)没有激活传输界面,可能会导致连接断开
进度可能会一直停在99%,重新连接成功后,也一直卡在99%,不过似乎数据还是上传成功了的
传输成功的会显示linked,同时FTP里对应的文件会消失 传输成功的会显示linked,同时FTP里对应的文件会消失
全部文件夹都传输成功了会变成queued
然后就等NCBI处理了
Ⅳ 如何向NCBI提交测序数据
许多期刊在文章发表之前需要在文章中有序列的登录号,并且要求你在文章发表时,序列可以被读者索取。
NCBI的GenBank提供了两个投递方式:
1、在线投递-BankIt,特点是比较方便。
2、本地投递文件生成程序——Sequin。目前NCBI seqin有MAC, PC和UNIX不同版本。其输出文件需要你通过电子邮件发给NCBI.
另外,上面所述一般适用于研究单个或多个功能基因的情况。如果大规模的测序如EST、 STS和GSS序列分别有专门的投递途径。
另外,提醒你的两个问题:
1、对你所投序列所属物种分类(拉丁名)要有所了解,这通常是出错的地方(seqin)
2、在你投递序列到发表文章之间,要注意NCBI发给你的电子邮件,它会询问你在什么时间将序列公布。
具体细节你可以浏览参考资料所指连接。
Ⅳ 怎样将微生物菌落分析的宏基因组数据上传到NCBI上
宏基因组学(Metagenomics)又叫微生物环境基因组学、元基因组学。它通过直接从环境样品中提取全部微生物的DNA,构建宏基因组文库,利用基因组学的研究策略研究环境样品所包含的全部微生物的遗传组成及其群落功能。它是在微生物基因组学的基础上发展起来的一种研究微生物多样性、开发新的生理活性物质(或获得新基因)的新理念和新方法。其主要含义是: 对特定环境中全部微生物的总DNA(也称宏基因组,metagenomic)进行克隆,并通过构建宏基因组文库和筛选等手段获得新的生理活性物质;或者根据rDNA数据库设计引物,通过系统学分析获得该环境中微生物的遗传多样性和分子生态学信息。
Ⅵ 如何将测序数据上传到NCBI的SRA数据库
一般上传数据到NCBI SRA的过程需要6步:
1、Create a BioProject for this research
2、Create a BioSample submission for your biological sample(s)
3、Gather Sequence Data Files
4、Enter Metadata on SRA website
a、Create SRA submission
b、Create Experiment(s) and link to BioProject and BioSample
c、Create Run(s)
5、Transfer Data files to SRA
6、Update Submission with PubMed links, Release Date, or Metadata Changes
需要注意的一点是,上传的过程中很多地方一旦保存或提交就不可以修改,尤其是各处的Alias。但是,可以联系NCBI的工作人员修改内容。NCBI的工作效率是很高的,一般不超过48小时,就可以得到确认,并拿到登录号。
Ⅶ 高通量数据怎么上传数据至ncbi
其实很简单, 1.首先建立一个meta file,即包含实验信息的文件 2.将测序的fastq(*.fq或*.fastq)文件准备好,此为原始数据(必须)。 3.将每个fastq文件处理后(去接头,合并相同序列)的序列整理为SEQ COUNT两列的文件即可,此为处理后数据(...