raw data数据上传NCBI的SRA数据库流程(FTP传输) | 您所在的位置:网站首页 › 测序原始数据上传不了 › raw data数据上传NCBI的SRA数据库流程(FTP传输) |
在有些科技论文中需要注明转录组测序的原始数据上传到NCBI的SRA数据库后获得的SRP号,以下是一个总体的流程,根据本人的数据上传经验整理,仅供参考 注册NCBI账号,首页Submit→Quick Start选择Nucleotide Sequence下的Sequence Read Archive(SRA)→GO→New submission新的提交,以下序号对应NCBI流程顺序 1.Submitter提交者 填写First name(名),Last name(姓),两个邮箱(一个可以用qq,163,fox邮箱,另一个可用谷歌,雅虎等邮箱) 2.General Information一般信息 Bioproject(生物项目),Biosample(生物样本),Release date(发布日期)都根据自己的需要选择,一般都需要新建 3.Project Info项目信息 Project title和Public description这两项必填,根据自己的需要填写就可以了 4.Biosample Type生物样本类型 根据自己的生物类型选择 5.Biosample Attributes生物样本属性 选择:Upload a file using Excel or text format that includes the attributes for each of your BioSamples 下载文件:Download Excel或者Download TSV 填表:绿色区域必须都填,蓝色区域至少填一个,黄色区域可不填或删除,不知道的可以填not collected, not applicable or missing,其他注意事项表格里都有。 选择文件:上传→可能会出现错误,按提示修改就可以了 6.SRA Metadata SRA元数据 Upload a file using Excel or text format→Download Excel ★表格填完后要将第二个工作簿单独保存为TSV格式,可以将数据复制到txt中,保存再修改文件拓展名。 许多列都给出了可选项,可以直接选择,platform,instrument-model等可以从结题报告中查询,filename注意把文件格式填完整(注意.gz),不懂的看sheet1的说明和单元格的注释。 7.Files文件 ①下载并安装filezilla软件 ②选择FTP or Aspera Command Line files for this submission ③复制Address,Username,Password分别到filezilla的主机,用户名,密码中,点击快速连接 ④连接成功后,会显示目录读取失败,把Navigate to your account folder cd的:“upload/......”复制到filezilla的远程站点中,并建立子文件夹 ⑤从本地站点中找到需要上传的raw date文件,选中右击上传到子文件夹中 ★因为filezilla的传输速度较慢,且无线网及流量网络都存在断网可能,为了能够断点续传及减少传输失败的次数,必须要修改filezilla的以下设置: 设置-传输-对已存文件的操作-上传:继续文件传输 设置-连接-超时-超时秒数:60s(默认的20s) 设置-连接-重连设置-最大重试次数:99次(调到最大) 设置-连接-重连设置-登录重试延时:90s(调大一点,防止网络不稳定时频繁重连可能被服务器拉黑) ✦注:Filezilla断点续传的使用方式: 文件传输失败后,不要从“传输失败”中重置并重新请求,直接从本地站点中选择未完成的文件再次上传 ⑥所有raw date的文件都上传完成后,select preload folder,选择在远程站点中建立的子文件夹,网页会对上传的数据进行处理,要稍等一会儿。 8.Review & Submit检查和提交 检查页面列出的信息,不对的可以回去修改,确认无误后提交。 需要注意的一点是,上传的过程中很多地方一旦保存或提交就不可以修改,但是可以Email联系NCBI的工作人员修改内容。NCBI的工作效率是很高的,一般不超过48小时,就可以得到确认,并拿到登录号。 以上流程为个人经验,仅供参考 |
CopyRight 2018-2019 实验室设备网 版权所有 |