prefetch下载SRA 数据

1. SRA数据库简单介绍

序列读取档案（SRA）存储来自“下一代”测序技术的原始序列数据，包括Illumina、454、IonTorrent、Complete Genomics、PacBio和Oxford纳米孔。除了原始序列数据外，SRA现在还以读取位置的形式在参考序列上存储对齐信息。

官网地址下载系统对应的文件

解压：

tar xzvf sratoolkit.2.11.1-centos_linux64.tar.gz

进入bin目录运行如下命令进行配置

./vdb-config --interactive

vim ~/.bashrc
# 最后一行加入 export PATH=sratoolkit_bin_dir:$PATH
source ~/.bashrc 立即生效

prefetch -p SRR62322

-o -O 参数分别指定下载文件名称和目录。

prefetch --option-file file.txt

SRA的表型数据可以到NCBI的SRA Entrez搜索查看，也可以下载，如下图。

双端测序，加--split-files参数

fastq-dump --split-files SRR6232298.sra

fastq-dump参考文档： fastq-dump官方教程