简介
ICGC(International Cancer Genome Consortium)数据库,收集了50种不同癌种的基因表达数据、体细胞突变数据(单核苷酸突变和拷贝数变异)、临床信息。ICGC囊括了TCGA、TARGET等数据库中的相关数据。
如何从ICGC中下载数据?
1、ICGC主页中选择“DCC Data Releaseds”,进入如下页面

- 我们可以看到不同时间版本的数据,一般选择最新版本,点击“current”—“Projects”
2、在如下页面中选择需要的数据集

- 前列腺癌PRAD的数据集有图中所示的5个,其中有一个来自TCGA
3、以PRAD-TCGA数据集为例

donor.PRAD-US.tsv.gz:临床数据
exp_seq.PRAD-US.tsv.gz:测序数据
补充
1、ICGC和TCGA数据库的区别?
ICGC数据库是个国际肿瘤基因组协作组,是一个全球性的合作数据库,包含的样本是来自不同国家和地区;TCGA数据库是美国国立癌症研究所的数据库,只有来自美国的样本
ICGC数据库中包含TCGA的数据
在生信研究时,ICGC数据库经常作为验证数据集
版权声明:本文为weixin_59289660原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。