TCGA(the cancer Genome Atlas,肿瘤基因组图谱)计划是由美国National Cancer Institute(NCI)和National Human Genome Research Institute(NHGRI)于2006年联合启动的项目。尽管项目已于2018年4月结束,但其仍在广大生物医学研究人员广泛使用。

经常使用TCGA的小伙伴可能早就发现TCGA网站中有通向GDC的链接,并已经开始使用GDC了。(文章底部有GDC操作视频链接!)

那么GDC是什么呢?

今天小编就来给不太了解GDC的小伙伴简单介绍一下:TCGA的整合分析利器——GDC(Genomic Data Commons)

GDC相当于替代了TCGA Data Portal 这个网站,但它不只包含TCGA的数据,还有TARGET、CGCI及其他CCG计划的数据,并对数据重新进行了整合分析,可以提供统一的癌症基因组数据。

▲网址:gdc.cancer.gov/

GDC(Genomic Data Commons)是美国National Cancer Institute(NCI)的研究计划,使命是为癌症研究界提供统一的数据存储库,以便在癌症基因组研究中共享数据,支持精准医学。它包含几个大规模的癌症基因组研究计划的数据,包括TCGA、OCG。而OCG包括两项支持癌症分子鉴定的计划,TARGET和CGCI。

TCGA、TARGET、CGCI和其他CCG计划提供了对几种人类癌症基因组变化的全面描述。但是,这些内容存在单独的存储库里,格式不同,还有不同的数据管理基础机构。而GDC就是NCI为了统一这些内容而建立的数据共享平台,支持从各种NCI计划获得的标准化基因组数据集的接收、质量控制、整合、存储和再分配。

在GDC,你可以获得高质量的标准化生物样本、临床和分子数据,轻松进行高性能搜索,直接下载并分析临床信息、基因组特征数据,还可对肿瘤基因组数据进行高水平序列分析。

网址:portal.gdc.cancer.gov/

可以看到首页是对TCGA所收录的数据的统计,截至2019年3月26日最新版本V16.0中,TCGA共覆盖人体68个组织/器官的39种癌型及其亚型,45个Projects,33,549个患者,收录的文件总数达到385,483个,所研究的基因和变异数分别为22,872和3,142,246。

GDC包含数据类型有:

总之,GDC是癌症基因组数据研究不可多得的利器,数据也已经更新到V16.0版,小伙伴们快去了解一下。

之前对资料库使用不太了解的小伙伴也不要著急,其明信息的生信产品经理—张丽梅TCGA/GDC资料库做了视频课程,带你熟悉TCGA/GDC页面、学习数据下载操作,并以拷贝数变异(CNV)为例讲解其应用。

视频内容

TCGA/GDC资料库操作及拷贝数变异数据分析

课程大纲:

? TCGA/GDC资料库介绍

? TCGA/GDC资料库操作

? TCGA/GDC应用举例

想要学习的小伙伴,

点击下方观看视频

TCGA资料库介绍及演示_腾讯视频?

v.qq.com
图标

推荐阅读:
相关文章