生信人

找回密码
立即注册
搜索
热搜: 活动 交友 discuz
发新帖

0

收听

12

听众

338

主题
发表于 6 天前 | 查看: 7| 回复: 0
[i=s] 本帖最后由 生信喵 于 2024-12-22 20:14 编辑 [/i]

背景

TCGA(The Cancer Genome Atlas)GDC(Genomic Data Commons)data portal 2.0是2024年全新推出的癌症基因组数据共享平台,此版本界面采用了最先进的Web技术,为用户提供了更加直观、互动性强的数据浏览体验。新版界面的设计注重用户友好性,以直观的信息布局和流畅的操作流程,大幅提升了数据检索的效率。

PS:新版功能比较多,详细介绍请查看Release Notes – GDC Docs。

此处,咱们以常规数据下载流程为目的简要介绍:

1. 首页

GDC Data Portal 2.0的标题包含常用链接和功能。
1.png
左上角是 GDC Data Portal 徽标,它链接到 GDC Data Portal 的主页。徽标下方是按以下顺序排列的链接:

• 分析中心:用于访问 GDC 数据门户中所有工具的中心枢纽;

• 项目:允许浏览 GDC 数据门户中的所有项目;

• 队列生成器:队列生成器工具由各种临床和生物样本过滤器组成,用于构建用于分析的自定义队列;

• 存储库:允许浏览与队列关联的文件。

2. 分析中心

对于分析中心(Analysis center),网站提供了很多方便的分析功能,大家可以自行摸索。尤其对于单个基因或者少数基因数据的获取可以基于gene expression clustering获得,不用下载完整的数据。
2.png

3,队列生成器

使用数据分析和数据存储库之前需要通过队列生成器(cohort builder)创建自己感兴趣的cohort,比如TCGA-LIHC,选好之后自定义命名lihc:
3.png

4. 存储库

转到存储库(Repository),选择自己的cohort,选择自己需要的数据类型

4.1 RNA测序数据

filter中勾选策略如下:

Experimental Strategy:RNA-Seq

Data Type:Gene Expression Quantification

Workflow Type:STAR – Counts

前俩选择好就可以了,显示如下,同1.0版本网站,add all files to cart:
4.png

4.2 miRNA数据

Experimental Strategy:miRNA-seq

Data Type:Isoform Expression Quantification(for isoform,包含5p/3p的数据);miRNA Expression Quantification(相当于stem-loop的定量数据,不区分5p/3p)

Workflow Type:BCGSC miRNA Profiling

同上,add all files to cart。

4.3 突变数据

Experimental Strategy:WSX

Data Type:Masked Somatic Mutation

Workflow Type:Aliquot Ensemble Somatic Variant Merging and Masking

同上,add all files to cart。

5. 下载数据

点击右上角购物车(Cart)进入购物车:
5.png

同GDC1.0,咱们需要下载两个文件用于整合数据:Download Cart(Cart)和Download Associated Data(Metadata)。

下载sample sheet用于后续整理。
7.png

如果网页下载cart比较慢,和以前一样,使用gdc-client下载。

windows命令

gdc-client download -m gdc_manifest.2024-12-22.185431.txt

同时还可以下载clinic data,TSV格式和metadata即可。
6.png

下载数据后,就可以进行数据整理了。

收藏回复 显示全部楼层 道具 举报

您需要登录后才可以回帖 登录 | 立即注册

QQ|Archiver|手机版|小黑屋|生信人 ( 萌ICP备20244422号 )

GMT+8, 2024-12-28 01:40 , Processed in 0.069100 second(s), 32 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表