GEO数据库数据下载方法总结 您所在的位置:网站首页 表格下载不下来怎么办 GEO数据库数据下载方法总结

GEO数据库数据下载方法总结

2023-10-24 05:38| 来源: 网络整理| 查看: 265

GEO数据下载

GEO是生信分析经常用到的数据库。经常需要从中获取表达矩阵,平台信息,meta信息等,本博文总结了几种下载GEO数据的方法,各有优劣,实际应用过程中自行选择适合自己的。

方法一:直接从浏览器中下载,手动

以数据集GSE1001为例, 在这里插入图片描述 可以直接点击“Series Matrix Files”获取该样本txt格式的表达谱数据,一般我们认为这种处理过的表达谱数据是没有问题的,当然,具体情况具体分析。 打开下载的文件可以看到许多“#”开头的行,这些是注释信息,一般关注这些注释信息中的“data processing”,这行中可以看到数据是如何归一化和标准化的,以及是否已经经过log转化等。 之后我们需要下载平台数据以注释表达谱中的探针,点击“GPL85”,点击下图中的红框, 在这里插入图片描述 之后可以用R进行表达谱和平台数据的合并。

注意!到这里我们获得的只是初步的表达数据,还没有经过预处理,需要用R处理多个探针对应一个表达值,无对应symbol,以及合并多个探针对应一个symbol的情况后才可进行后续分析。

优缺点:

优点:该方法的优点是下载较快,数据也比较完整。 缺点:无法直接得到metadata,需要手动通过GEO2R获取,或在表达谱的注释信息中寻找。

方法二:代码下载,自动化

常用的R包有GEOquery,直接copy了“生信技能树”的代码,以下代码直接将表达谱封装成expression set对象,这有一个非常显著的优点即可以直接导入limma进行差异分析。

downGSE


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有