数据降维效果不好?试试前沿算法UMAP! 您所在的位置:网站首页 如何安装flowjo 数据降维效果不好?试试前沿算法UMAP!

数据降维效果不好?试试前沿算法UMAP!

2023-08-13 05:09| 来源: 网络整理| 查看: 265

对同一组数据分别进行tSNE和UMAP降维,该数据为多达30万个从8种不同组织富集得到的T细胞和NK细胞的样本,并使用Phenograph聚类把细胞分为6大类,每种颜色代表一种细胞。从图中可以看出,UMAP和tSNE都可以较好地把不同类别的细胞分开。但tSNE倾向于把相同细胞群划分为更多的群,如图显示,黑色圈中CD8 T细胞,在tSNE结果中,群数更多,距离更远。

同样这组数据用组织来源对UMAP和t-SNE图上细胞的进行颜色区分,可以观察到一个有意思的现象。与UMAP相比,t-SNE更加倾向于根据它们的来源来分离总体细胞。而 UMAP则会兼顾细胞群的类别和来源来排列,如图中在CD4 T细胞和CD8 T细胞群内,细胞的排列与来源也会有一定的规律性,都是大致从脐带血(CB)和外周血单核细胞(PBMC),到肝脏(Liver)和脾脏(Spleen),最后到一端的扁桃或另一端的皮肤(Skin)、肠道(Gut)和肺(Lung)。

通过驻留记忆T细胞标志物CD69/CD103、记忆T细胞标志物CD45 RO和naïve T细胞标志物CCR7表达群的分布,可以观察到UMAP可以展示出T细胞连续的分化阶段。而tSNE结果中,这些群之间也是连续的,但是却没有非常明显的沿轴结构。同样的现象也在造血细胞系统中被观察到。由此可见, UMAP在大数据集的处理时可以展现细胞集群的连续性。

2.UMAP具有更好的可重复性

对三组数据(Samusik、Wong、Han_400k)分别进行数据随机降低至100-200,000之间不同的数量级,形成小数据集。纵轴为小数据集与原始数据集的相关性,代表降维方法在不同数据量上的可重复性。UMAP表现最好,数据集越大,优势越明显。

BD FlowJo®和SeqGeq™整合了UMAP功能

相信未来随着流式和单细胞测序技术的发展,数据会达到更大的量级,而UMAP也会在降维有更多的应用。BD旗下数据分析软件FlowJo® 和SeqGeq™,一直紧跟前沿科学研究,不断丰富功能。在数据降维方面,具有如PCA、opt-SNE、FIt-SNE、TriMAP等多种经典降维工具。

在UMAP出现之初,便被整合成插件,通过UMAP插件安装,FlowJo®和SeqGeq™均可使用UMAP进行降维。在未来,通过插件库的更新的形式,FlowJo®和SeqGeq™也将继续为大家提供更多前沿热点的功能!快来体验吧!

培训端口:

*我们将在确认您的报名信息后为您开放培训权限。

关注我们

版权声明和使用限制

本微信公众号归属BD,使用本账号或从本账号下载内容都表明您同意遵守以下声明:本账号包含的所有内容,包括但不限于内容的选择、结构或设计均由BD或其许可方所有,且受著作权法等其他知识产权法和反不正当竞争法的保护。未经BD事先书面同意,不得以任何方式修改、复印、复制、上传、发布、传输或散布本网站的全部或部分内容,包括任何代码和软件。您仅能出于个人目的从本网站下载内容,除非您同时满足以下条件才能以商业目的下载并使用本网站的内容:(1)未对该等内容作任何修改;(2)保留所有的版权和其他所有权声明;(3)已经获得BD事先书面同意;(4)并且当您展示或以其他方式使用该内容时,必须标注“经BD同意使用”。 返回搜狐,查看更多



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有