r语言热图对列不进行聚类_什么是热图以及如何使用R画热图

什么是热图

当我有一个二维矩阵，例如：TCGA-97-7938-01ATCGA-55-7574-01ATCGA-05-4250-01ATCGA-95-A4VK-01ATCGA-97-A4M6-01A

TSPAN65.207884.414375.875945.048486.7465

TNMD-1.82696-6.55213-4.05143-5.51472-3.93795

DPM14.47213.9884.990233.578924.2579

SCYL33.994453.578443.009754.429264.62895

C1orf1122.187512.794383.10662.255672.56278

这是一个TCGA肺腺癌的基因表达谱(logCPM，前5个基因、5个样本)。我想以直观的方式观察这个二维矩阵，怎么办？

这个时候就要用到热图了。这个矩阵的热图(前50个基因、50个样本)：

图一

细心的看官会看出来这个热图跟在文献中见到的热图有点不一样，在文献中见到的热图是这样的：

图二

这是为什么呢？原来在图一中直接看很难看出什么信息，有人就想啊，能不能对行和列进行排序，把相似的排到一起这样不就能直观地反应信息了吗？当然排序的方法有很多，你可以自己排，也可以使用聚类的方法。所谓聚类的方法就是对行列(可以都聚类，也可以只对行聚类，或者只对列聚类)进行聚类，把聚到同一类的放到一起。图二就是对样本和基因都进行了层次聚类，距离较近的放到一起。

R语言如何画热图

R语言能画热图的方法有很多，本文介绍如何使用 pheatmap 画热图。 pheatmap 包很简单，整个包只有一个函数 pheatmap ，下面我们就来看看这个函数的用法。

导入包并加载数据

library(pheatmap)

exp

如何画出带聚类的热图

pheatmap(exp)

如何画出不带聚类的热图

pheatmap(exp, cluster_rows = FALSE, cluster_cols = FALSE)

如果样本已经有分组结果该怎么展示

很多情况下，我们的样本已经分好组了。例如，现在我们的样本前25个属于 clsuter1 ，后25个属于 cluster2 。

cls

print(cls)

[1] "cluster1" "cluster1" "cluster1" "cluster1" "cluster1" "cluster1" "cluster1" "cluster1"

[9] "cluster1" "cluster1" "cluster1" "cluster1" "cluster1" "cluster1" "cluster1" "cluster1"

[17] "cluster1" "cluster1" "cluster1" "cluster1" "cluster1" "cluster1" "cluster1" "cluster1"

[25] "cluster1" "cluster2" "cluster2" "cluster2" "cluster2" "cluster2" "cluster2" "cluster2"

[33] "cluster2" "cluster2" "cluster2" "cluster2" "cluster2" "cluster2" "cluster2" "cluster2"

[41] "cluster2" "cluster2" "cluster2" "cluster2" "cluster2" "cluster2" "cluster2" "cluster2"

[49] "cluster2" "cluster2"

这个时候就要用到 annotation 参数了( annotation_row 或 annotation_col )。

使用 annotation 需要注意的是：参数的值必须是 data.frame

data.frame 的行名必须跟需要 annotation 的行或列一致。

names(cls)

pheatmap(exp, cluster_cols = FALSE, annotation_col = data.frame(cls = cls))

图三

annotation可不可以有多个

细心的看官又发现了，既然 annotation 是一个 data.frame ，那如果我的 data.frame 有多列会是什么效果呢？

比如，我不但有样本分组，我还知道每个样本的肺腺癌亚型：

subtype = c(rep("Lepidic", 10), rep("Acinar", 40))

names(subtype) = colnames(exp)

pheatmap(exp, cluster_cols = FALSE, annotation_col = data.frame(cls = cls, subtype = subtype))

图四

原文链接：https://blog.csdn.net/weixin_35981628/article/details/112998520