基于小鼠的基因集数据库资源(人鼠基因集比较)

问题

https://mp.weixin.qq.com/s/DgF0v1vQj65BPCvAFfZjQw

找出

  • 人基因集的基因数量
  • 小鼠基因集的基因数量
  • 两个基因集overlap数量
  • 人特有的基因数量
  • 小鼠特有的基因数量

思路

将人鼠的基因转化为同源ID,使用同源id 来找overlap 和特异基因。没有对应的同源id,转化为gene symbol ,根据大小写来比较(虽然我觉得,找不到同源id,很大可能不是同源基因了,它们的gene symbol估计也不一样,不过以防万一,还是比较一下。。。)

library(homologene)
library(org.Hs.eg.db)
library(org.Mm.eg.db)

geneid2symbol <- function(gene.id, OrgDb){
   
   
  id.df <- AnnotationDbi::select(OrgDb,  keys = gene.id, 
                          keytype = "ENTREZID", 
                          columns = c("SYMBOL"))
  return(id.df$SYMBOL)
}

Hs.Hid <- lapply(Hs.H, function(genes){
   
   
  h.data <- h