GO/KEGG富集分析泡泡图中为什么基因的数目是小数?
在上次转录组可视化课程中,有位老师看到富集分析泡泡图的图例中的Count
存在小数,于是提出了这么一个问题:为什么基因的数目有小数?
之前没有注意过这个问题,应该是ggplot2
默认的图例生成方式所导致的。
看下面这个代码,根据数据不同,产生同样长度的区间,有时会得到小数,有时会得到整数。
> seq(10,20,length=5)
[1] 10.0 12.5 15.0 17.5 20.0
> seq(10,14,length=5)
[1] 10 11 12 13 14
所以出现在图例中有时会小数、有时会整数。其本身的含义是这么大的点代表的基因数有多少,一般也没有要求必须是整数。不过为了避免误解,这个问题还是要解决一下。
人为根据要呈现的图例间隔数目计算出一个步长,再生成完整图例数字,就全都是整数了。在之前的绘图代码中加上下面的代码就可以了:
min = min(data[[size_variable]])
max = max(data[[size_variable]])
# 4 is length
step = ceiling((max-min)/4)
p <- p + scale_size_continuous(breaks=seq(min, max, by=step))
这样出来的图就没问题了。这也更新到了我们的高颜值在线绘图平台。
往期精品(点击图片直达文字对应教程)
后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集
评论