你做的多组散点图是不是丢失信息了!?

共 2195字,需浏览 5分钟

 ·

2024-07-24 21:00




我们正在做 ImageGP3的升级工作,如果你有兴趣,欢迎添加页尾二维码标识的微信与我们联系,为 ImageGP3 的功能升级、教程写作、宣传推广一起努力!




每个人各尽其力,或一起写代码,或一起写教程,或一起推广,或提出自己的建议。




作为 ImageGP 的合作作者,集思广益,更好的让 ImageGP 为社群做好服务。





高颜值免费在线绘图有个散点图工具,很好用。


假设有下面一组差异基因数据(基因的名字列没有展示),前两列显示的是表达倍数差异,第三列显示的是基因的分组信息。


表头可以是任意合法的字符串,列的顺序也没有限制。


log2FoldChange_X    log2FoldChange_Y    Set_C
2.091 0.269 Diff_0
-2.645 -1.6 Diff_1
-1.837 -0.816 Diff_3
1.23 0.686 Diff_1
-3.785 -1.18 Diff_2
-1.877 -0.956 Diff_3
-2.137 -0.42 Diff_3
-4.332 -2.028 Diff_3
-1.563 -0.788 Diff_3
-1.658 -0.503 Diff_3
-1.088 -0.453 Diff_3
1.071 1.151 Diff_1
-1.368 -0.839 Diff_3
-5.98 -2.978 Diff_3
1.183 0.094 Diff_1
-5.501 -4.017 Diff_3

用这个数据绘制散点图,应该怎么做呢?


按下图粘贴数据、点击 Check Data,选择参数



点击提交,获得结果



这个图有 2 个问题:



  1. 图例里面多了一个 NA,说明我们的分组有一个或多个数据为空。



这个可以在 Excel 中查看,如下图



2. 紫色的点覆盖了其它颜色的点,掩盖住了信息。


这个怎么解决呢?


给点设置透明色


单独给第一个点设置颜色,给透明度看看效果。


为了保持颜色统一,我们通过取色器获得这些颜色。


第一张图是设置第一个颜色为透明色,第二个颜色是正常颜色,后面的颜色设置没有展示,也都是正常颜色。






为了方便设置颜色的顺序,这里首先选择了Color variable order,也顺便把 NA 值的数据给过滤掉了;


然后设置了 5 个颜色,如图,第一个颜色明显的浅很多。



提交后获得结果如下,从图中可以看到确实 Diff_0组的点盖住了其它点,那能不能调下顺序,把Diff_0组的点调到最下面呢?



控制不同组的点绘制的顺序


绘图时默认每个组绘制的顺序取决于组第一次出现的顺序,如我们示例数据Diff_0是第 1 条,则这个组的点出现在图的最上面,覆盖其它点;


然后是Diff_1, Diff_3, Diff_2, Diff_4


如果你想让Diff_0出现在最底部,把第一行数据后移,保证前面的行中Diff_1, Diff_3, Diff_2, Diff_4都出现过 1 次。


这是一个方法。


不过我们对程序做了更新,可以通过Color variable order来控制点的绘制顺序,与图例的顺序保持一致。


图例中第一组点出现在最上面,然后是第二、三、四组点。


Color variable order下拉框中,按顺序选择Diff_1, Diff_2, Diff_3, Diff_4, Diff_0,最终效果如下图:



然后点击提交,看到不一样的模式出来了。


Diff_1, Diff_2, Diff_3, Diff_4 4 组的模式呈现了出来。


Diff_0放到了最下面。



通过分面解决点的重合


有时如果你不知道数据是不是被覆盖了,怎么办?


我们也可以设置分面,看下每一组数据的分布规律,再决定绘制顺序。


黄色高亮的参数是我们设置的参数,如下图:



点击提交后,看结果,整体分布模式与把Diff_0放在最下面出现的分布模式是一致的。







高颜值免费 SCI 在线绘图(点击图片直达)




最全植物基因组数据库IMP (点击图片直达)



往期精品(点击图片直达文字对应教程)
















































机器学习












浏览 111
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报