箱线图怎么看

箱线图怎么看

一个针对于连续型变量的统计图:箱线图(boxplot)

解读箱线图最基本的三要素:

1、箱子的中间一条线,是数据的中位数,代表了样本数据的平均水平。

2、箱子的上下限,分别是数据的上四分位数和下四分位数。这意味着箱子包含了50%的数据。因此,箱子的宽度在一定程度上反映了数据的波动程度。

3、在箱子的上方和下方,又各有一条线。有时候代表着最大最小值,有时候会有一些点“冒出去”。请千万不要纠结,如果有点冒出去,理解成“异常值”就好。

然而,也不是所有连续型变量数据都是适合画箱线图,有些画出来箱线图会变扁,被压得很丑,

这时候就可以取这些数据得对数变换,堪比整容,专治各种不对称分布、非正态分布和异方差现象等。(log2)

所以在处理数据时,如果需要画箱线图,最好还是先将数据进行对数变换,这样,画出来的图就美美哒啦!可以参考代码:

数据exprSet如下图示:

## 组间校正

library(limma)

exprSet=normalizeBetweenArrays(exprSet)

boxplot(exprSet,outline=FALSE, notch=T, las=2)

# 自动log化

ex <- exprSet

qx <- as.numeric(quantile(ex, c(0., 0.25, 0.5, 0.75, 0.99, 1.0), na.rm=T))

LogC <- (qx[5] > 100) ||

(qx[6]-qx[1] > 50 && qx[2] > 0) ||

(qx[2] > 0 && qx[2] < 1 && qx[4] > 1 && qx[4] < 2)

if (LogC) {

ex[which(ex <= 0)] <- NaN

exprSet <- log2(ex)

print("log2 transform finished")

}else{

print("log2 transform not needed")

}

exprSet <- as.data.frame(exprSet)

总结:

1、箱线图是针对连续型变量的,解读时候重点关注平均水平、波动程度和异常值。

2、当箱子被压得很扁,或者有很多异常的时候,试着做对数变换。

3、当只有一个连续型变量时,并不适合画箱线图,直方图是更常见的选择。

4、箱线图最有效的使用途径是作比较,配合一个或者多个定性数据,画分组箱线图。

参考于:https://www.sohu.com/a/134414348_455817,里面对于箱线图描述得更详尽

相关推荐

要矢量源文件?常见的4种logo格式了解一下
beat365官方网站

要矢量源文件?常见的4种logo格式了解一下

📅 10-14 👀 5262
7、梦幻西游蝴蝶仙子有什么技能
天天365彩票软件官方下载3D

7、梦幻西游蝴蝶仙子有什么技能

📅 08-24 👀 9097
P2P网上贷款平台评测:如何选择安全可靠的借贷渠道?
《dnf》国庆套价格介绍
beat365官方网站

《dnf》国庆套价格介绍

📅 09-13 👀 4380
《奇迹MU》S19
天天365彩票软件官方下载3D

《奇迹MU》S19

📅 08-19 👀 4667
防火墙软件哪个好用 实用的防火墙软件排行
beat365官方网站

防火墙软件哪个好用 实用的防火墙软件排行

📅 08-29 👀 5585
快手如何查看送出礼物记录
best365官网登录入口

快手如何查看送出礼物记录

📅 10-30 👀 6207
包含【礼】的成语有哪些
beat365官方网站

包含【礼】的成语有哪些

📅 07-24 👀 8851
两个五角星的车标是什么车?两个星星的车标
天天365彩票软件官方下载3D

两个五角星的车标是什么车?两个星星的车标

📅 06-30 👀 2895