如何绘制各类箱式图(箱线图)?

山海路研

因为热爱,所以想奔赴山海

内容

箱式图是什么?

箱式图: 箱式图( box plot ) 是使用5 个统计量反映原始数据的分布特征, 即数据分布中心位置、分布、偏度、变异范围和离群值。箱式图的箱子两端分别是上四分位数和下四分位数,中间横线是中位数,两端连线分别是除离群值外的最小值和最大值,另外标记可能的离群值。显然箱子越长,数据变异程度越大。若中间横线在箱子中点,则表明分布对称,否则不对称。

箱式图用来干什么?

①描述数据的分布

②直观明了地识别批量数据中地异常值。箱式图提供了识别异常值的一个标准异常值被定义为小于Q1-1.5IQR或大于Q3 1.5IQR

箱式图什么时候用?

箱式图将数据经验分布的重要特征展示出来,给人们一个直观的印象,由于使用的是中位数和四分位数,因此比均数和标准差更为稳健,箱式图特别适合于多组数据分布的比较。

在R里如何实现?

数据如何整理(示例数据)

代码展示

getwd()

rm(list=ls()) #清空环境
library(ggplot2)
library("readxl")
new_data <- read_excel("E:桌面箱式图数据.xls",sheet=1)
View(new_data)
library(ggplot2)
tiff(filename = "Rplot%03d.bmp",
     width = 7,height = 10, units = "cm",res = 300)
new_data$Type <- factor(Type,levels = c(0,1,2),labels = c("净化","非净化","粉类"))
p1<-ggplot(new_data,aes(Type,Dust))+
  stat_boxplot(geom = "errorbar",width=0.15)+geom_boxplot(width=0.3,size=0.8)
p1
dev.off()


图片展示

上面展示的是最简单的箱式图绘制方法,如果你想让你的相似图是这样的可以参考[3]

如果你希望你的图是下面这样的,你可以参考[4]

【1】颜艳,王彤, 等. 医学统计学[M]. 第5版. 北京: 人民卫生出版社, 2020: 163.

【2]】Zhang J . Beautiful Data Visualization with R (《R语言数据可视化之美》)[M]. 2019.

【3】https://mp.weixin.qq.com/s/zcE9I5JikLLGdCZU9Nxwpg

[4]https://mp.weixin.qq.com/s/6QIVrprcrxiIcW528Qi3-w



-END-

展开阅读全文

页面更新:2024-03-11

标签:中位数   线图   横线   中点   两端   位数   直观   箱子   特征   异常   数据

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top