问题标签 [boxplot]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
30062 浏览

r - 在ggplot2中,箱线图线的末端代表什么?

我找不到关于箱线图线的端点代表什么的描述。

例如,这里是线结束位置上方和下方的点值。 在此处输入图像描述

(我意识到盒子的顶部和底部是第 25 和第 75 个百分位数,而中心线是第 50 个)。我假设,因为线上方和下方的点不代表最大/最小值。

0 投票
2 回答
21571 浏览

r - 更改箱线图中的异常值规则

我在 R 中构建了一些箱线图并且有几个异常值。我知道设置异常值限制的默认标准是:

  • Q3 + 1.5*IQR
  • Q1 - 1.5* IQR

但是,我希望将异常值归类为超出边界的值:

  • Q3 + 3*IQR
  • Q1 - 3* IQR

是否可以在 R 中设置它?

0 投票
2 回答
2209 浏览

r - 如何从数据框创建组合箱线图?

我想做一些非常简单的事情:我想为一个完整的数据框创建一个箱线图。然而,搜索“组合箱线图”和相关术语并没有提出任何建议。如果我忽略了一个明显的方式,请告诉我。

我有以下数据:

我希望将所有这些数据汇总在一个箱线图中,但是,当我尝试绘制箱线图(即boxplot(theData))时,R 会自动根据列名进行分组。

我也尝试将完整的数据框放在一个向量中,但是,因为我的(完整)数据集也包含 NA 值,所以我没有成功。到目前为止,我有以下函数来尝试制作数据框的向量,以便可以将其绘制在箱线图中:

但是,我认为我使这个问题过于复杂,并且我怀疑这样的循环构造是否会有益于 R 的性能。

那么,如何制作一个包含一个完整数据框的箱线图的箱线图?那么,我没有得到一个由 X20.7 到 X35.7 组成的箱线图,而是给出了一个“整体”箱线图?

0 投票
1 回答
1699 浏览

matlab - 在 Matlab 中创建多个具有相同比例的箱线图

我想在 Matlab 中绘制几个不同的箱线图,但给它们相同的比例,这样读者就不会因为并排比较而被误导。

我试过使用 datalim 选项,但它只对箱线图施加上限,但如果数据没有达到它,则不会拉伸它。

有任何想法吗?

0 投票
2 回答
7777 浏览

r - 如何使用 ggplot2 绘制小提琴图?

我可以ggplot2用来制作小提琴情节吗?也许使用一些变体geom_boxplot()

0 投票
3 回答
6364 浏览

r - 保存多个箱线图

我做了一个循环来创建多个箱线图。问题是,我想保存所有箱线图而不互相覆盖。有什么建议么?

这是我当前的代码:

0 投票
2 回答
17120 浏览

r - boxplot 中 na.action 的选项有哪些?

与以下相关的两个问题boxplot

  1. 有哪些选择na.action?文档没有列出它们。
  2. 将来我将如何回答这些类型的问题?
0 投票
2 回答
2020 浏览

r - 如何通过其中一行的子集的平均值对数据框进行排序?

我对 R 相当陌生,但我正在取得良好的进展。除了一件事之外,我已经能够根据自己的意愿弯曲 ggplot2:分类标签在我的箱线图中沿 x 轴绘制的顺序。我认为这只是我对如何在公式中处理数据框范围的知识的一个漏洞,但这里是假数据,作为一个名为 df 的数据框:

我的绘图代码看起来像qplot(df$Label, df$Value, data=df) + scale_x_discrete("Label") + opts(axis.text.x = theme_text(angle = 90, hjust = 0, size=7)) + geom_boxplot()我想要的,它是一个箱线图,显示标签 A 的一个框和胡须,一个用于 B,一个用于 C。但是,轴按标签的顺序排列(箱线图1,2,3最接近原点,10,11,12在中间,7,8,9在图右侧)。我想要的是箱线图数据从标签平均值最高的子集开始,然后按降序进行。mean(df$Label[1:3])我可以在每个标签中按等进行平均mean(df$Label[4:6]),但我不知道如何让图表显示,以便标签的图不按照它们出现的顺序factor(df$Label)(即沿 x 的 A、B、C框位于 2、11、8 处),但按标签内平均值从高到低的顺序排列(即沿 x 的 B、C、An 和框,然后是 11、8、2 的框)。

我想我会创建一个由每个标签内平均值组成的向量,并以某种方式将其传递给 ggplot 以指定轴顺序,但我不知道如何创建向量开始。

我需要知道的是:

获得由每个标签的平均值组成的向量的最佳方法是从最高到最低的顺序是什么?

如何将该向量传递给它,ggplot以便它按这些值对 x 轴进行排序,同时仍xfactor(df$Label)

我也愿意接受有关显示数据的其他方式的建议,但我认为我非常接近我想要的,并且给定标签内值的平均值和分布很重要。

0 投票
2 回答
17517 浏览

python - 结合 plt.plot(x,y) 与 plt.boxplot()

我正在尝试将普通的 matplotlib.pyplotplt.plot(x,y)与变量y作为变量的函数x与箱线图相结合。但是,我只想要在某些(可变)位置上的箱线图,x但这似乎在 matplotlib 中不起作用?

0 投票
1 回答
2768 浏览

python - 箱线图蒙版数组

如何仅对 MaskedArray 的非屏蔽值进行箱线图?我认为这会自动发生,boxplot(ma)但这似乎是对非屏蔽数组进行箱线图。