5

我正在尝试在geom_boxplotusing中标记异常值ggrepel::geom_label_repel。当只有一个分组变量时它工作得很好,但是当我尝试多个分组变量时我遇到了问题。出于某种原因,ggrepel 中的位置参数似乎并不一致,请参见以下示例:

library(tidyverse)
library(ggrepel)

set.seed(1337)

df <- tibble(x = rnorm(500),
             g1 = factor(sample(c('A','B'), 500, replace = TRUE)),
             g2 = factor(sample(c('A','B'), 500, replace = TRUE)),
             rownames = 1:500)

is_outlier <- function(x) {
    return(x < quantile(x, 0.25) - 1.5 * IQR(x) | x > quantile(x, 0.75) + 1.5 * IQR(x))
}

df_outliers <- df %>% group_by(g1, g2) %>% mutate(outlier=is_outlier(x))

ggplot(df_outliers, aes(x=g1, y=x, fill=g2)) + 
    geom_boxplot(width=0.3, position = position_dodge(0.5)) +
    ggrepel::geom_label_repel(data=. %>% filter(outlier), 
                              aes(label=rownames), position = position_dodge(0.8))

结果图

有没有办法使用ggrepel使标签指向随附的点?

4

1 回答 1

2

你可以试试这个:

ggplot(df_outliers, 
       aes(x=g1, y=x, fill=g2, label=rownames)) + 
  geom_boxplot(width = 0.3, position = position_dodge(0.5)) +
  geom_label_repel(data = . %>%
                     filter(outlier) %>%
                     group_by(g1) %>%
                     complete(g2, fill = list(x = 0, rownames = "")),
                   position = position_dodge(0.5),
                   box.padding = 1,
                   min.segment.length = 0,
                   show.legend = FALSE)

结果

说明:

  1. geom_label_repel()遵循 aosmith 的建议添加 BA 组合的数据源,填充0x(任何数字都可以,只要它不是默认的 NA)和""rowname(ggrepel 不会绘制空标签,但在躲避)。

  2. box.padding设置为 1(从默认值 0.25 增加)以将标签推得更远,从而使线段更加可见。

  3. min.segment.length设置为 0(从默认值 0.5 减小)以强制绘制线段,无论它们有多短。

show.legend = FALSE是可选的。我只是不喜欢在传说中看到“a”字母。)

于 2019-01-16T06:30:59.893 回答