4

我正在使用 R 3.4.0 和 dplyr 0.5.0(我也使用 R 3.3.3 进行了测试,并且我有同样的错误)。

过去(甚至昨天!)我一直在定期使用以下类型的代码,但由于某些原因,它今天会产生错误。

例如,我有 5 分钟间隔的数据,我想以 15 分钟为单位进行汇总。由于我不能group_byDateTime POSIXlt,我将变量转换为字符。但是,当我应用该group_by函数时,它会在原始 DateTimePOSIXlt变量上创建一个错误,即使我在函数中使用了字符变量。

这是一个可重现的示例:

z <- seq(ISOdatetime(2017,01,01, 00,00,00), ISOdatetime(2017,02,28,23,45,00), by="5 min")
q <- rnorm(16990, mean=120, sd=75)

d<- data.frame("Dates"=z, "values"=q)

# Round the time to the nearest 15min
d$DatesRound <- as.POSIXlt(round(as.double(d$Dates)/(15*60))*(15*60),origin=(as.POSIXlt('1970-01-01')))

# Transform into character
d$DatesRoundChar <- as.character(d$DatesRound)

d2 <-
  d %>%
  group_by(DatesRoundChar)%>%
  summarise(total=sum(values))

这是我遇到的错误:

grouped_df_impl(data, unname(vars), drop) 中的错误:列“DatesRound”具有不受支持的类:POSIXlt、POSIXt

我也尝试过使用以下方式进行转换:

d$DatesRoundChar <- strftime(as.POSIXct(d$DatesRound))
d$DatesRoundChar <- sapply(d$DatesRound, as.character)

但我仍然有同样的错误。

有谁知道为什么它会在甚至不在函数中的变量上引发错误?我该如何解决?

4

1 回答 1

8

该类在链中POSIXlt造成了麻烦,dplyr因为它不受支持classdplyr

d %>% 
   group_by(DatesRoundChar)

grouped_df_impl(data, unname(vars), drop) 中的错误:列 DatesRound:不支持的类 POSIXlt/POSIXt

traceback()
#14: stop(list(message = "Column `DatesRound`: unsupported class POSIXlt/POSIXt", 
#        call = grouped_df_impl(data, unname(vars), drop), cppstack = NULL))
#13: .Call("dplyr_grouped_df_impl", PACKAGE = "dplyr", data, symbols, 
#        drop)
#12: grouped_df_impl(data, unname(vars), drop)
#11: grouped_df(groups$data, groups$group_names)
#10: group_by.data.frame(., DatesRoundChar)
#9: group_by(., DatesRoundChar)
#8: function_list[[k]](value)
#7: withVisible(function_list[[k]](value))
#6: freduce(value, `_function_list`)
#5: `_fseq`(`_lhs`)
#4: eval(expr, envir, enclos)
#3: eval(quote(`_fseq`(`_lhs`)), env, env)
#2: withVisible(eval(quote(`_fseq`(`_lhs`)), env, env))
#1: d %>% group_by(DatesRoundChar)

相反,我们可以将其更改POSIXctas.POSIXct

d$DatesRound <- as.POSIXct(round(as.double(d$Dates)/(15*60))*
                   (15*60),origin=(as.POSIXlt('1970-01-01')))

或者另一种选择是在group_by

d %>% 
  select(-DatesRound) %>% 
  group_by(DatesRoundChar) %>%
  summarise(total=sum(values))
于 2017-05-04T11:46:11.023 回答