问题标签 [dplyr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
128 浏览

r - 在 R 中使用外部矩阵元素计算

我正在尝试通过用户定义的函数计算矩阵的每个元素。我使用了双for循环、嵌套sapplyapply之后expand.grid

我正在寻找更优雅的解决方案(当然更快)。我正在尝试使用外部,我写道:

我有Error in ll[[y]] : recursive indexing failed at level 2

我认为 Outer 需要对函数进行矢量化,所以我尝试了它:

我得到了Error in ll[[x]] : subscript out of bounds

我想我在 Vectorize 中可能会出错,关于我正在尝试做的事情的一般想法,但我会很感激这里的一些帮助。我也在看plyr/ dplyr- 没有太大的成功。

0 投票
4 回答
169868 浏览

r - 使用 dplyr 按组计算行数

我正在使用mtcars数据集。我想查找特定数据组合的记录数。count(*)与SQL 中的 group by 子句非常相似。ddply()来自plyr为我工作

有输出

使用此代码

有输出

我找到了各种可以传递的函数,summarise()但似乎没有一个对我有用。我发现的一个函数是sum(G),它返回

尝试使用n(),返回

我究竟做错了什么?我怎样才能得到group_by()/summarise()为我工作?

0 投票
1 回答
316 浏览

c++ - 使用变量名过滤 dplyr 的 tbl_df

我在使用 dplyr 的 tbl_df 时遇到问题,分别是常规的 data.frame。我有一个很大的 tbl_df (500x30K) 并且需要过滤它。所以我想做的是:

这将类似于

效果很好。但是我需要在运行时动态构建过滤函数,所以我需要通过一个或多个变量来访问 DF/tbl_df 列。我试过类似的东西:

这给了我一个错误:与 LGLSXP 不兼容 这似乎深深植根于 Cpp 代码中。

我会感谢任何提示。还指出“字符串到环境变量”的转换会有所帮助,因为我很高兴我做错了。

用最好的,

马里奥

0 投票
6 回答
65014 浏览

r - dplyr:“n() 中的错误:不应直接调用函数”

我正在尝试重现 dplyr 包中的示例之一,但收到此错误消息。我期待看到以每种组合的频率生成的新列 n。我错过了什么?我三次检查包是否已加载。

n() 中的错误:不应直接调用此函数

0 投票
2 回答
557 浏览

r - dplyr 中单个数据的概率

示例:具有许多个人和 3 个变量的数据框:年份(整数)、性别(因子:男/女)和工会(因子:是/否)。我想计算在给定年份和性别的情况下成为工会成员的概率。我通常用聚合()来做到这一点。我是否一直在这样做,我正在寻找一种在 dplyr 中快速快速的方法。

亲切的问候,彼得

0 投票
3 回答
47213 浏览

r - dplyr:非标准列名(空格、标点符号、以数字开头)

数据看起来像

继调用选择

如何选择“a a”和/或将其重命名为没有空格的内容select?我知道以下方法:

  1. names(df)[1] <- "a"
  2. select(df, a=1)
  3. select(df, ends_with("a"))

但是如果我正在处理一个大型数据集,我如何在不知道索引号或类似列名的情况下获得完全匹配?

0 投票
2 回答
21910 浏览

r - dplyr 链中的格式列

我有这个数据集:

是否可以在链中包含一列的日期格式?(我也尝试过使用with,但只返回日期列。)

如果我不在链中包含格式,它可以工作。我知道在链外写这个很简单,但我想确认这是否可行。

0 投票
4 回答
511274 浏览

r - 过滤包含特定字符串的行

我必须使用包含字符串的那些行作为标准来过滤数据框RTB

我正在使用dplyr.

我知道我可以使用该函数filterdplyr但我不知道如何告诉它检查字符串的内容。

特别是我想检查列中的内容TrackingPixel。如果字符串包含RTB我想从结果中删除该行的标签。

0 投票
2 回答
14666 浏览

r - (d)plyr 中的 mutate() 在获取时不会创建新列

我正在将包 dplyr 与 R 一起使用(同样的问题也适用于 plyr)。当我调用source("dply_problem.R")以下代码时

“C”列未添加到df. 但是,当我mutate(df, C = A + B)从 shell 调用时,确实会创建列“C”。你能告诉我为什么会这样吗?

0 投票
1 回答
1487 浏览

r - Formula evaluation with mutate()

Is there a way to make mutate() evaluate formulas in (d)plyr package of R? I think of situations where one has many variables like count.a, count.b, ..., count.z and I would like to create a new variable to sum all these. I can create a character string like "count.total = count.a + count.b + (...) + count.z", but how to make mutate() evaluate it?