问题标签 [dcast]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
65 浏览

r - 针对不同拆分为每组计算延迟

我想计算不同拆分的事务之间的平均延迟。我已经有了解决方案,但我需要通过不同的方法计算延迟。

数据集如下所示:

解决老方法

我以前做的是先计算后续事务之间的延迟,像这样:

然后通过 dcast 计算每个事务延迟的每个拆分的平均值:

问题新方法

我想用来计算延迟的新方法是通过以下等式:

对于每个客户:( 最新交易 - 第一次交易)/(交易数量 - 1)

当然,问题是不能按周期计算延迟,因为这将是所有交易的延迟。相反,它需要计算为特定类型或符号或拆分组合的每个周期的延迟。

有什么想法可以解决这个问题吗?

预期产出

0 投票
2 回答
251 浏览

r - 转换由 fun.aggregate 控制的多个 value.var

我有以下数据集

我可以使用此代码通过以下代码计算每个给定时期的不同拆分数量:

但我也想根据不同的拆分计算值。

预期结果如下所示:

然后,它应该可以扩展到其他拆分,例如第 1 期 X 类型的符号 X 的平均值。

我不确定这种方法是否可以实现所需的输出。但我在看fun.aggregate争论。也许它可以与多个value.var参数结合使用?

更新:乔尔的代码回答了问题的第一部分。

但是如何自动转置变量并根据拆分分配名称?

0 投票
1 回答
129 浏览

r - 在 data.table 中有效地将纵向表转换为宽格式

我在 R 中使用存储为data.table包含数值和字符类型变量的值更改中获得的值的长表工作。当我想执行一些函数,如相关、回归等时,我必须将表格转换为宽格式并均匀化时间戳频率。

我找到了一种将长表转换为宽表的方法,但我认为效率不高,我想知道是否有更好的更data.table原生的方法。

在下面的可重现示例中,我包含了我发现执行宽低转换的两个选项,并且在评论中我指出了我认为哪些部分不是最佳的。

欢迎在此过程中提供任何建议/改进。

0 投票
2 回答
1202 浏览

r - R dcast 填充样本号

我想知道在使用(库或)时是否有办法fill使用随机数来处理每个单独的缺失值。例子:dcastreshape2data.table

做一个简单的dcast

注意一些值是如何遗漏的:

我想用随机数填充每个缺失值,例如:

结果是:

但是,所有缺失值都已替换为相同的随机数(在本例中为 2)。

是否可以将该函数单独应用于每个缺失值,从而用不同的随机数填充缺失值?

提前致谢!

0 投票
1 回答
43 浏览

r - 嵌入式 Ifelse 语句

我有一个数据集如下:

如何在以下位置添加一列:

“如果 Rev_Diff 小于 0,如果“Cost_Diff”的金额小于 0,则打印“Cost”,如果“Price_Diff”的金额小于 0,则打印“Price”,如果“Sales_Diff”的金额小于 0,则打印“Sales”大于 0,否则打印“We're up”。

最终输出:

0 投票
0 回答
257 浏览

r - 如何在 data.table dcast 中引用多个聚合函数?

我想将 data.tabledcast函数放入一个函数中,该函数可以处理聚合函数的自定义数量/顺序。这就是为什么我需要将聚合函数作为参数传递给dcast函数。参数需要在外部定义dcast。我怎么能这样做?

这很好用,但我想在 dcast 之外定义聚合函数。

我试过这个方法:

然后我收到此错误消息:

eval 中的错误(expr、envir、enclos):找不到函数“func”

0 投票
0 回答
20 浏览

r - 如何使一列中的一列单元格对应于R中另一列中的单元格?

我有一个名为“vsample.csv”的数据表,如下所示: vsample

我需要创建一个应该如下所示的新数据集: vsample_answer 无法真正找出 R 中的语法。有人可以帮忙吗?谢谢

0 投票
1 回答
484 浏览

r - 如何在多个条件下将数据从长格式重塑为宽格式?

我有一个名为“vsample2.csv”的数据表,如下所示:

采样2

我需要它在我将创建的新数据表中看起来像这样:

回答

尝试使用 dcast 但似乎不起作用。我不想要一个函数。就一两行。

我需要对数据进行重复测量方差分析。E & H 是变量级别 1,C 和 IC 是变量级别 2。我需要变量级别 1、2 的显着性值,然后是它们的交互作用。

数据

0 投票
1 回答
637 浏览

r - 如何在不聚合的情况下使用 dcast 将一列拆分为不同的列?

我正在尝试使用 dcast 重塑我的数据。我正在处理每个样本有 10-30 个样本单位的样本。我无法汇总我的数据。

我的数据是这种格式:

我希望它看起来像这样:

我的样本 ID 变成不同的列。

我尝试了几种方法,但 R 一直在聚合它。

0 投票
3 回答
377 浏览

r - 使用动态列名按组计算 rowSums

我想按生产中使用的钻探类型计算每种化石燃料的产量份额。起点是以下data.table

然后,我可以根据钻探类型计算两种化石燃料类型中的每一种的总产量。

有谁知道如何计算不同化石燃料类型的总和?正如您在dcast命令的最后一种情况中看到的那样,它连接新列的名称,因此无法通过直接选择列来对列进行分组。

基本上,我想获得最后一个示例的输出,尽管通过附加列以及石油和天然气总产量的总和来增强。然后我想用这些总和来计算来自四种井类型之一的石油和天然气产量的份额。