问题标签 [dcast]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
354 浏览

r - 具有 1 个变量的 data.table dcast

例子

上面的 dcast 返回以下消息

check_formula(formula, names(data), valnames) 中的错误:公式无效。铸造公式应该是 LHS ~ RHS 的形式,例如,a + b ~ c。

公式必须写为.~a""~a。然后输出看起来像这样

有没有写公式的方法,以便.不写出来?我意识到我可以使用[,-c(1),with=F].

0 投票
1 回答
233 浏览

r - 在大型数据集上使用 Dcast 函数 (reshape2)

我有一个尺寸为 (325,928 x 2) 的数据框。

以下是该数据的一个非常小的子集:

这里的最终目标是使用类似于 dcast 的东西将此数据帧转换为新的数据帧,因为 dcast 无法处理大量数据。

所以这是我尝试使用此数据框的原始代码:

输出:

它适用于我提供的数据集,但是当我使用完整的维度数据集进行测试时325,928 x 2,R 崩溃。是否有更好的函数可以产生相同的输出但处理大量数据。如果这还不够信息,我可以私下将完整的数据集提供给任何认为他们可以解决此问题的人(我无法在此处提供,因为 StackOverflow 无法读取所有数据),因此您可以直接从来源。

任何帮助都会很棒,谢谢!

0 投票
1 回答
14364 浏览

r - dcast 错误:`匹配错误(x,表,nomatch = 0L)`

我有一个名为的数据框df,看起来像这样......

我想翻转数据框,所以列是这样的:

"ReleaseYear","Both","Critics","Players"

每个列的Both',Critics andPlayers would be then` 的值。

当我尝试运行这个...

...我收到此错误:

这里有什么问题?我如何解决它?

0 投票
4 回答
208 浏览

r - 以一种奇怪的方式应用 dcast

我想根据“引导”变量分离变量。x3 在以下情况下:

我以某种方式感觉到这可以实现,reshape2::dcast()但我只能让它总共为两个变量工作:

但可能这只是对dcast. 这个问题是否有一个优雅的解决方案,无需拆分和合并df


编辑:有些人提到这样做是一个可怕的想法,我可能不应该这样做。让我详细说明什么时候这才有意义。

想象一下x3是特定算法的开关。在这种情况下ab是选项。此外x1x2是两种算法都可以采用的参数。不幸的是,这两种算法在相同的参数设置上表现得非常不同,x1因此x2将它们作为不同的特征来处理以考虑它们的不相关性是有意义的。

0 投票
0 回答
226 浏览

r - R中的dcast以获得特定的多列输出

我有一个数据框如下:

我希望它以 L1 形成 ID 列、算法和 pvalue 的方式进行转换(pvalue 下的 3 个变量和 3 个算法)。摆动 pvalue 放在 3 个新列下的值来自“值”列,摆动算法放在 3 个新列下的值应该来自 HR_CI 列。

我试过以下

但它给了我一个错误

任何建议将被认真考虑

0 投票
0 回答
29 浏览

r - 如何转换具有两个相关列的数据框?

我有一个如下所示的数据框。

到目前为止,Dcast(在 reshape2 中)似乎是我最好的选择。

虽然我最终得到了这个;

伴随着错误;

如何在不丢失“响应”列中的字符串的情况下获得第二种格式?

0 投票
1 回答
385 浏览

r - r 在 for 循环中使用 dcast 查找多列的平均值并将它们编译到新的数据帧中

我有一个数据框(DF_melted),我通过熔化其他一些数据集获得。DF_melted 数据框有“月”、“A”、“B”、“C”、“D”、“E”、“F”列。从使用 dcast 的以下代码中,我可以获得一个数据帧,其中包含“A”和“月”的每个组合的变量平均值。这一切都工作正常,正如预期的那样。

问题 - 在上面的代码行中,我想运行一个 for 循环来自动获取数据集(使用 dcast),用于month+Amonth+Bmonth+Cmonth+D的关系。我无法弄清楚如何以参数方式替换“A”(或 B、C、D)。

我尝试了以下代码,其中我根据 DF_melted 中的列号引用 A、B、C、D 并且它有效:

尽管上述方法有效,但我想知道是否有更聪明的方法可以在不引用数据框列号的情况下执行上述操作?

最终,我的意图是获得一个数据框“FinalDF”,以便我可以使用它来绘制 A、B、C、D 的每个类别的月 v/s 变量图。因此,自动进行这种数据重塑将是一个巨大的帮助。

0 投票
1 回答
45 浏览

r - 将变量的级别变成单独的变量

我正在尝试隐藏我的数据格式以便能够在其他软件中使用它。在我的情况下,我需要将 resp 的级别转换为单独的变量,同时保留每个 respID 的线索列表。我的数据如下

我尝试使用(!!table(cbind(df[1],stack(df[1])[2]))),但我认为我在某处订购错误,也尝试使用但libary(caret)没有成功。

0 投票
1 回答
885 浏览

r - 将键值对分散到列中

我遇到了以下数据争论问题。每个数据集的aValue每个值都有多个值aName。这可以很容易地在一个整洁的数据框中表示。

我想将数据集变量“传播”到各个列中。tidyr::spread(由于重复的键,我无法用来创建所需的输出。)

有没有一种整洁的方法来生成所需的输出?

ps:我知道spread-key-value-pairs-when-keys-are-in-different-columns问题,但解决方案

由于使用了聚合函数,因此不会产生所需的输出length

0 投票
0 回答
30 浏览

r - R,reshape2:默认情况下,dcast 为缺失的组合填充 0——正常行为?

我有以下长桌:

我从中创建了 short.table 通过切掉前五行:

如果我dcast(table, case ~ index)对每个表使用,我会得到不同的行为:在长的情况下,我得到索引值的整数值列,而缺失的组合用零填充。但是,在简短的情况下,我得到索引值的数值列,并且缺失的组合用 NA 填充。

问题:对于很长的表,默认行为是否会改变?