问题标签 [tibble]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
14452 浏览

r - 使用 dplyr 和 add_row() 在每个组中添加行

如果我向数据集添加新行iris

有用。那么,为什么我不能在每个“子集”之上添加一个新行:

0 投票
1 回答
3942 浏览

r - 如何从基于列表的数据框中将行名转换为列

我有以下基于列表的数据框:


我想要做的是将行名转换为列我收到此错误:

正确的方法是什么?

0 投票
1 回答
77 浏览

r - 对数据帧执行逐行 chisq 测试并将结果捕获为 tibble

我有一个类似的数据框:

我将每一行转换为一个表格,然后执行 chisq 测试。
为了从 chisq 结果(p 值、参数、统计量、预期等)中获取特定值,我不得不重复 chisq 测试几次(以一种非常丑陋和繁琐的方式),使用以下代码:

是否有一种更优雅的方法可以只进行一次 chisq 测试并将结果捕获为同一行中的小标题,然后根据需要将值提取到其他列中?
我的数据框有超过一百万行和一些未用于 Chisq 测试的附加变量。

谢谢你。

0 投票
2 回答
1758 浏览

r - 如何将 tibble 中的行乘以另一个 tibble 中的另一个对应行

我有两个小标题,第一个是这个。


第二个是这个


我想要做的是将Sample1(和Sample2)中的每个值与 中的相应基因行值相乘fixed_score

Sample1

因此,在上面的结果中,我们通过以下方式获得值:

结果Sample2是这样的:

如何使用 data.table 或 dplyr 做到这一点?由于我们的行数非常大。最好有快速的方法。

0 投票
2 回答
467 浏览

r - 在最新的 R 工作室(R 版本 3.4.0)中覆盖默认导入 csv 到 tibble

我最近下载并安装了最新版本的 R/Rstudio,并注意到其中一项新变化是在导入 csv 时,Rstudio 现在默认将文件作为 tibble 导入。虽然我意识到开发人员有充分的理由进行此更改,但我个人觉得这非常烦人。

我使用的许多数据文件有很多 (>10) 列,并且我经常使用许多函数来查看数据(即 head()、tail(),甚至从数据中提取特定行,例如data[1:5,]) 不能按我的意愿运行。特别是,在 tibble 上使用这些函数会导致最右边的列不显示,这是非常有问题的,因为我通常对这些列最感兴趣。尽管我使用这些新版本的时间不长,但我已经厌倦了每次要查看数据时都必须使用 View() 函数,或者必须使用 as.data.frame( ) 为了让我的数据以我想要的方式显示。虽然我意识到这似乎是一个相当小的问题,

只是为了保持我自己的理智,有没有办法覆盖这个默认设置并使它导入的所有 csv 都作为数据帧而不是小标题导入?

0 投票
1 回答
91 浏览

r - 如何在小标题的每个元素上应用“复杂”的用户定义函数

我已经搜索了这个(看似简单的)问题的答案,但空无一物,所以我希望有人可以帮助我或指出我正确的方向。

我有一个相当复杂的子模型,我想将其应用于数据集,但如果我只使用 use mutate,我会收到错误,Variables must be length 1 or 21.添加 rowwise() 似乎不会影响它。

让我用下面这个愚蠢的例子来说明这个问题:

我希望有人可以向我解释我在这里做错了什么。

提前谢谢了!

西尔万

0 投票
0 回答
37 浏览

r - 如何使用对包含在列表列中的三个模型进行方差分析测试?

嗨:我有 10 个因变量和三个自变量的数据集。我想对每个单独的因变量做一个 OLS,依次添加每个自变量。所以,使用 tidyr 我得到了一些模型。

我想对每个因变量进行方差分析,以相互测试嵌套模型。但是在一堆模型的背景下我该怎么做呢?

0 投票
1 回答
223 浏览

r - 在 R 中管理多个模型和运行时间

我正在构建数十个预测模型,以确定一个冠军模型。我正在处理千兆字节的数据,因此跟踪运行时间很重要。

我想以列表类型的格式构建我的所有模型,因此我不必在全局环境中管理所有不同的模型名称。但是,似乎获得每个模型的时间的唯一方法是拥有单独的命名对象。

这是一种接近我正在寻找的基本方法:

但是,如您所见,我必须手动命名每个模型和时间记录。我正在寻找类似于使用以下代码生成的表的内容,其中“xxx”是运行时间的实际记录。

无论使用什么包,我都会很感激提供的任何输入。

0 投票
1 回答
90 浏览

r - 计算 NA、NAN 和 Inf 时的奇怪行为

我写了一个小函数来计算 tibble 数据框中的 NA、NaN 和 Inf 的数量,如下所示:

我用以下小标题测试了它:

我得到

这当然是正确的答案。

现在,如果我传递给函数的 tibble 恰好包含日期格式的观察结果,那么函数就会停止工作,我不知道为什么:

关于发生了什么的任何线索?

谢谢

雷马尔

0 投票
2 回答
1440 浏览

r - 尝试子集小标题的问题

这应该是一个简单的,但我无法弄清楚我做错了什么。可能是一些愚蠢的事情......叹息......

所以在这里,我有一个大的小标题,我试图从中删除一些观察结果。我有一个索引逻辑向量,我想用它来获取我想要摆脱的观察结果:

给了我一个我不想要的观察结果。但是,我还需要访问我正在运行的剩余观察结果

这个不起作用,我拿回原来的小标题减去第一行。

我究竟做错了什么?为了记录,索引变量的属性在下一段代码中。索引的长度和预期的一样,即原始小标题的长度。

谢谢