r - r 矩阵在线结构耗时太长

Question

这个问题是按照我本周提出的前一个问题的顺序出现的。

但一般我的问题如下：

我有一个通过套接字进入R的记录数据流，我想做一些分析。

它们是这样依次出现的：

个人 1 | 1 | 2 | 时间戳 1
个人 2 | 4 | 10 | 时间戳 2
个人 1 | 2 | 4 | 时间戳 3

我需要创建一个结构来维护这些记录。上一个问题中讨论了主要思想，但通常我创建了一个结构，如下所示：

                     *var1*     *var2*             *timestamp*
- individual 1   | [1,2,3] |  [2,4,6]   | [timestamp1, timestamp3...]
- individual 2   | [4,7,8] | [10,11,12] | [timestamp2, ...]

重要 - 此结构是在运行时创建和扩大的。我认为这不是最佳选择，因为创建时间太长。主要结构是一个矩阵，在每对单独的变量中，我都有记录列表。

这些人数量众多，并且随着时间的推移变化很大。因此，如果不查看一些记录，我就没有足够的信息来进行良好的分析。考虑通过将个人记录保存到磁盘来在 R 上运行时创建一些缓存之王。
我的完整数据库大约有 100 GB。我想主要通过每个人中的季节性块来分析它（取决于时间戳变量）。
由于我要扩大收集的记录数量，因此创建结构需要很长时间。
在每对单独变量中使用带有列表的数据矩阵的想法是从使用三维矩阵改编而来的，因为我没有在相同的时间戳上进行观察。不知道这是不是个好主意。

如果有人对此事有任何想法，我将不胜感激。

r - r 矩阵在线结构耗时太长

0 回答 0

Related

Reference