0

我正在尝试对已加载到 R 中的 csv 文件进行一些分析。我正在执行以下操作以通过 test[[3]][[1]] 访问特定值,例如获取特定值:

test <- read.csv(file = "test.csv")
test <- data.frame(lapply(test, as.character), stringsAsFactors=FALSE)

否则我会得到这样的东西:

> chicago[[3]][[1]]
[1] 08/02/2002 11:00:00 AM
19747 Levels: 01/01/2001 03:49:00 AM 01/01/2001 06:17:00 PM 01/01/2001 12:00:00 AM ... 12/31/2015 11:46:00 AM

由于一列正在保存日期,因此我将其转换为 POSIXlt。

test[[3]] <- strptime(test[[3]], format='%m/%d/%Y %I:%M:%S %p') 

现在正在按预期更改值,例如:

01/28/2004 06:30:00 PM -> 2004-01-28 18:30:00

现在尝试访问这些值,我意识到,例如 test[[3]][[1]] 没有给出具体的日期 - 相反,我得到一个包含每一行每一秒的列表。

测试了一下,我发现 POSIXit 类型有点“不同”;这意味着上面提到的值似乎是某种列表,如下所示:

> unlist(unclass(value))
   sec    min   hour   mday    mon   year   wday   yday  isdst   zone gmtoff 
   "0"    "0"   "11"    "2"    "7"  "102"    "5"  "213"    "1" "CEST"     NA 

所以我的问题是:有没有办法获得像“2004-01-28 18:30:00”这样的值,而不是整个列的列表?

4

1 回答 1

3

你让你的生活太艰难了。您可以将整列解析为 Date 或 Datetime 。不需要lapply

你(一般来说)不想要POSIXlt代表。查看现有的包,例如我的(相对较新的)anytime包(也在CRAN 上),它甚至可以factor为您转换——并且不需要明确的格式字符串、原始值或其他保留。

但是由于您的帖子不包含可重复的示例,因此我无法提供更具体的步骤。

于 2016-11-13T22:55:26.867 回答