1

我正在处理两个数据框,其中包含来自两个不同帐户的推文数据。第一个数据框正在这个 twitter 帐户上工作,并在我的 R 控制台中返回一个数据框。

baudet_tweets <- userTimeline("thierrybaudet", n = 3200, includeRts = TRUE)
baudet_tweets_df <- tbl_df(map_df(baudet_tweets, as.data.frame))

但是,不同 Twitter 帐户的相同代码给了我错误:

klaver_tweets <- userTimeline("jesseklaver", n = 3200, includeRts = TRUE)
klaver_tweets_df <- tbl_df(map_df(klaver_tweets, as.data.frame))

Error in rep(space, max_width) : invalid 'times' argument

我认为这是文本列,因为当我过滤掉select(klaver_tweets_df, text)文本列时,代码有效。但我需要用于文本分析的text专栏......我觉得奇怪的是text专栏baudet_tweets_df只是有效。我的代码并不是真正可重现的,但这是 df 的图像,因为我View(klaver_tweets_df). Maybe only可以 klaver_tweets_df` 包含表情符号?如果是这样,我该如何删除它们?

df$text 克拉弗

4

1 回答 1

1

删除表情符号成功了!

klaver_tweets_df$text <- gsub("[^\x01-\x7F]", "", klaver_tweets_df$text)
于 2017-10-28T13:24:32.200 回答