问题标签 [qdap]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
762 浏览

r - 将 qdap 中的同义词添加到 R 中预先存在的数据框

我在 R 中创建了以下数据框 df

我已使用此代码获取同义词列表,但相同的是列表形式

我得到了一个同义词列表。我想将数据框中每个单词的同义词作为单独的列逐行附加到数据框中。

有没有一种优雅的方式来获得这个。有没有其他字典可以用来做这个。

0 投票
1 回答
1368 浏览

java - 尝试加载 qdap 包的 R 错误

所以我试图运行

但这个错误不断出现:

我在 Mac 上的 Rstudio 中使用 R,我已经搜索了很多类似的问题,但似乎没有一个有效。我对使用 R 很陌生,任何帮助都会非常感谢。

我尝试使用

这出现了,我认为这是一件好事

但错误仍然发生。

提前致谢

0 投票
2 回答
1213 浏览

r - R3.5.0 和 data.tables 不工作

2018-04-26 编辑:根据评论更改标题,这是 R3.5.0 的一个更广泛的问题

原来的:

我对 R 很陌生,并不了解它的所有乐趣。

我刚刚将我的工作计算机升级(结果!)到带有 java 版本 8.1 64bit 的 windows 10;r 3.5.0 和 r 工作室 1.1.447。

我的代码不再喜欢 qdap 包。它声称可以安装但不会入库。

代码:

输出:

谷歌搜索建议我需要修改依赖项部分,这抛出了这个

任何想法(和修复!)非常感谢。对不起obvs noobie问题。

0 投票
1 回答
324 浏览

r - 更新用于情绪分析的 qdap 词典

我正在polarity使用qdap. 当组合起来说时,我想将几​​个词添加到字典中作为否定词。例如。

“很糟糕”

当将其发送到极性功能时,极性分数变为中性。

因为它认为好词是好词,坏词是坏词,因此聚合成为中性。

我想摆脱这个并想添加几个自定义词。

0 投票
1 回答
913 浏览

r - 在使用 stringi 包之前将字符串的文本语料库转换为字符向量

我有一个语料库,其中包含我导入的两个文本文件:

输出类是列表,但我将其转换为字符:

文本属于字符类:

但似乎它们是字符串,因为输出首先显示:

(上一行只是其中一个文本的示例);然后它打印实际文本,因为它们是单独一行的每个句子,例如:

我需要将这些文本转换为字符向量,以便下一步分析,在 R 中的stringi包的帮助下将它们转换为 ASCII,例如:

--此包仅将字符向量转换为 ascii 编码。所以问题是:

--如何将字符串语料库转换为向量?

PS:我已经查看了 StackOverflow 中的所有其他问题,以避免重复问题。谢谢你的帮助!


谢谢大家帮助!我只是使用 as.vector 将字符串转换为字符向量:

但主要问题仍然存在:我想要一个字符向量作为 stringi 包和stri_enc_toascii(mydata)函数的输入,以将 mydata 转换为 ASCII 编码(检查这里,但编码仍然显示未知。有没有直接的方法来转换“未知”编码为“ascii”?

0 投票
2 回答
57 浏览

r - R中的beg2char函数(qdap包)

我正在尝试仅保留字符串左侧的那部分"keyword"。右边的任何东西都"keyword"应该被删除。beg2char似乎是最好的选择,但它没有做我认为它会做的事情。

请指教:

0 投票
1 回答
195 浏览

r - R - 文本分析 - 误导性结果

我正在对银行客户关于抵押贷款的评论进行一些文本分析,我发现了一些我确实理解的事情。

1) 在不应用词干提取和检查 TDM 维度的情况下清理数据后,术语数 (2173) 小于文档数 (2373)(这是在删除停用词和将 TDM 设为 1-gram 之前)。

2) 另外,我想检查对 TDM 进行二元标记的 2 词频率 (rowSums(Matrix))。问题是,例如,我得到的重复次数最多的结果是 2 个单词“Proble Miss”。由于这个分组已经很奇怪了,我去了数据集“Control + F”,试图找到,但我找不到。问题:似乎代码有些如何阻止这些词,这怎么可能?(从前 25 个双字中,这一个是唯一一个似乎被阻止的)。这不应该只创建始终在一起的二元组吗?

数据集样本:

0 投票
1 回答
191 浏览

r - 计算单词在每一行中出现的次数并存储在新列中(dplyr)

我有一个基本上包含单词段落的字符向量。我想分别计算特定单词在每一行中出现的次数,然后创建一个新向量来保存这个数字。如何使用 dplyr 实现这一目标?(任何其他可用的方法也可以)。

我最接近解决方案的是这个链接:计算一个单词出现的次数(dplyr),但它并没有给我我想要的东西。

0 投票
3 回答
143 浏览

r - 如何从 qdap::mgsub() 平滑切换到 textclean::mgsub()?

qdap::mgsub()由于 R 版本问题,我需要在和之间切换textclean::mgsub()。函数几乎相同,除了参数的顺序:

我有很多我使用的代码qdap::mgsub()。不幸的是,当我将参数传递给函数时,我没有正确命名它们。所以我需要重新排序所有这些以便能够使用 textclean::mgsub()。

是否有(以编程方式)一种优雅的方式来在这两个函数之间切换而无需更改参数的顺序?

0 投票
1 回答
60 浏览

r - R-文本分析-打印包含二元组的特定文本

使用 R 进行文本分析。

我的数据集是来自 2000 个不同调查的 2000 条评论。我创建了 Bi-gram。我检查了单词的频率,然后使用 进行单词聚类分析hclust(),然后使用 进行单词关联findAssocs,例如findAssocs(bigram_dtm,"long time",0.2)

例如,我看到“长时间”与“感觉等待”的关联度为 0.66。

我试图在网上找到它,但还没有成功...... 问题:有什么办法可以打印出这个 bi_gram 在一起的评论吗?有什么办法可以打印“长时间”的评论吗?

谢谢,