问题标签 [probability-distribution]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1237 浏览

r - 用汽车包拟合二项分布

为了拟合我的数据集的几个概率分布,我尝试了几个使用carMASS包的分布,例如泊松分布:

但是,如果我的选择是二项分布,MASS包不支持这种分布,那么我使用fitdistrplus包:

当我尝试:

不起作用包的qqp功能。car还有其他选项可以拟合二项式分布,例如qqp函数吗?

谢谢,

0 投票
1 回答
104 浏览

math - 条件互信息符号

这可能是一个幼稚的问题,但我真的很挣扎。我查看了许多介绍互信息和条件互信息公式的论文和文章。他们通常以两种方式编写:

  1. 第一个公式

  1. 第二个公式

这些公式实际上是等效的吗?实际上和PX(x)的意思一样P(x)吗?

0 投票
1 回答
1607 浏览

r - 从 R 中的数据帧计算边际概率

我想从包含原始二进制数据的数据框中计算边际概率分布。我确信有一种简单的方法,但是我似乎找不到它的功能。有任何想法吗?我附上了一个二进制变量数据框的简单示例,其中可以将结果视为 1,而没有结果可以视为 0。

0 投票
1 回答
170 浏览

machine-learning - 从有向图 G 中删除一条边

如果我们从有向图 G 中删除一条边(新图 G')会发生什么?例如,分解 G 的概率分布 P 是否也分解了 G'?如果 G 和 G' 是无向图会发生什么?

任何帮助将不胜感激!

0 投票
0 回答
42 浏览

python - 朴素贝叶斯 P(Y|X) 分布建模

我的任务是编写函数,为每个类返回 P(y|x) 分布(使用朴素贝叶斯分类器)。结果是 N x M 矩阵。

输入数据

当前代码

到目前为止,我的尝试,如果有人可以尝试使用数学逻辑,因为我必须错过一些东西,因为提供的测试没有通过。

我尽力了,但我的数学逻辑一定有错误。

0 投票
3 回答
9964 浏览

python - 将形状元组传递给 Numpy `random.rand`

我正在使用np.random.rand创建所需形状的矩阵/张量。但是,这个形状参数(在运行时生成)是一个元组,例如:(2, 3, 4)。我们如何shape在 中使用它np.random.rand

这样做np.random.rand(shape)不起作用,并会出现以下错误:

TypeError: 'tuple' object cannot be interpreted as an index

0 投票
0 回答
46 浏览

python - 如何将概率分布拟合到 R 或 Python 中的多变量数据?

我有 250000 个点的数据集,其中有 15 个特征。每个特征的取值范围为 0 到 100。

所以,我想为这个数据集拟合一个概率分布来识别异常值,比如错误的数据输入。

对于fitdistR 中的单变量,多变量呢?

如何在 R 或 Python 中有效地做到这一点?

0 投票
1 回答
215 浏览

python - 从python中的csv文件中的概率生成数字

我有一个包含不同案例的 excel 文件,每个案例大约有 75 个事件。给定每种情况,每个事件都有发生的概率。所以excel文件是这样的:

我想在 python 中生成一个随机数,范围从 0 到 75 以及给定案例的概率。当我处理仅可能发生 2 个事件的案例时,我使用了如下代码:

但是,当事件范围变大时,我不知道什么是更有效的方法。谢谢您的帮助。

*与其他问题不同,因为我从 Excel 中获取概率

0 投票
0 回答
49 浏览

python - 为什么根据 cdf 计算的概率分布函数下的面积不等于 1?

所以,我有一组概率(z_scaled),我正在尝试绘制分布的 PDF 以及 CDF。现在我的代码如下:

现在,cdf 看起来像这样:

CDF

使用梯度函数从 CDF 计算得到的 PDF 如下所示:

PDF格式

我的问题是,为什么据此计算的 PDF 下的面积不等于 1?

0 投票
1 回答
89 浏览

c - 在 c 中编码离散分布时的精度问题

我对 C 语言比较陌生,所以当谈到精度问题时,我总是有点担心。我正在使用一个相当大的代码,并且在特定点我需要根据离散概率分布选择一个值。本质上,我需要做的是选择一个值 k=1,2,...N,其概率由公式给出

P(k) = [e a*F(k) ]/[Σ i=1,...,N e aF(i) ],

其中 F 只是一些使用 k 作为输入的函数,而 a 是一个实数。[抱歉,公式看起来很粗糙,我不确定如何格式化。] 到目前为止,我的代码看起来(大致)像这样。我不得不做出一些改变以帮助脱离上下文的可读性。

从数学角度来看,这应该会给出预期的结果,但是比我更擅长编码的人说 xtemp 可能会出现问题并且变得不精确。我想知道您如何为此进行错误处理?我也愿意以更好的方式来实现这个想法。我感谢任何帮助和建议。