问题标签 [probability-distribution]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-3.x - 分组概率分布
我有一个 gps 点的数据框 df。我有划分为网格的地理区域。每个网格单元由数据框中的一对两列(行、列)表示。GPS 点标有其交通方式。我想通过其运输方式计算每个网格单元的概率分布。(有五种交通方式,即步行、自行车、汽车、火车、地铁)。
例如,第 8 行的网格单元,第 8 列包含 638 个 gps 点。598 个步行点和 40 个地铁点那么这个特定网格单元的每种交通方式的概率变为
'''
一种方法是使用 for 循环逐个迭代每个组以获取每种运输方式的频率。但我认为他们应该是更容易或更可推广的方式 或库,只需几行就可以解决这个问题。
附上地理区域的图像,以便更好地理解将每个地理区域划分为由行和列表示的网格单元的问题。每个网格单元包含多个标有其运输方式的 GPS 点。
数据框的 csv 文件可在给定的链接中获得,以使数据更加清晰。 https://drive.google.com/open?id=1R_BBL00G_Dlo-6yrovYJp5zEYLwlMPi9
python - Python 中的 3D 概率密度图
我正在研究一个由“脉冲长度”值和对应于每个脉冲长度的 5 或 6 个“电压值”组成的数据集。第一个值是脉冲长度,然后是电压。找到下表。
15 -56V -47V -53V -50V -50V
16 -49V -46V -52V -47V -50V
17 -50V -51V -47V -50V -49V
18 -50V -51V -48V -48V -45V
19 -49V -51V -45V -47V -52V
20 -45V -47V -50V -47V -54V
21 -46V -52V -52V -49V -54V
22 -53V -51V -53V -56V -52V
23 -52V -45V -51V -56V -53V
24 -51V -52V -54V -58V -52V
25 -56V -53V -57V -55V -53V
26 -53V -52V -55V -52V
27 -54V -49V -56V -54V
28 -52V -52V -57V -56V -53V
29 -63V -60V -54V -58V -61V
30 -59V -70V -61V
我希望 X 和 Y 轴是脉冲长度和电压,我希望 Z 轴是它的概率分布。我有一个使用“电压值”集及其概率的二维图。
图中,红色图表对应一个脉冲长度,绿色图表对应另一个脉冲长度。我尝试使用堆栈溢出中的多元正态分布示例(在 3D 中绘制正态分布)以相同的方式绘制 3D 图。由于我对 3D 绘图的经验很少,因此我无法在同一表面上绘制具有不同 Y 轴“脉冲长度”值的多个表面绘图。我尝试过的代码如下所示。
如果有人可以帮助我对多个脉冲长度做同样的事情,我将非常感激。谢谢你。
python - 从 a 创建数据样本。概率分布与列另一个数据集的 PD 非常接近的数据集
我有一张带有 ID 和年龄的表。让它成为表 1。表 1 中的行是 1000。我有表 2 有 10000 行。我需要从表 2 中选择 1000 行,以便 table2.age 与 table1.age 具有相同的概率分布。有没有办法在python中做到这一点?我不知道从哪里开始。换句话说,让我们估计最适合表 1 中的 1000 个样本的概率分布,然后从另一个表中构造一个样本,该样本将给出最接近原始概率分布估计的拟合。
r - 如何有效地将 dpoibin 分解为 R 中的和数?
Poisson-Binomial 分布涉及具有不同成功概率的独立伯努利试验序列中成功次数的概率。这是二项分布的推广。
使用命令dpoibin
,在poibin
包中,可以获得质量概率函数。例如,使用以下命令:
在向量中包含成功概率的 100 次独立伯努利试验序列中,可以获得 30 次成功的概率Probs_Success
。要计算这个概率,必须将所有可能的长度为 100 的序列的概率相加,其中有 30 次成功和 70 次失败。
问题:如何有效地获得在 R 中生成上述概率的所有和?非常感谢你的帮助。
对于那些对引发此问题的问题感兴趣的人,请单击以下链接:
https://math.stackexchange.com/questions/2924831/bivariate-poisson-binomial-distribution
r - 为什么“dnorm”不将一个概率加起来?
这可能是关于 R 中“dnorm”函数的一些基本/基本问题。假设我通过 z 转换创建了一些 z 分数,并尝试从“dnorm”中得到总和。
如上所述,“dnorm”之和既不是 1 也不是 0。
然后假设即使在我的 z 变换中我也使用零均值和一个标准差。
我仍然没有得到 0 或 1 的总和。
如果我的目的是使概率总和等于 1,因为我需要进一步使用,您建议使用什么方法使用“dnorm”甚至使用其他 PDF 函数?
python - 将二进制数组转换为概率分布
我有一个二维二进制数组,指示在特定坐标处存在半通道(0=不存在,1=存在)。我需要将此数组转换为概率分布,以使用 matplotlib 在全球地图上绘制。
我尝试将数组的每个元素除以计算值的时间量。例如,如果数据是在一个月内获取的,我除以 30。我还尝试取每个值的指数,如下所示:
但一切看起来都不对。有什么建议么?谢谢。
python - 对数据拟合对数正态分布并在 Python 和 R 中执行 Kolmogorov-Smirnov 检验
我正在将我的数据拟合到对数正态,并且我在 Python 和 R 中进行了 KS 测试,我得到了非常不同的结果。
数据是:
在 R 中,代码是:
在 Python 中,代码是:
python-3.x - 如何获取 gensim LDA 中所有文档的 document_topics 分布?
我是 python 新手,我需要构建一个 LDA 项目。完成一些预处理步骤后,这是我的代码:
我想获得文档的主题分布,所有文档并获得10个主题分布的概率,但是当我使用时:
输出只出现
如何获得文档的主题分布?
r - 绘制R中各种分布曲线下的面积
假设我试图为学生 t 分布找到某个值以下的区域。例如,我计算我的 t 检验统计量为 t=1.78,自由度为 23。我知道如何使用 pt() 函数获得 t=1.78 以上曲线下的面积。如何获得具有 23 个自由度的学生分布图和 1.78 以上曲线下的区域阴影。也就是说,我希望用适当的曲线绘制 pt(1.78,23,lower.tail=FALSE)阴影区域。有没有办法做到这一点?
anylogic - 如何从数据库中读取概率分布并将它们保存在集合中
我正在从 Arena 迁移到 AnyLogic,并且对分布有疑问。我需要根据一些代理参数使用不同的分布。我在这里看到了这个建议,但是分布的数量太大了,我不想对它们进行硬编码。
在 Arena 中,可以创建表达式数组并将它们链接到数据库(例如 excel),并使用这些参数从表达式数组中获取分布。我尝试在 AnyLogic 中使用集合来做同样的事情,但无法将字符串(例如“uniform(100,120)”)转换为分布。
- AnyLogic 有没有办法将分布存储在集合中?
- AnyLogic 有没有办法从数据库中读取分布?
谢谢