0

我需要在 n 球上生成随机数据集。我已经设法通过从正态分布中采样点并将它们归一化来生成统一的数据集。IE:

    values = np.random.randn(samples,k)
    for i in range  (0,samples) :
        values[i] /=  np.linalg.norm(values[i], axis=0)

我现在需要做的是生成熵低于统一数据集的数据集。我该怎么做?

是否有一些参数(例如高斯方差)可以保证某个分布 D_1 的熵低于 D_2?

谢谢!

4

1 回答 1

0

选择一个向量offset。将您的点切换到np.linalg.norm(values[i] + offset, axis=0)

这会将点从偏移点移到另一端。您必须尝试使用​​它才能使熵成为您想要的,但一般来说,越接近原点offset,熵就越高。

于 2019-07-29T21:28:29.513 回答