2

我正在为矩阵乘法制作 Strassen 算法。该算法的基础是将矩阵 A (N * N) 划分为 A1-A4 (N / 2 * N / 2) 的四分之一。为此,我使用循环并为矩阵的每个四分之一分配内存。

    int r;
    double[,] A = new double[r, r]; 
    double[,] A1 = new double[r / 2, r / 2];
    double[,] A2 = new double[r / 2, r / 2];
    double[,] A3 = new double[r / 2, r / 2];
    double[,] A4 = new double[r / 2, r / 2];
    for (int i = 0; i < r / 2; i++)
    for (int j = 0; j < r / 2; j++)
    {
    A1[i, j] = A[i, j];
    }
    for (int i = 0; i < r / 2; i++)
    for (int j = r / 2; j < r; j++)
    {
    A2[i, j - r / 2] = A[i, j];
    }
    for (int i = r / 2; i < r; i++)
    for (int j = 0; j < r / 2; j++)
    {
    A3[i - r / 2, j] = A[i, j];
    }
    for (int i = r / 2; i < r; i++)
    for (int j = r / 2; j < r; j++)
    {
    A4[i - r / 2, j - r / 2] = A[i, j];
    }

有没有更简单的方法可以做到这一点,而无需额外的矩阵?(例如 A1=A [0 ... (n / 2)-1, 0 ... (n / 2)-1])?

4

1 回答 1

2

我强烈建议在这里对矩阵使用所谓的Morton 顺序而不是行优先或列优先布局内存布局。数据访问将变得更加容易(为索引计算提供了合适的功能)。此外,可以预先为较小的矩阵分配空间,因此在每次递归调用中都不需要分配和释放。请注意,对于每个较小的矩阵大小,只需要使用一组矩阵,因为实际计算让结果仅从较小的矩阵流向较大的矩阵。

有关更全面的说明,请参见此处(3.3 数据布局)。通常,在课程中教授 Strassen 算法时,不会提及合适的内存布局,这显然会导致对这种实现思想的永久重新发现。

于 2014-05-07T07:36:49.380 回答