tensorflow - 张量流中急切和非急切执行之间的矩阵乘法

Question

当 tensorflow 在 Eager 模式与图形模式下运行时，矩阵乘法值会有所不同

tensorflow 中急切和非急切执行的代码流是不同的。但是这些值必须理想地匹配，但事实并非如此。

急切执行：

import tensorflow as tf
from tensorflow.python.ops import gen_math_ops
import numpy as np
tf.enable_eager_execution()

dZ = np.array([[ 0.1,  0.1,  0.1,  0.1,  0.1,  0.1, -0.9,  0.1,  0.1,  0.1]])
FC_W = np.array([[1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.]])
import pdb
pdb.set_trace()
a = gen_math_ops.mat_mul(dZ, FC_W, False, True)

print(a)

急切执行的输出：[[-2.77555756e-17 -2.77555756e-17 -2.77555756e-17]

图表执行：

import tensorflow as tf
from tensorflow.python.ops import gen_math_ops
import numpy as np

dZ = np.array([[ 0.1,  0.1,  0.1,  0.1,  0.1,  0.1, -0.9,  0.1,  0.1,  0.1]])

FC_W = np.array([[1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.]])
a = gen_math_ops.mat_mul(dZ, FC_W, False, True)

sess = tf.InteractiveSession()
print(str(sess.run(a)))

图执行的输出：[[-5.55111512e-17 -5.55111512e-17 -5.55111512e-17]]

对于简单的矩阵乘法，这两种模式之间的输出差异不是很大吗？（虽然是e-17）

score 0 · Accepted Answer

产生的差异是由于计算精度和操作的不同排序或分组造成的。这会导致舍入效应。

C#我用一个程序复制了你的发现：

 double[] a = new double[] { 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, -0.9, 0.1, 0.1, 0.1 };
 double[] b = new double[] { 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0 };
 double sum = 0;

 for (int i = 0; i < a.Length; i++)
 {
    sum += a[i] * b[i];
 }

 Console.WriteLine($"{sum}");

 sum = (a[0]*b[0] + a[1]*b[1]) 
     + (a[2]*b[2] + a[3]*b[3]) 
     + (a[4]*b[4] + a[5]*b[5]) 
     + (a[6]*b[6] + a[7]*b[7]) 
     + (a[8]*b[8] + a[9]*b[9]);

 Console.WriteLine($"{sum}");

 //  output:  
 //  -2.77555756156289E-17
 //  5.55111512312578E-17

顺便说一句：
微软Excel365提供了正确的零作为结果，没有明显的舍入。

tensorflow - 张量流中急切和非急切执行之间的矩阵乘法

1 回答 1

Related

Reference