偏差在神经网络中的作用是什么?

神经网络中没有偏差的一层只不过是输入向量与矩阵的乘法。(输出向量可以通过一个sigmoid函数进行归一化，然后用于多层人工神经网络，但这并不重要。)

这意味着你在使用一个线性函数，因此一个全0的输入将总是映射到一个全0的输出。对于某些系统，这可能是一个合理的解决方案，但一般来说，它的限制太大了。

使用偏置，可以有效地为输入空间增加另一个维度，它总是取值1，因此可以避免输入向量全为0。你不会因此失去任何一般性，因为你训练的权重矩阵不需要是满射的，所以它仍然可以映射到之前可能的所有值。

二维安:

对于一个将二维映射到一维的ANN，就像在复制AND或or(或XOR)函数一样，你可以把一个神经元网络想象成做以下事情:

在二维平面上标记输入向量的所有位置。为布尔值,你想标记(1,1),(1,1),(1,1),(1,1)。你的人工神经网络现在做的是在二维平面上画一条直线，把正输出和负输出分开。

如果没有偏差，这条直线必须经过零，而有偏差，你可以把它放在任何地方。因此，您将看到，如果没有偏差，您将面临与函数的问题，因为您不能同时将(1，-1)和(-1,1)放在负一侧。(他们不允许在线。)对于OR函数，问题是相等的。然而，有了偏见，就很容易划清界限。

请注意，在这种情况下，异或函数即使有偏差也无法求解。

下面是一些进一步的插图，展示了一个简单的2层前馈神经网络在一个双变量回归问题上的结果。权重被随机初始化，并使用标准的ReLU激活。正如我前面的答案所总结的那样，没有偏差，relu网络无法在(0,0)处偏离零。

当您使用ann时，您很少了解您想要学习的系统的内部结构。有些东西没有偏见是学不来的。例如，看一下下面的数据:(0,1)，(1,1)，(2,1)，基本上是一个将任何x映射到1的函数。

如果你有一个单层网络(或线性映射)，你无法找到解决方案。然而，如果你有偏见，那就无关紧要了!

在理想情况下，偏差还可以将所有点映射到目标点的平均值，并让隐藏的神经元模拟该点的差异。

神经网络中没有偏差的一层只不过是输入向量与矩阵的乘法。(输出向量可以通过一个sigmoid函数进行归一化，然后用于多层人工神经网络，但这并不重要。)

这意味着你在使用一个线性函数，因此一个全0的输入将总是映射到一个全0的输出。对于某些系统，这可能是一个合理的解决方案，但一般来说，它的限制太大了。

使用偏置，可以有效地为输入空间增加另一个维度，它总是取值1，因此可以避免输入向量全为0。你不会因此失去任何一般性，因为你训练的权重矩阵不需要是满射的，所以它仍然可以映射到之前可能的所有值。

二维安:

对于一个将二维映射到一维的ANN，就像在复制AND或or(或XOR)函数一样，你可以把一个神经元网络想象成做以下事情:

在二维平面上标记输入向量的所有位置。为布尔值,你想标记(1,1),(1,1),(1,1),(1,1)。你的人工神经网络现在做的是在二维平面上画一条直线，把正输出和负输出分开。

如果没有偏差，这条直线必须经过零，而有偏差，你可以把它放在任何地方。因此，您将看到，如果没有偏差，您将面临与函数的问题，因为您不能同时将(1，-1)和(-1,1)放在负一侧。(他们不允许在线。)对于OR函数，问题是相等的。然而，有了偏见，就很容易划清界限。

请注意，在这种情况下，异或函数即使有偏差也无法求解。

单独修改神经元WEIGHTS只用于操纵传递函数的形状/曲率，而不是它的平衡/零交叉点。

引入偏置神经元允许您沿着输入轴水平(左/右)移动传递函数曲线，同时保持形状/曲率不变。这将允许网络产生不同于默认值的任意输出，因此您可以自定义/移动输入到输出映射以满足您的特定需求。

请看这里的图表解释: http://www.heatonresearch.com/wiki/Bias

偏差决定了你的体重旋转的角度。

在二维图表中，权重和偏差可以帮助我们找到输出的决策边界。

假设我们需要构建一个AND函数，输入(p)-输出(t)对应该是

{p=[0，0]， t=0}，{p=[1，0]， t=0}，{p=[0，1]， t=0}，{p=[1，1]， t=1}

现在我们需要找到一个决策边界，理想的边界应该是:

看到了吗?W垂直于边界。因此，我们说W决定了边界的方向。

但是，第一次找到正确的W是很困难的。大多数情况下，我们随机选择原始W值。因此，第一个边界可能是这样的:

现在边界平行于y轴。

我们要旋转边界。如何?

通过改变W。

因此，我们使用学习规则函数W'=W+P:

W'=W+P等价于W'=W+ bP，而b=1。

因此，通过改变b(bias)的值，就可以决定W’和W之间的夹角，这就是“ANN的学习规则”。

你也可以阅读Martin T. Hagan / Howard B. Demuth / Mark H. Beale的《神经网络设计》，第4章“感知器学习规则”。

推荐文章