偏差在神经网络中的作用是什么?

我知道梯度下降和反向传播算法。我不明白的是:什么时候使用偏见是重要的，你如何使用它?

例如，在映射AND函数时，当我使用两个输入和一个输出时，它不会给出正确的权重。然而，当我使用三个输入(其中一个是偏差)时，它给出了正确的权重。

当前回答

在神经网络中:

每个神经元都有一个偏向您可以将偏差视为阈值(通常是阈值的相反值) 输入层的加权和+偏置决定神经元的激活偏差增加了模型的灵活性。

在没有偏差的情况下，仅考虑来自输入层的加权和可能不会激活神经元。如果神经元没有被激活，来自该神经元的信息就不会通过神经网络的其余部分传递。

偏见的价值是可以学习的。

实际上，bias = - threshold。你可以把偏差想象成让神经元输出1有多容易，如果偏差很大，神经元输出1很容易，但如果偏差很大，就很难了。

总而言之:偏置有助于控制激活函数的触发值。

观看这段视频了解更多细节。

一些更有用的链接:

Geeksforgeeks

走向数据科学

2019-02-12 14:00:52

其他回答

如果您正在处理图像，实际上可能更喜欢完全不使用偏置。从理论上讲，这样你的网络将更独立于数据量，比如图片是暗的，还是亮的和生动的。网络将通过研究你的数据中的相对性来学习它的工作。很多现代神经网络都利用了这一点。

对于其他有偏差的数据可能是至关重要的。这取决于你要处理什么类型的数据。如果您的信息是大小不变的——如果输入[1,0,0.1]应该会导致与输入[100,0,10]相同的结果，那么没有偏差可能会更好。

2016-09-20 19:55:33

我认为偏见几乎总是有益的。实际上，偏差值允许您将激活函数向左或向右移动，这可能对成功学习至关重要。

看一个简单的例子可能会有所帮助。考虑这个无偏差的1输入1输出网络:

网络的输出是通过将输入(x)乘以权重(w0)并将结果传递给某种激活函数(例如sigmoid函数)来计算的。

下面是这个网络计算的函数，对于不同的w0值:

改变权重w0本质上改变了s型曲线的“陡度”。这很有用，但是如果你想让x = 2时网络输出0呢?仅仅改变s型曲线的陡度是行不通的——你希望能够将整条曲线向右平移。

这正是偏差允许你做的。如果我们给这个网络加上一个偏差，像这样:

.．.然后网络的输出变成sig(w0*x + w1*1.0)。下面是不同w1值的网络输出:

如果w1的权值为-5，曲线就会向右平移，这样当x = 2时，网络的输出就会为0。

2010-03-23 12:50:07

在我的硕士论文中的几个实验中(例如第59页)，我发现偏差可能对第一层很重要，但特别是在最后的完全连接层，它似乎没有发挥很大的作用。

这可能高度依赖于网络架构/数据集。

2017-08-01 17:09:42

一个更简单的理解偏差的方法是:它在某种程度上类似于线性函数的常数b

y = ax + b

它允许你上下移动这条线，以便更好地将预测与数据相匹配。

如果没有b，直线总是经过原点(0,0)你可能会得到一个较差的拟合。

2014-11-04 00:32:57

扩展zfy的解释:

一个输入，一个神经元，一个输出的方程如下:

y = a * x + b * 1    and out = f(y)

其中x是输入节点的值，1是偏置节点的值; Y可以直接作为输出，也可以传递给一个函数，通常是一个sigmoid函数。还要注意，偏差可以是任何常数，但为了使一切更简单，我们总是选择1(可能这太常见了，zfy没有显示和解释它)。

你的网络试图学习系数a和b来适应你的数据。所以你可以看到为什么添加元素b * 1可以让它更好地适应更多的数据:现在你可以改变斜率和截距。

如果你有一个以上的输入，你的方程将是这样的:

y = a0 * x0 + a1 * x1 + ... + aN * 1

请注意，这个方程仍然描述一个神经元，一个输出网络;如果你有更多的神经元，你只需在系数矩阵中增加一个维度，将输入相乘到所有节点，然后将每个节点的贡献相加。

可以写成向量化的形式

A = [a0, a1, .., aN] , X = [x0, x1, ..., 1]
Y = A . XT

即，将系数放在一个数组中，(输入+偏差)放在另一个数组中，你就有了你想要的解决方案，作为两个向量的点积(你需要转置X的形状是正确的，我写了XT a 'X转置')

所以最后你也可以看到你的偏差只是一个输入来代表输出的那部分实际上是独立于你的输入的。

2016-09-10 06:39:20

偏差在神经网络中的作用是什么?

推荐文章

最新文章

标签