偏差在神经网络中的作用

已发表: 2021-03-01

偏见是不成比例的支持或反对事物或想法的权重，通常以偏见、不公平和狭隘的方式进行。在大多数情况下，偏见被认为是一件消极的事情，因为它会影响你的判断并使你做出非理性的决定。

然而，偏差在神经网络和深度学习中的作用却大不相同。本文将解释神经网络偏差系统以及您应该如何使用它。

有偏数据的概念

要了解神经网络偏差系统，我们首先必须了解偏差数据的概念。每当您向神经网络提供数据时，它都会影响模型的行为。

所以，如果你给你的神经网络提供有偏见的数据，你不应该期望你的算法得到公平的结果。使用有偏见的数据可能会导致您的系统给出非常有缺陷和意想不到的结果。

例如，考虑微软推出的聊天机器人Tay 的案例。 Tay 是一个简单的聊天机器人，用于通过推文与人交谈。它应该通过人们在 Twitter 上发布的内容来学习。但是，我们都知道 Twitter 是怎样的。它摧毁了泰。

Tay 不再是一个简单而可爱的聊天机器人，而是变成了一个具有攻击性且非常具有攻击性的聊天机器人。人们用大量辱骂性的帖子来破坏它，这些帖子向 Tay 提供了有偏见的数据，它只学会了冒犯性的措辞。 Tay 很快就被关掉了。

尽管 Tay 的案例非常令人失望，但这并不意味着所有的偏见都是坏的。事实上，神经网络中的偏置神经元是非常关键的。在神经网络文献中，我们称它们为偏置神经元。

一个简单的神经网络具有三种神经元：

输入神经元简单地传递数据集中的特征，而偏置神经元模仿附加特征。我们将输入神经元与偏置神经元结合起来得到一个输出神经元。但是请注意，附加输入始终等于 1。输出神经元可以获取输入、处理它们并生成整个网络的输出。

让我们以线性回归模型为例来了解神经网络偏差系统。

在线性回归中，我们让 Input 神经元通过特征 (a1)，而 Bias 神经元与 (a0) 模拟相同。

我们的两个输入 (a1, a0) 将乘以它们各自的权重 (w1, w0)。结果，我们将输出神经元作为它们的乘积之和：

i=0 n a i w i

线性回归模型具有 i=1 和 a0=1。所以模型的数学表示为：

y = a 1 w 1 + w 0

现在，如果我们移除偏置神经元，我们将没有任何偏置输入，导致我们的模型看起来像这样：

y = a 1 w 1

注意到区别了吗？如果没有偏差输入，我们的模型必须经过图中的原点 (0,0)。我们线的斜率可以改变，但它只会从原点旋转。

为了使我们的模型灵活，我们必须添加与任何输入无关的偏差输入。它使模型能够根据要求在图形上上下移动。

神经网络中需要偏差的主要原因是，如果没有偏差权重，您的模型在寻找解决方案时的移动非常有限。

神经网络旨在模仿人脑的功能，因此它们具有许多复杂性。理解它们可能非常具有挑战性。

学习神经网络和了解深度学习的最佳方式是通过机器学习和深度学习课程。它将通过结构化的课程教您这些领域的基础知识和高级概念。

我们在 upGrad 提供具有 IIIT-B的机器学习和深度学习计划的 PG 认证。该课程仅持续六个月，并且完全在线。这意味着您可以在舒适的家中学习，而无需在学习本课程时中断您的职业生活。

您将获得来自行业专家的 1:1 个性化指导和超过 240 小时的学习时间。您必须拥有 50% 或同等及格分数的学士学位才有资格参加该计划。

完成后，您还将获得安置帮助，包括简历制作、工作机会门户、招聘驱动器等等。请务必查看课程。

另请阅读：机器学习项目理念

虽然偏见在我们的日常生活中被认为是一件坏事，但在神经网络的世界中，它是必不可少的。正如我们在今天的文章中所介绍的那样，如果没有偏见，您的网络就不会产生好的结果。

如果您认识对神经网络感兴趣或正在研究深度学习的人，请与他们分享这篇文章。

权重可以调整为训练算法决定的任何合适的值。由于添加权重是生成器用来获取正确事件密度的一种方法，因此在网络中应用它们应该训练一个也假设正确事件密度的网络。实际上，负权重只是表示增加给定输入会导致输出减少。因此，神经网络中的输入权重可以是负数。

组织应建立识别、披露和减轻任何数据集偏差的标准、法规和程序，以控制偏差。组织还应该公布他们的数据选择和清理技术，允许其他人分析模型何时以及是否反映了任何类型的偏见。然而，仅仅确保数据集没有偏差并不能完全消除它。因此，拥有致力于人工智能开发的多元化个人团队应该仍然是组织的一个关键目标。

当输入数据有趋势时，就会出现跟风，这是一种偏差。证实这种趋势的数据与趋势同步增长。结果，数据科学家冒着夸大他们收集的数据中的概念的危险。此外，数据中的任何相关性都可能是暂时的：潮流效应可能会像它出现的那样迅速消失。