Роль смещения в нейронных сетях

Опубликовано: 2021-03-01

Предвзятость - это непропорциональное значение в пользу или против вещи или идеи, обычно предвзятое, несправедливое и недалекое. В большинстве случаев предвзятость считается негативной вещью, потому что она затуманивает ваши суждения и заставляет вас принимать иррациональные решения.

Однако роль смещения в нейронной сети и глубоком обучении сильно различается. В этой статье будет рассказано о системе смещения нейронной сети и о том, как ее использовать.

Оглавление

Концепция необъективных данных

Чтобы понять систему смещения нейронной сети, нам сначала нужно понять концепцию смещенных данных. Всякий раз, когда вы загружаете свою нейронную сеть данными, это влияет на поведение модели.

Таким образом, если вы снабжаете свою нейронную сеть предвзятыми данными, вам не следует ожидать честных результатов от ваших алгоритмов. Использование необъективных данных может привести к тому, что ваша система будет давать очень ошибочные и неожиданные результаты.

Например, рассмотрим случай Tay , чат-бота, запущенного Microsoft. Tay был простым чат-ботом для общения с людьми через твиты. Предполагалось, что они будут учиться через контент, который люди публикуют в Твиттере. Тем не менее, мы все знаем, каким может быть Twitter. Это уничтожило Тай.

Вместо того, чтобы быть простым и милым чат-ботом, Тай превратился в агрессивного и очень оскорбительного чат-бота. Люди портили его многочисленными оскорбительными постами, которые передавали Тэю необъективные данные, и он узнавал только оскорбительные фразы. Тай был отключен очень скоро после этого.

Важность смещения в нейронной сети

Несмотря на то, что случай с Тэем был очень разочаровывающим, это не значит, что всякая предвзятость — это плохо. На самом деле нейрон смещения в нейронной сети очень важен. В литературе по нейронным сетям мы называем их нейронами смещения.

Простая нейронная сеть состоит из трех типов нейронов:

  1. Входной нейрон
  2. Нейрон смещения
  3. Выходной нейрон

Входной нейрон просто передает признак из набора данных, а нейрон смещения имитирует дополнительный признак. Мы объединяем входной нейрон с нейроном смещения, чтобы получить выходной нейрон. Однако обратите внимание, что дополнительный вход всегда равен 1. Выходной нейрон может принимать входные данные, обрабатывать их и генерировать выходные данные всей сети.

Давайте возьмем пример модели линейной регрессии, чтобы понять систему смещения нейронной сети.

В линейной регрессии у нас есть входной нейрон, передающий функцию (a1), а нейрон смещения имитирует то же самое с (a0).

Оба наших входа (a1, a0) будут умножены на их соответствующие веса (w1, w0). В результате мы получим Выходной Нейрон как сумму их произведений:

я=0 н а я ш я

Модель линейной регрессии имеет i=1 и a0=1. Итак, математическое представление модели:

у = а 1 ш 1 + ш 0

Теперь, если мы удалим нейрон смещения, у нас не будет никаких входных данных смещения, в результате чего наша модель будет выглядеть так:

у = а 1 ш 1

Заметили разницу? Без ввода смещения наша модель должна пройти через исходную точку (0,0) на графике. Наклон нашей линии может измениться, но она будет вращаться только от начала координат.

Чтобы сделать нашу модель гибкой, нам нужно добавить вход смещения, который не связан ни с каким входом. Это позволяет модели перемещаться вверх и вниз по графику в зависимости от требований.

Основная причина, по которой в нейронных сетях требуется смещение, заключается в том, что без весов смещения ваша модель будет иметь очень ограниченное движение при поиске решения.

Узнайте больше о системе смещения нейронной сети

Нейронные сети призваны имитировать работу человеческого мозга, поэтому в них много сложностей. Понимание их может быть довольно сложным.

Лучший способ изучить нейронные сети и узнать о глубоком обучении — пройти курс машинного обучения и глубокого обучения. Он научит вас основам и продвинутым концепциям этих областей через структурированную учебную программу.

Мы в upGrad предлагаем сертификацию PG по программе машинного обучения и глубокого обучения с IIIT-B. Курс длится всего полгода и полностью онлайн. Это означает, что вы можете учиться, не выходя из дома, не прерывая свою профессиональную жизнь во время прохождения этого курса.

Вы получите индивидуальное наставничество 1:1 от отраслевых экспертов и более 240 часов обучения. Вы должны иметь степень бакалавра с 50% или эквивалентными проходными баллами, чтобы иметь право на участие в этой программе.

После завершения вы также получите помощь в трудоустройстве, включая составление резюме, портал вакансий, подбор персонала и многое другое. Обязательно посмотрите курс.

Читайте также: Идеи проекта машинного обучения

Последние мысли

В то время как предвзятость считается плохой вещью в нашей повседневной жизни, в мире нейронных сетей она необходима. Без предвзятости ваша сеть не дала бы хороших результатов, как мы рассмотрели в сегодняшней статье.

Если вы знаете кого-то, кто интересуется нейронными сетями или изучает глубокое обучение, поделитесь с ним этой статьей.

Могут ли входные веса быть отрицательными в нейронных сетях?

Веса могут быть настроены на то, что алгоритм обучения сочтет подходящим. Поскольку добавление весов — это метод, используемый генераторами для получения надлежащей плотности событий, их применение в сети должно обучать сеть, которая также предполагает правильную плотность событий. На самом деле отрицательные веса просто означают, что увеличение данного входа приводит к уменьшению выхода. Таким образом, входные веса в нейронных сетях могут быть отрицательными.

Как мы можем уменьшить предвзятость в нейронных сетях любой организации?

Организации должны установить стандарты, правила и процедуры для распознавания, раскрытия и смягчения любой систематической ошибки в наборе данных, чтобы держать систематическую ошибку под контролем. Организации также должны публиковать свои методы отбора и очистки данных, чтобы другие могли анализировать, когда и отражают ли модели какие-либо предвзятости. Однако простое обеспечение того, чтобы наборы данных не были предвзятыми, не устранит его полностью. Таким образом, наличие различных групп людей, работающих над разработкой ИИ, должно оставаться важнейшей целью для организаций.

Когда во входных данных есть тенденция, развивается группировка, которая является своего рода предвзятостью. Данные, подтверждающие эту тенденцию, растут в ногу с тенденцией. В результате специалисты по данным рискуют преувеличить значение концепции в собираемых ими данных. Кроме того, любая релевантность данных может быть преходящей: эффект побеждающей стороны может исчезнуть так же быстро, как и появился.