El papel del sesgo en las redes neuronales

Publicado: 2021-03-01

El sesgo es un peso desproporcionado a favor o en contra de una cosa o idea, generalmente de una manera perjudicial, injusta y de mente cerrada. En la mayoría de los casos, el sesgo se considera algo negativo porque nubla tu juicio y te hace tomar decisiones irracionales.

Sin embargo, el papel del sesgo en la red neuronal y el aprendizaje profundo es muy diferente. Este artículo explicará el sistema de sesgo de la red neuronal y cómo debe usarlo.

Tabla de contenido

El concepto de datos sesgados

Para entender un sistema de sesgo de red neuronal, primero tendremos que entender el concepto de datos sesgados. Cada vez que alimenta su red neuronal con datos, afecta el comportamiento del modelo.

Entonces, si alimenta su red neuronal con datos sesgados, no debe esperar resultados justos de sus algoritmos. El uso de datos sesgados puede hacer que su sistema proporcione resultados muy defectuosos e inesperados.

Por ejemplo, considere el caso de Tay , un chatbot lanzado por Microsoft. Tay era un simple chatbot para hablar con la gente a través de tweets. Se suponía que debía aprender a través del contenido que la gente publica en Twitter. Sin embargo, todos sabemos cómo puede ser Twitter. Destruyó a Tay.

En lugar de ser un chatbot simple y dulce, Tay se convirtió en un chatbot agresivo y muy ofensivo. La gente lo estropeaba con numerosas publicaciones abusivas que alimentaban datos sesgados a Tay y solo aprendió frases ofensivas. Tay se apagó muy pronto después de eso.

Importancia del sesgo en la red neuronal

Aunque el caso de Tay fue muy decepcionante, no significa que todos los prejuicios sean malos. De hecho, una neurona de sesgo en una red neuronal es muy crucial. En la literatura de redes neuronales, las llamamos neuronas sesgadas.

Una red neuronal simple tiene tres tipos de neuronas:

  1. Neurona de entrada
  2. Neurona de polarización
  3. Neurona de salida

La neurona de entrada simplemente pasa la característica del conjunto de datos mientras que la neurona de polarización imita la característica adicional. Combinamos la neurona de entrada con la neurona de polarización para obtener una neurona de salida. Sin embargo, tenga en cuenta que la entrada adicional siempre es igual a 1. La neurona de salida puede tomar entradas, procesarlas y generar la salida de toda la red.

Tomemos el ejemplo de un modelo de regresión lineal para comprender un sistema de sesgo de red neuronal.

En la regresión lineal, tenemos la neurona de entrada que pasa la función (a1) y la neurona de polarización imita lo mismo con (a0).

Nuestras dos entradas (a1, a0) se multiplicarán por sus respectivos pesos (w1, w0). Como resultado, obtendremos la neurona de salida como la suma de sus productos:

i=0 n a i w i

Un modelo de regresión lineal tiene i=1 y a0=1. Entonces la representación matemática del modelo es:

y = un 1 w 1 + w 0

Ahora, si eliminamos la neurona de sesgo, no tendríamos ninguna entrada de sesgo, lo que haría que nuestro modelo se viera así:

y = un 1 w 1

¿Notas la diferencia? Sin la entrada de sesgo, nuestro modelo debe pasar por el punto de origen (0,0) en el gráfico. La pendiente de nuestra línea puede cambiar, pero solo girará desde el origen.

Para que nuestro modelo sea flexible, tendremos que agregar la entrada de sesgo, que no está relacionada con ninguna entrada. Permite que el modelo se mueva hacia arriba y hacia abajo en el gráfico según los requisitos.

La razón principal por la que se requiere sesgo en las redes neuronales es que, sin pesos de sesgo, su modelo tendría un movimiento muy limitado al buscar una solución.

Obtenga más información sobre el sistema de polarización de redes neuronales

Las redes neuronales tienen como objetivo imitar el funcionamiento del cerebro humano y, por lo tanto, tienen muchas complejidades. Comprenderlos puede ser bastante desafiante.

La mejor manera de estudiar las redes neuronales y aprender sobre el aprendizaje profundo es a través de un curso de aprendizaje automático y aprendizaje profundo. Le enseñará los conceptos básicos y avanzados de estos campos a través de un plan de estudios estructurado.

En upGrad ofrecemos un programa de Certificación PG en Aprendizaje Automático y Aprendizaje Profundo con IIIT-B. El curso tiene una duración de solo seis meses y es completamente en línea. Esto significa que puedes estudiar desde la comodidad de tu hogar sin interrumpir tu vida profesional mientras tomas este curso.

Obtendrá tutoría personalizada 1: 1 de expertos de la industria y más de 240 horas de aprendizaje. Debe tener una licenciatura con un 50% o calificaciones de aprobación equivalentes para ser elegible para este programa.

Después de completarlo, también recibirá asistencia de colocación, incluida la creación de un currículum, un portal de oportunidades laborales, campañas de contratación y mucho más. Asegúrese de revisar el curso.

Lea también: Ideas de proyectos de aprendizaje automático

Pensamientos finales

Si bien el sesgo se considera algo malo en nuestra vida diaria, en el mundo de las redes neuronales es imprescindible. Sin prejuicios, su red no daría buenos resultados, como cubrimos en el artículo de hoy.

Si conoce a alguien que esté interesado en las redes neuronales o esté estudiando el aprendizaje profundo, comparta este artículo con ellos.

¿Pueden los pesos de entrada ser negativos en las redes neuronales?

Los pesos se pueden ajustar a lo que el algoritmo de entrenamiento decida que es adecuado. Dado que agregar pesos es un método utilizado por los generadores para adquirir la densidad de eventos adecuada, aplicarlos en la red debería entrenar una red que también asuma la densidad de eventos correcta. En realidad, los pesos negativos simplemente significan que aumentar la entrada dada hace que la salida disminuya. Por lo tanto, los pesos de entrada en las redes neuronales pueden ser negativos.

¿Cómo podemos reducir el sesgo en las redes neuronales de cualquier organización?

Las organizaciones deben establecer estándares, regulaciones y procedimientos para reconocer, divulgar y mitigar cualquier sesgo en el conjunto de datos para mantener el sesgo bajo control. Las organizaciones también deben publicar sus técnicas de selección y limpieza de datos, lo que permite que otros analicen cuándo y si los modelos reflejan algún tipo de sesgo. Sin embargo, simplemente asegurarse de que los conjuntos de datos no estén sesgados no lo eliminará por completo. Por lo tanto, tener diversos equipos de personas que trabajen en el desarrollo de IA debe seguir siendo un objetivo crucial para las organizaciones.

Cuando hay una tendencia en los datos de entrada, se desarrolla una tendencia, que es un tipo de sesgo. Los datos que confirman esta tendencia crecen a la par de la tendencia. Como resultado, los científicos de datos corren el peligro de exagerar el concepto en los datos que recopilan. Además, cualquier relevancia en los datos podría ser transitoria: el efecto del carro podría desaparecer tan rápido como apareció.