Il ruolo del pregiudizio nelle reti neurali

Pubblicato: 2021-03-01

Il pregiudizio è un peso sproporzionato a favore o contro una cosa o un'idea di solito in modo pregiudizievole, ingiusto e chiuso. Nella maggior parte dei casi, il pregiudizio è considerato una cosa negativa perché offusca il tuo giudizio e ti fa prendere decisioni irrazionali.

Tuttavia, il ruolo del bias nella rete neurale e nell'apprendimento profondo è molto diverso. Questo articolo spiegherà il sistema di bias della rete neurale e come dovresti usarlo.

Sommario

Il concetto di dati distorti

Per comprendere un sistema di bias di rete neurale, dovremo prima comprendere il concetto di dati distorti. Ogni volta che si alimenta la rete neurale con i dati, ciò influisce sul comportamento del modello.

Quindi, se alimenti la tua rete neurale con dati distorti, non dovresti aspettarti risultati equi dai tuoi algoritmi. L'uso di dati distorti può far sì che il tuo sistema dia risultati molto imperfetti e inaspettati.

Consideriamo ad esempio il caso di Tay , un chatbot lanciato da Microsoft. Tay era un semplice chatbot per parlare con le persone tramite tweet. Avrebbe dovuto imparare attraverso i contenuti che le persone pubblicano su Twitter. Tuttavia, sappiamo tutti come può essere Twitter. Ha distrutto Tay.

Invece di essere un chatbot semplice e dolce, Tay si è trasformato in un chatbot aggressivo e molto offensivo. Le persone lo stavano rovinando con numerosi post offensivi che fornivano dati distorti a Tay e imparava solo frasi offensive. Tay è stato spento molto presto dopo.

Importanza del bias nella rete neurale

Anche se il caso di Tay è stato molto deludente, non significa che tutti i pregiudizi siano negativi. In effetti, un neurone di bias in una rete neurale è molto cruciale. Nella letteratura sulle reti neurali, li chiamiamo neuroni di polarizzazione.

Una semplice rete neurale ha tre tipi di neuroni:

  1. Input Neurone
  2. Neurone di polarizzazione
  3. Neurone di uscita

Il neurone di input passa semplicemente la funzione dal set di dati mentre il neurone Bias imita la funzione aggiuntiva. Combiniamo il neurone di input con il neurone Bias per ottenere un neurone di output. Tuttavia, si noti che l'input aggiuntivo è sempre uguale a 1. Output Neuron può ricevere input, elaborarli e generare l'output dell'intera rete.

Prendiamo l'esempio di un modello di regressione lineare per comprendere un sistema di bias di rete neurale.

Nella regressione lineare, abbiamo il neurone Input che passa la caratteristica (a1) e il neurone Bias imita lo stesso con (a0).

Entrambi i nostri input (a1, a0) verranno moltiplicati per i rispettivi pesi (w1, w0). Di conseguenza, otterremo Output Neuron come somma dei loro prodotti:

i=0 n a io w io

Un modello di regressione lineare ha i=1 e a0=1. Quindi la rappresentazione matematica del modello è:

y = a 1 w 1 + w 0

Ora, se rimuoviamo il neurone di polarizzazione, non avremmo alcun input di polarizzazione, facendo sì che il nostro modello assomigli a questo:

y = a 1 w 1

Notare la differenza? Senza l'input bias, il nostro modello deve passare per il punto di origine (0,0) nel grafico. La pendenza della nostra linea può cambiare ma ruoterà solo dall'origine.

Per rendere flessibile il nostro modello, dovremo aggiungere l'input bias, che non è correlato a nessun input. Consente al modello di spostarsi su e giù nel grafico a seconda dei requisiti.

Il motivo principale per cui il bias è richiesto nelle reti neurali è che, senza pesi di bias, il tuo modello avrebbe un movimento molto limitato quando si cerca una soluzione.

Ulteriori informazioni sul sistema di bias della rete neurale

Le reti neurali hanno lo scopo di imitare il funzionamento del cervello umano e quindi presentano molte complessità. Comprenderli può essere piuttosto impegnativo.

Il modo migliore per studiare le reti neurali e conoscere il deep learning è attraverso un corso di machine learning e deep learning. Ti insegnerà le basi e i concetti avanzati di questi campi attraverso un curriculum strutturato.

Noi di upGrad offriamo una certificazione PG nel programma di Machine Learning e Deep Learning con IIIT-B. Il corso dura solo sei mesi ed è completamente online. Ciò significa che puoi studiare comodamente da casa tua senza interrompere la tua vita professionale mentre segui questo corso.

Riceverai tutoraggio personalizzato 1:1 da esperti del settore e oltre 240 ore di apprendimento. Devi avere una laurea con il 50% o voti equivalenti per poter beneficiare di questo programma.

Dopo il completamento, riceverai anche assistenza per il posizionamento, inclusa la creazione di curriculum, il portale delle opportunità di lavoro, le assunzioni e molto altro. Assicurati di controllare il corso.

Leggi anche: Idee per progetti di apprendimento automatico

Pensieri finali

Mentre il pregiudizio è considerato una cosa negativa nella nostra vita quotidiana, nel mondo delle reti neurali, è un must. Senza pregiudizi, la tua rete non darebbe buoni risultati, come abbiamo trattato nell'articolo di oggi.

Se conosci qualcuno che è interessato alle reti neurali o sta studiando il deep learning, condividi questo articolo con loro.

I pesi di input possono essere negativi nelle reti neurali?

I pesi possono essere regolati in base a ciò che l'algoritmo di allenamento decide sia adatto. Poiché l'aggiunta di pesi è un metodo utilizzato dai generatori per acquisire la densità di eventi corretta, applicarli nella rete dovrebbe addestrare una rete che presuppone anche la densità di eventi corretta. In realtà, i pesi negativi significano semplicemente che l'aumento dell'input dato porta l'output a diminuire. Pertanto, i pesi di input nelle reti neurali possono essere negativi.

Come possiamo ridurre i pregiudizi nelle reti neurali di qualsiasi organizzazione?

Le organizzazioni dovrebbero stabilire standard, regolamenti e procedure per riconoscere, divulgare e mitigare qualsiasi distorsione del set di dati per tenere sotto controllo la distorsione. Le organizzazioni dovrebbero anche pubblicare le proprie tecniche di selezione e pulizia dei dati, consentendo ad altri di analizzare quando e se i modelli riflettono qualsiasi tipo di pregiudizio. Tuttavia, assicurarsi semplicemente che i set di dati non siano distorti non lo eliminerà completamente. Pertanto, avere diversi team di individui che lavorano allo sviluppo dell'IA dovrebbe rimanere un obiettivo cruciale per le organizzazioni.

Quando c'è una tendenza nei dati di input, si sviluppa il carrozzone, che è un tipo di distorsione. I dati a conferma di questa tendenza crescono di pari passo con il trend. Di conseguenza, i data scientist corrono il pericolo di esagerare il concetto nei dati che raccolgono. Inoltre, qualsiasi rilevanza nei dati potrebbe essere transitoria: l'effetto carrozzone potrebbe svanire rapidamente come è apparso.