Rola stronniczości w sieciach neuronowych
Opublikowany: 2021-03-01Stronniczość to nieproporcjonalna waga na korzyść lub przeciw jakiejś rzeczy lub idei, zwykle w sposób krzywdzący, niesprawiedliwy i ograniczony. W większości przypadków stronniczość jest uważana za rzecz negatywną, ponieważ zaciemnia Twój osąd i sprawia, że podejmujesz irracjonalne decyzje.
Jednak rola stronniczości w sieciach neuronowych i głębokim uczeniu się jest zupełnie inna. W tym artykule wyjaśnimy system stronniczości sieci neuronowej i sposób, w jaki należy go używać.
Spis treści
Pojęcie tendencyjnych danych
Aby zrozumieć system stronniczości sieci neuronowej, najpierw musimy zrozumieć pojęcie stronniczości danych. Za każdym razem, gdy zasilasz swoją sieć neuronową danymi, wpływa to na zachowanie modelu.
Tak więc, jeśli zasilasz swoją sieć neuronową stronniczymi danymi, nie powinieneś oczekiwać uczciwych wyników od swoich algorytmów. Korzystanie z tendencyjnych danych może spowodować, że system będzie dawać bardzo błędne i nieoczekiwane wyniki.
Rozważmy na przykład przypadek Tay , chatbota uruchomionego przez Microsoft. Tay był prostym chatbotem do rozmawiania z ludźmi poprzez tweety. Miał się uczyć dzięki treściom publikowanym na Twitterze. Jednak wszyscy wiemy, jak może być Twitter. Zniszczyło Tay.
Zamiast być prostym i słodkim chatbotem, Tay zmienił się w agresywnego i bardzo ofensywnego chatbota. Ludzie psuli go licznymi obraźliwymi postami, które dostarczały Tayowi tendencyjnych danych i uczyły się tylko obraźliwych fraz. Tay został wyłączony bardzo szybko po tym.
Znaczenie błędu systematycznego w sieci neuronowej
Chociaż przypadek Tay był bardzo rozczarowujący, nie oznacza to, że wszystkie uprzedzenia są złe. W rzeczywistości neuron uprzedzeń w sieci neuronowej jest bardzo istotny. W literaturze sieci neuronowych nazywamy je neuronami biasu.
Prosta sieć neuronowa ma trzy rodzaje neuronów:
- Wejście Neuron
- Odchylenie neuronu
- Wyjście Neuron
Neuron Input po prostu przekazuje cechę ze zbioru danych, podczas gdy neuron Bias imituje dodatkową cechę. Łączymy neuron wejściowy z neuronem Bias, aby uzyskać neuron wyjściowy. Zauważ jednak, że dodatkowe dane wejściowe są zawsze równe 1. Neuron wyjściowy może pobierać dane wejściowe, przetwarzać je i generować dane wyjściowe całej sieci.
Weźmy przykład modelu regresji liniowej, aby zrozumieć system stronniczości sieci neuronowej.
W regresji liniowej neuron wejściowy przekazuje cechę (a1), a neuron Bias naśladuje to samo z (a0).
Oba nasze dane wejściowe (a1, a0) zostaną pomnożone przez ich odpowiednie wagi (w1, w0). W rezultacie otrzymamy Output Neuron jako sumę ich produktów:
ja=0 n za ja w ja
Model regresji liniowej ma i=1 i a0=1. Zatem matematyczna reprezentacja modelu to:
y = a 1 w 1 + w 0
Teraz, jeśli usuniemy neuron odchylenia, nie będziemy mieli żadnych danych wejściowych odchylenia, co spowoduje, że nasz model będzie wyglądał tak:
y = a 1 w 1
Zauważ różnicę? Bez danych wejściowych odchylenia nasz model musi przejść przez punkt początkowy (0,0) na wykresie. Nachylenie naszej linii może się zmienić, ale będzie się ona obracać tylko od początku.
Aby nasz model był elastyczny, będziemy musieli dodać dane wejściowe odchylenia, które nie jest powiązane z żadnymi danymi wejściowymi. Umożliwia przesuwanie modelu w górę iw dół wykresu w zależności od wymagań.
Głównym powodem, dla którego wymagane jest obciążenie w sieciach neuronowych, jest to, że bez wag obciążenia model miałby bardzo ograniczony ruch podczas szukania rozwiązania.
Dowiedz się więcej o systemie polaryzacji sieci neuronowej
Sieci neuronowe mają na celu naśladowanie funkcjonowania ludzkiego mózgu i dlatego mają wiele złożoności. Zrozumienie ich może być dość trudne.
Najlepszym sposobem studiowania sieci neuronowych i uczenia się głębokiego uczenia się jest kurs uczenia maszynowego i głębokiego uczenia się. Nauczy Cię podstaw i zaawansowanych koncepcji tych dziedzin poprzez ustrukturyzowany program nauczania.
W upGrad oferujemy certyfikat PG w programie uczenia maszynowego i głębokiego uczenia się z IIIT-B. Kurs trwa tylko sześć miesięcy i jest całkowicie online. Oznacza to, że możesz uczyć się w zaciszu własnego domu, nie przerywając życia zawodowego podczas uczęszczania na ten kurs.
Otrzymasz indywidualny mentoring 1:1 od ekspertów branżowych i ponad 240 godzin nauki. Aby kwalifikować się do tego programu, musisz mieć tytuł licencjata z 50% lub równoważnymi ocenami pozytywnymi.
Po zakończeniu otrzymasz również pomoc w zatrudnieniu, w tym tworzenie CV, portal z ofertami pracy, dyski rekrutacyjne i wiele więcej. Koniecznie sprawdź kurs.
Przeczytaj także: Pomysły na projekty uczenia maszynowego
Końcowe przemyślenia
Podczas gdy stronniczość jest uważana za coś złego w naszym codziennym życiu, w świecie sieci neuronowych jest koniecznością. Bez uprzedzeń Twoja sieć nie przyniosłaby dobrych wyników, o czym pisaliśmy w dzisiejszym artykule.
Jeśli znasz kogoś, kto interesuje się sieciami neuronowymi lub studiuje głębokie uczenie, udostępnij mu ten artykuł.
Czy wagi wejściowe mogą być ujemne w sieciach neuronowych?
Wagi można dostosować do tego, co według algorytmu treningowego jest odpowiednie. Ponieważ dodawanie wag jest metodą stosowaną przez generatory w celu uzyskania odpowiedniej gęstości zdarzeń, zastosowanie ich w sieci powinno szkolić sieć, która również zakłada prawidłową gęstość zdarzeń. W rzeczywistości wagi ujemne po prostu oznaczają, że zwiększenie danego wkładu prowadzi do zmniejszenia produkcji. W związku z tym wagi wejściowe w sieciach neuronowych mogą być ujemne.
Jak możemy zmniejszyć stronniczość w sieciach neuronowych dowolnej organizacji?
Organizacje powinny ustanowić standardy, przepisy i procedury rozpoznawania, ujawniania i łagodzenia wszelkich stronniczości zestawu danych, aby utrzymać stronniczość pod kontrolą. Organizacje powinny również publikować swoje techniki selekcji i oczyszczania danych, umożliwiając innym analizowanie, kiedy i czy modele odzwierciedlają jakikolwiek rodzaj uprzedzeń. Jednak samo zapewnienie, że zestawy danych nie są stronnicze, nie wyeliminuje ich całkowicie. Dlatego posiadanie zróżnicowanych zespołów osób pracujących nad rozwojem AI powinno pozostać kluczowym celem dla organizacji.
Kiedy pojawia się trend w danych wejściowych, rozwija się modyfikacja, która jest rodzajem błędu. Dane potwierdzające tę tendencję rosną zgodnie z trendem. W rezultacie analitycy danych narażają się na niebezpieczeństwo wyolbrzymiania koncepcji w gromadzonych danych. Co więcej, jakiekolwiek znaczenie danych może być przemijające: efekt pędu może zniknąć tak szybko, jak się pojawił.