Co to jest nadzorowane uczenie maszynowe? Algorytm, przykład

Opublikowany: 2021-06-22

Uczenie maszynowe jest wszędzie — od agencji rządowych, usług detalicznych i instytucji finansowych po sektory opieki zdrowotnej, rozrywki i transportu. Jest to misternie związane z naszym codziennym życiem, czy to Netflix czy Amazon, który daje rekomendacje online, czy odblokowywanie smartfona za pomocą technologii wykrywania twarzy, uczenia maszynowego i sztucznej inteligencji nabrały rozpędu jak nigdy dotąd.

Ponieważ uczenie maszynowe jest obecnie jednym z najpopularniejszych trendów technologicznych, konieczne staje się poznanie jednego z kluczowych podejść do tworzenia sztucznej inteligencji – nadzorowanego uczenia maszynowego.

Spis treści

Co to jest nadzorowane uczenie maszynowe?

Nadzorowane uczenie maszynowe to rodzaj uczenia maszynowego, w którym algorytm komputerowy jest szkolony przy użyciu oznaczonych danych wejściowych, a komputer z kolei przewiduje dane wyjściowe dla nieprzewidzianych danych. W tym przypadku „oznaczone” oznacza, że niektóre dane zostaną już oznaczone poprawnymi odpowiedziami, aby pomóc maszynie w uczeniu się. W uczeniu nadzorowanym dane wejściowe podawane do komputera działają jak nadzorca lub nauczyciel, szkoląc maszynę w zakresie uzyskiwania dokładnych wyników poprzez wykrywanie podstawowych wzorców i korelacji między danymi wejściowymi a etykietami wyjściowymi.

Rodzaje nadzorowanych algorytmów uczenia się

Istnieją różne rodzaje nadzorowanych algorytmów uczenia się, które pozwalają osiągnąć określone wyniki. Rzućmy okiem na niektóre z najczęstszych typów.

1. Klasyfikacja

Algorytmy klasyfikacji używają oznaczonych danych szkoleniowych do sortowania danych wejściowych do określonej liczby klas lub kategorii. W tym przypadku zmienną wyjściową jest kategoria, taka jak „Tak” lub „Nie” oraz „Prawda” lub „Fałsz”. Kategoryzacja raportów medycznych na pozytywne (choroba) lub negatywne (brak choroby) lub klasyfikowanie filmów do różnych gatunków to tylko niektóre przypadki, w których mają zastosowanie algorytmy klasyfikacji.

2. Regresja

Modele regresji są używane, gdy istnieje zależność liczbowa między zmiennymi wejściowymi i wyjściowymi. Algorytmy regresji, które mieszczą się w zakresie uczenia nadzorowanego, obejmują regresję liniową, regresję nieliniową, drzewa regresji, regresję wielomianową i regresję liniową Bayesa. Takie modele służą przede wszystkim do przewidywania zmiennych ciągłych, takich jak spekulowanie trendów rynkowych, prognozowanie pogody lub wstępne określanie współczynników klikalności reklam internetowych w określonych porach dnia.

Dołącz do internetowego kursu uczenia maszynowego z najlepszych światowych uniwersytetów — studiów magisterskich, programów podyplomowych dla kadry kierowniczej i zaawansowanego programu certyfikacji w zakresie uczenia się maszynowego i sztucznej inteligencji, aby przyspieszyć swoją karierę.

3. Sieci neuronowe

Algorytmy sieci neuronowych są używane do interpretacji danych sensorycznych, rozpoznawania wzorców lub grupowania nieprzetworzonych danych wejściowych. Chociaż ten algorytm ma kilka zalet, korzystanie z sieci neuronowej może być dość trudne, gdy jest zbyt wiele obserwacji. Popularne, rzeczywiste zastosowania sieci neuronowych obejmują ekstrakcję informacji, klasyfikację tekstu, rozpoznawanie mowy i znaków, podsumowywanie wielu dokumentów, generowanie języka i wiele innych.

4. Naiwny model bayesowski

Naiwne klasyfikatory Bayesa nie są pojedynczym algorytmem, ale zbiorem algorytmów opartych na twierdzeniu Bayesa. Standardową zasadą leżącą u podstaw tych algorytmów jest to, że każda para sklasyfikowanych cech jest od siebie niezależna. Etykiety klas są przypisywane za pomocą bezpośredniego acyklicznego wykresu zawierającego kilka węzłów potomnych i jeden węzeł nadrzędny. Każdy węzeł podrzędny jest uważany za oddzielny i niezależny od rodzica. Popularne, rzeczywiste aplikacje algorytmu Naive Bayesa obejmują filtrowanie spamu i analizę sentymentu.

5. Drzewa decyzyjne

Drzewa decyzyjne to modele przypominające schemat blokowy zawierające warunkowe instrukcje sterujące służące do porównywania decyzji i ich możliwych konsekwencji. Drzewo decyzyjne obejmuje wykres podobny do drzewa, w którym węzły wewnętrzne reprezentują punkt, w którym wybieramy atrybut i zadajemy pytanie, węzły liści reprezentują etykiety klas lub rzeczywisty wynik, a krawędzie reprezentują odpowiedzi na pytania.

6. Wsparcie maszyny wektorów

Maszyna wektorów nośnych (SVM) opiera się na teorii uczenia statystycznego podanej przez Vap Nicka i została opracowana w 1990 roku. Mówiąc najprościej, maszyny wektorów nośnych to zestaw nadzorowanych metod uczenia używanych do regresji, klasyfikacji i wykrywania wartości odstających. Są one ściśle związane z siecią jądra i znajdują zastosowanie w różnych dziedzinach, takich jak rozpoznawanie wzorców, bioinformatyka i wyszukiwanie informacji multimedialnych.

7. Losowy model lasu

Model lasu losowego składa się z zestawu pojedynczych drzew decyzyjnych, w których każde pojedyncze drzewo daje predykcję klasy, a klasa z największą liczbą głosów jest predykcją modelu. Ideą stojącą za koncepcją losowego modelu lasu jest to, że duża liczba stosunkowo nieskorelowanych drzew lub modeli działających w zespole da dokładniejsze predykcje niż jakiekolwiek indywidualne predykcje. Dzieje się tak, ponieważ drzewa chronią się nawzajem przed niezależnymi błędami.

Jak to działa?

Uczenie nadzorowane obejmuje uczenie modeli przy użyciu oznaczonych zestawów danych, dzięki czemu mogą uczyć się o każdym typie danych. Po zakończeniu szkolenia model otrzymuje dane testowe w celu zidentyfikowania i przewidzenia wyników.

Spójrzmy na prosty przykład, aby dokładniej wyjaśnić tę koncepcję.

Załóżmy, że dostaniesz skrzynkę z różnymi rodzajami warzyw. W podejściu do nadzorowanego uczenia maszynowego pierwszym krokiem będzie zapoznanie maszyny ze wszystkimi warzywami jeden po drugim w następujący sposób:

Jeśli przedmiot jest jak żarówka i fioletowo-różowy, zostanie oznaczony jako – Cebula.
Jeśli przedmiot jest liściasty i zielony, zostanie oznaczony jako – Szpinak.

Po wytrenowaniu maszyny dajesz jej osobne warzywo ze skrzynki (np. cebulę) i prosisz o jej identyfikację. Teraz, ponieważ maszyna dowiedziała się już o warzywach z poprzednich danych, zaklasyfikuje nowy obiekt na podstawie jego kształtu i koloru i potwierdzi wynik jako cebulę. W ten sposób maszyna uczy się lub trenuje na podstawie danych uczących (skrzynia zawierająca warzywa) i stosuje zdobytą wiedzę do nowych, nieprzewidzianych danych (nowe warzywo).

Podobnie jak w przykładzie warzyw, którego użyliśmy powyżej, zobaczmy inny przykład nadzorowanego uczenia się, aby zrozumieć, jak to działa.

Załóżmy, że mamy zbiór danych składający się z różnych kształtów, takich jak trójkąty, kwadraty i pięciokąty. Pierwszym krokiem jest wytrenowanie modelu dla każdej figury w następujący sposób:

Jeśli kształt ma trzy boki, zostanie oznaczony jako – Trójkąt
Jeśli kształt ma cztery równe boki, zostanie oznaczony jako – Kwadrat
Jeśli kształt ma pięć boków, zostanie oznaczony jako – Pentagon

Po zakończeniu szkolenia testujemy model przy użyciu danych testowych, a zadaniem modelu będzie identyfikacja kształtu na podstawie wiedzy szkoleniowej. Stąd, gdy model znajdzie nowy kształt, klasyfikuje go na podstawie liczby boków i daje wynik.

Zalety i wyzwania

Nie trzeba dodawać, że uczenie nadzorowane ma kilka zalet we wdrażaniu modeli uczenia maszynowego. Niektóre z jego zalet są wymienione poniżej:

Modele nadzorowanego uczenia się mogą dokładnie przewidywać wyniki na podstawie wcześniejszych doświadczeń.

Uczenie nadzorowane pomaga zoptymalizować wydajność przy użyciu doświadczenia.
Uczenie nadzorowane daje nam jasne i precyzyjne wyobrażenie o klasach obiektów.
Wreszcie, algorytmy uczenia nadzorowanego są niezwykle istotne w rozwiązywaniu różnych rzeczywistych problemów i znajdowaniu zastosowań w różnych sektorach.

Bez wątpienia algorytmy uczenia nadzorowanego są bardzo korzystne, szczególnie w odniesieniu do ich potencjału w rozwiązywaniu problemów w czasie rzeczywistym. Jednak budowanie zrównoważonego i wydajnego modelu nadzorowanego uczenia się wiąże się z własnym zestawem wyzwań. Przyjrzyjmy się więc:

Cały proces uczenia nadzorowanych modeli uczenia się jest procesem czasochłonnym.
Modele uczenia się nadzoru często wymagają pewnego poziomu wiedzy i zasobów, aby prawidłowo ustrukturyzować i funkcjonować.
W przeciwieństwie do modeli uczenia się nienadzorowanego, modele uczenia nadzorowanego nie mogą samodzielnie klasyfikować ani grupować danych.
Szanse na wkradnięcie się ludzkich błędów do zbiorów danych są dość wysokie, co może prowadzić do nieprawidłowego uczenia algorytmów.

Najlepsze praktyki z przykładami

O jakich najlepszych praktykach należy pamiętać przed rozpoczęciem projektu z wykorzystaniem nadzorowanego uczenia maszynowego? Spójrz poniżej.

Upewnij się, że masz jasność co do rodzaju danych, których będziesz używać jako zestawu danych treningowych.
Zbierz odpowiednie dane wyjściowe ze standardowych pomiarów lub od ekspertów.
Zdecyduj o strukturze algorytmu uczenia.

Warto wreszcie porozmawiać o kilku najlepszych i najpopularniejszych przykładach nadzorowanego uczenia maszynowego z życia wziętych.

Analiza predykcyjna : powszechnym przypadkiem użycia modeli uczenia nadzorowanego do analizy predykcyjnej jest dostarczanie znaczących i praktycznych wglądów w różne punkty danych biznesowych. W rezultacie przedsiębiorstwa biznesowe mogą przewidzieć pewne wyniki w oparciu o daną zmienną wyjściową, aby uzasadnić i poprzeć decyzje.
Rozpoznawanie obiektów i obrazów : Nadzorowane algorytmy uczenia znajdują zastosowanie w lokalizowaniu i klasyfikowaniu obiektów na obrazach i filmach – co jest częstym wymogiem w analizie obrazu i różnych technikach widzenia komputerowego.
Wykrywanie spamu : techniki wykrywania i filtrowania spamu wykorzystują nadzorowane algorytmy klasyfikacji do uczenia baz danych, aby mogły rozpoznawać wzorce w nowych danych w celu skutecznego segregowania spamu i wiadomości niebędących spamem.
Analiza nastrojów : świetnym sposobem na zwiększenie zaangażowania marki jest zrozumienie interakcji z klientami. Nadzorowane uczenie maszynowe może w tym pomóc, wyodrębniając i klasyfikując krytyczne informacje z dużych zbiorów danych, takie jak emocje, intencje, preferencje itp.

Naucz się uczenia maszynowego z upGrad

Chcesz osiągnąć sukces w dziedzinie uczenia maszynowego i sztucznej inteligencji? Rozpocznij swoją podróż z programem Executive PG UpGrad w zakresie uczenia maszynowego i sztucznej inteligencji . Jest to kompleksowy kurs certyfikacyjny online przeznaczony dla profesjonalistów, którzy chcą nauczyć się umiejętności na żądanie, takich jak Deep Learning, Reinforcement Learning, NLP i modele graficzne.

Oto kilka najważniejszych punktów kursu, których nie możesz przegapić:

Certyfikat ukończenia kursu z IIIT Bangalore.
Ponad 450 godzin nauki wypełnionych sesjami na żywo, zadaniami z kodowania, studiami przypadków i projektami.
Kompleksowa oferta 20 narzędzi, języków programowania i bibliotek.
Zajęcia z kodowania na żywo i warsztaty budowania profili.

Wniosek

W najnowszym raporcie z badań rynkowych firmy Technavio, zatytułowanym Rynek uczenia maszynowego według użytkowników końcowych i geografii – prognozy i analizy 2020-2024 , przewiduje się, że wielkość globalnego rynku uczenia maszynowego wzrośnie o 11,16 mld USD w okresie prognozy 2020-2024. Co więcej, stały wzrost w ujęciu rok do roku będzie napędzał dynamikę wzrostu rynku.

Zarówno obecne trendy, jak i prognozy na przyszłość wskazują, że uczenie maszynowe nie zniknie. Nadzorowane algorytmy uczenia są podstawą każdego projektu uczenia maszynowego, który obejmuje głównie problemy z klasyfikacją i regresją. Pomimo wyzwań, nadzorowane algorytmy uczenia się są najbardziej przydatne do przewidywania wyników na podstawie doświadczeń.

Poprowadź rewolucję technologiczną napędzaną sztuczną inteligencją

Złóż wniosek o tytuł magistra nauki w dziedzinie uczenia maszynowego i sztucznej inteligencji