Różnica między uczeniem nadzorowanym i nienadzorowanym
Opublikowany: 2022-09-26Wstęp
Technologie takie jak uczenie maszynowe, sztuczna inteligencja i analiza danych rozwijają się na danych, aby zautomatyzować złożone zadania. Wykorzystanie danych nie ogranicza się tylko do przetwarzania i interpretacji, aby wyprzedzić konkurencję, zapewnić lepszą obsługę klienta i budować skuteczne strategie biznesowe, ale także do szkolenia, testowania i oceny modeli. W uczeniu maszynowym dane są podzielone na trzy kategorie: dane szkoleniowe, dane walidacyjne i dane testowe. Jak sama nazwa wskazuje, dane szkoleniowe trenują model lub algorytm w uczeniu maszynowym. Model uczy się na podstawie wejściowych i wyjściowych zestawów danych szkoleniowych i przewiduje klasyfikację lub wykonuje określone zadania. Wykorzystujemy dane szkoleniowe zarówno do nadzorowanego, jak i nienadzorowanego uczenia się algorytmu.
Nasze programy AI i ML w USA
Master of Science in Machine Learning & AI z LJMU i IIITB | Program Executive PG w zakresie uczenia maszynowego i sztucznej inteligencji z IIITB |
Aby poznać wszystkie nasze kursy, odwiedź naszą stronę poniżej. | |
Kursy na temat uczenia maszynowego |
Ten blog szczegółowo omawia te dwie szerokie kategorie uczenia maszynowego – uczenie nadzorowane i nienadzorowane oraz ich różnice.
Uzyskaj certyfikat uczenia maszynowego od najlepszych uniwersytetów na świecie. Zdobywaj programy Masters, Executive PGP lub Advanced Certificate Programy, aby przyspieszyć swoją karierę.
Co to jest uczenie nadzorowane?
Uczenie nadzorowane, podzbiór uczenia maszynowego i sztucznej inteligencji, to technika uczenia algorytmów, która wykorzystuje oznaczone dane do uczenia algorytmów. Uczy algorytmy wykonywania zadań, takich jak klasyfikacja i regresja w zestawach danych. W uczeniu nadzorowanym algorytm otrzymuje próbki treningowe wejścia-wyjścia i wykorzystuje te próbki do ustalenia relacji między zestawami danych. Ponieważ dostarczamy algorytmowi oznaczone dane treningowe do wykonywania zadań pod nadzorem, nazywamy to uczeniem nadzorowanym. Głównym celem nadzorowanego uczenia się jest dostarczenie danych do algorytmu, aby zrozumieć związek między wejściem a wyjściem. Gdy algorytm nawiąże połączenie między danymi wejściowymi i wyjściowymi, może dokładnie dostarczyć świeże wyniki z nowszych danych wejściowych.
Pozwól nam zrozumieć, jak działa nadzorowane uczenie się. Załóżmy, że w algorytmie uczenia maszynowego mamy wejście X i wyjście Y. Wprowadzamy lub dostarczamy wejście X do systemu uczącego w modelu. Ten system uczenia się dostarczy wynik Y'. Arbiter w systemie sprawdza różnicę między Y i Y' i generuje sygnał błędu. Sygnał ten jest przekazywany do systemu uczącego, który rozumie różnicę między Y i Y' i dostosowuje parametry w celu zmniejszenia różnicy między Y i Y'. Tutaj Y jest oznaczonymi danymi.
Nadzorowany proces uczenia się składa się z wielu etapów.
- Najpierw musimy określić typ zestawu danych treningowych, a następnie zebrać dane treningowe oznaczone etykietą. Musimy również inaczej uporządkować dane na potrzeby klasyfikacji lub regresji.
- Następnym krokiem jest użycie algorytmu do nadzorowanego uczenia, takiego jak maszyna wektora nośnego lub drzewo decyzyjne, a następnie określenie cech wejściowych dla modelu uczenia.
- Teraz wykonaj proces uczenia i dostosuj lub kontroluj parametry.
- Ostatnim krokiem jest testowanie dokładności modelu.
Cały nadzorowany proces uczenia uczy system uczący się dopasowywania parametrów, dzięki czemu algorytm zapewnia minimalną różnicę mocy. Uczenie nadzorowane ułatwia dwa złożone procesy w eksploracji danych – klasyfikację i regresję. W klasyfikacji dane są klasyfikowane lub oznaczane etykietami w różnych klasach na podstawie podobnych atrybutów, takich jak filtry spamu. Używamy regresji do przewidywania ciągłych obserwacji, na przykład giełdy lub tętna. Regresja daje wartości liczb rzeczywistych.
Poniżej przedstawiono różne rodzaje algorytmów uczenia nadzorowanego:
- Naive Bayes: — klasyfikator Naive Bayes jest oparty na twierdzeniu Bayesa. Algorytm ten zakłada, że wszystkie cechy klasy są od siebie niezależne. Klasyfikator Naive Bayes wykorzystuje metodę prawdopodobieństwa warunkowego do przewidywania klasyfikacji.
- Obsługa maszyny wektorowej: - Jest to popularny algorytm uczenia maszynowego do zadań klasyfikacji i regresji.
- Regresja liniowa: Algorytm regresji liniowej wykorzystuje nadzorowane uczenie się do przewidywania przyszłych wyników. Ustanawia związek między jedną zmienną zależną a dwiema lub więcej zmiennymi niezależnymi.
- Regresja logistyczna: - Używamy algorytmu regresji logistycznej, gdy mamy zmienne w różnych kategoriach, takich jak tak lub nie oraz prawda lub fałsz. Do rozwiązywania problemów klasyfikacji binarnej używamy głównie algorytmu regresji logistycznej.
Podsumowując, uczenie nadzorowane służy do uczenia modelu przy użyciu znanych danych wejściowych i wyjściowych w celu wygenerowania predykcji dla nowego zestawu danych wejściowych.
Co to jest nauka nienadzorowana?
W przeciwieństwie do uczenia nadzorowanego w uczeniu nienadzorowanym nie dysponujemy danymi oznaczonymi. Nie ma wstępnie zdefiniowanej relacji między zestawami danych lub przewidywanym wynikiem. W przeciwieństwie do uczenia nadzorowanego, uczenie nienadzorowane wymaga minimalnej interwencji człowieka. Dlatego nazywamy to uczeniem się bez nadzoru. Model wykorzystuje zbiór obserwacji zbioru danych i opisuje właściwości danych. Nienadzorowane uczenie się opiera się na strukturze klastrowej, ponieważ identyfikuje różne grupy w zbiorze danych.
Pozwól nam zrozumieć, jak działa nienadzorowane uczenie się. Załóżmy, że mamy szereg wejść o nazwach X1, X2, X3…….Xt, ale nie mamy docelowych wyjść. W takim przypadku maszyna nie otrzymuje żadnych informacji zwrotnych ze swojego otoczenia. Opracowuje jednak formalne ramy i przewiduje przyszłe wyniki. W nienadzorowanym uczeniu się model wykorzystuje dane wejściowe do podejmowania decyzji i budowania reprezentacji. Nie możemy używać uczenia nienadzorowanego do procesów klasyfikacji i regresji ze względu na brak danych wyjściowych. Podstawowym zastosowaniem uczenia nienadzorowanego jest ustalenie podstawowej struktury wejściowego zbioru danych. Maszyna układa dane w różne grupy na podstawie interpretacji po znalezieniu struktury. Ostatnim krokiem jest przedstawienie zestawu danych w skompresowanym formacie.
Inżynierowie najczęściej wykorzystują uczenie nienadzorowane do dwóch celów – analizy eksploracyjnej i redukcji wymiarowości. Analiza eksploracyjna przeprowadza wstępne badania danych w celu uporządkowania ich w różne grupy, budowania hipotez i odkrywania wzorców. Proces redukcji wymiarowości zmniejsza liczbę danych wejściowych w danym zbiorze danych. Najważniejszą zaletą uczenia się bez nadzoru jest znajdowanie odpowiednich spostrzeżeń. Uczenie nienadzorowane jest wykorzystywane głównie do tworzenia aplikacji AI, ponieważ wymaga minimalnej interwencji człowieka.
Uczenie nadzorowane i nienadzorowane
Teraz, gdy już wiesz, czym są uczenie nadzorowane i nienadzorowane, przyjrzyjmy się ich najważniejszym różnicom.
- Dane — uczenie nadzorowane wykorzystuje dane oznaczone etykietami, podczas gdy uczenie nienadzorowane nie wykorzystuje danych oznaczonych etykietami. Dostarczamy również dane wyjściowe do modelu w uczeniu nadzorowanym. Jednak w przypadku uczenia nienadzorowanego dane wejściowe nie są dostępne.
- Informacja zwrotna — model przyjmuje informacje zwrotne i dostosowuje parametry w nadzorowanym uczeniu się. Nie dzieje się tak w przypadku uczenia się bez nadzoru.
- Cel — Podstawowym celem nadzorowanego uczenia się jest trenowanie modelu przy użyciu danych szkoleniowych. Tak więc, gdy dostępne są nowe dane wejściowe, maszyna może przewidzieć dokładne dane wyjściowe. Ponieważ jednak dane wyjściowe nie są dostępne w przypadku uczenia się nienadzorowanego, są one wykorzystywane do zbierania odpowiednich spostrzeżeń lub ukrytych wzorców w danych danych.
- Klasyfikacja i regresja – Możemy podzielić uczenie nadzorowane na klasyfikację i regresję, co nie ma miejsca w uczeniu nienadzorowanym.
- Sztuczna inteligencja — nadzorowane uczenie się nie ma znaczenia dla sztucznej inteligencji, ponieważ musimy wprowadzić dane szkoleniowe do modelu. Jednak uczenie się bez nadzoru jest bardziej korzystne dla sztucznej inteligencji, ponieważ wymaga minimalnej interwencji człowieka.
- Algorytmy — Nadzorowane algorytmy uczenia obejmują maszynę wektorów nośnych, naiwne Bayesa, regresję liniową i regresję logistyczną. Algorytmy uczenia nienadzorowanego obejmują klastrowanie i K-najbliższy sąsiad (KNN).
- Dokładność wyników — ponieważ model uzyskuje z góry określone wyniki w nadzorowanym uczeniu się, daje dokładniejsze wyniki. Jednak wyniki uczenia się bez nadzoru są subiektywne i dają mniej dokładne wyniki.
Popularne blogi dotyczące uczenia maszynowego i sztucznej inteligencji
IoT: historia, teraźniejszość i przyszłość | Samouczek uczenia maszynowego: Naucz się ML | Co to jest algorytm? Proste i łatwe |
Wynagrodzenie inżyniera robotyki w Indiach: wszystkie role | Dzień z życia inżyniera uczenia maszynowego: czym się zajmują? | Czym jest IoT (Internet Rzeczy) |
Permutacja a kombinacja: różnica między permutacją a kombinacją | 7 najważniejszych trendów w sztucznej inteligencji i uczeniu maszynowym | Uczenie maszynowe z R: wszystko, co musisz wiedzieć |
Wniosek
Uczenie nadzorowane i nienadzorowane to podstawowe koncepcje uczenia maszynowego, stanowiące podstawę uczenia się złożonych koncepcji. Jeśli interesujesz się uczeniem maszynowym i chcesz budować karierę w tym samym, możesz zdobyć tytuł Master of Science in Machine Learning & AI od upGrad.
Liderzy branży uczą tego kursu, aby pomóc Ci zdobyć dogłębną wiedzę teoretyczną na temat uczenia maszynowego i praktyczny wgląd w technologię uczenia maszynowego. Co więcej, otrzymujesz możliwość pracy nad kilkoma studiami przypadków i projektami dotyczącymi uczenia maszynowego, które pomogą Ci zdobyć odpowiednie umiejętności.
Kiedy można korzystać z uczenia nienadzorowanego?
Zbieranie treningowych zestawów danych ze zdefiniowanymi danymi wejściowymi i wyjściowymi jest trudne. W takich przypadkach lepiej jest skorzystać z uczenia nienadzorowanego. W uczeniu nienadzorowanym modele wyciągają wnioski z danych wejściowych, jeśli nie podano danych wyjściowych lub nie podano etykiet. Dlatego można zastosować uczenie nienadzorowane w przypadkach, gdy masz dane wejściowe, ale nie masz zdefiniowanych wyników. Jednym z najlepszych zastosowań uczenia się nienadzorowanego jest tworzenie aplikacji wykorzystujących sztuczną inteligencję.
Kiedy powinieneś korzystać z nadzorowanego uczenia się?
Algorytmy uczenia nadzorowanego są używane, gdy masz określone zestawy danych wejściowych i wyjściowych. Możesz zoptymalizować kryteria wydajności modelu uczenia maszynowego, dostosowując parametry. Uczenie nadzorowane pomaga rozwiązywać rzeczywiste problemy obliczeniowe i tworzyć aplikacje do rozpoznawania mowy i tekstu, analiz predykcyjnych i wykrywania spamu.
Co to są dane oznaczone etykietami w uczeniu nadzorowanym?
Dane oznaczone etykietą oznaczają zbiór danych oznaczony lub skategoryzowany na podstawie określonych właściwości lub cech. W uczeniu nadzorowanym dane szkoleniowe, których używamy jako punkt odniesienia do uczenia modelu uczenia się, są nazywane danymi oznaczonymi.