Kowariancja a korelacja: [Wszystko, co musisz wiedzieć]

Opublikowany: 2021-11-05

Interpretacja danych za pomocą technologii, takich jak uczenie maszynowe i sztuczna inteligencja, wymaga wielu permutacji i kombinacji. Pomaga przewidzieć różne wyniki w różnych sytuacjach. Te permutacje i kombinacje są szeroko wykonywane za pomocą zmiennych.

Zmienna to element, ilość lub liczba, którą można zmierzyć w zestawie danych. Ta pozycja lub ilość nie jest stała i może się zmieniać w różnych sytuacjach pod wpływem czynników wewnętrznych lub zewnętrznych. Ilekroć dokładna wartość elementu jest nieznana, nazywamy go zmienną. Dlatego zmienne są często określane jako symbole zastępcze o nieznanej wielkości. Zmienna jest definiowana jako zmienna wartość, która zależy od poleceń programu komputerowego lub danych wejściowych w języku komputera i programowania.

Na przykład w zestawie danych eCommerce, który obejmuje zakupy klientów, zmienną są preferencje klientów lub prawdopodobieństwo zamówienia określonego produktu w przyszłości. Zależy to od potrzeb klientów, dochodów, wieku i innych czynników. Dowiedzmy się więcej o tym, jak działają zmienne i jak określa się związek między dwiema zmiennymi.

Spis treści

Co to jest kowariancja?

Kowariancja mierzy relację lub wzajemną zależność między dwiema zmiennymi. Określa, w jakim kierunku przesunęłaby się zmienna, gdyby inna zmienna zmieniła ten sam zestaw danych.

Kowariancja jest dwojakiego rodzaju – dodatnia i ujemna. Kiedy jedna zmienna ulega zmianie, a druga zmienna porusza się w tym samym kierunku, nazywa się to dodatnią kowariancją. Jeśli druga zmienna porusza się w przeciwnym kierunku, nazywana jest kowariancją ujemną.

Wyższa wartość kowariancji oznacza zależność obu zmiennych. Dodatnia kowariancja oznacza, że ​​zmienne są wprost proporcjonalne i będą poruszać się w tym samym kierunku. Ujemne wartości kowariancji mówią nam, że dwie zmienne losowe są pośrednio powiązane i poruszają się w przeciwnych kierunkach. Oznacza to, że jeśli ilość jednej zmiennej wzrośnie, to drugiej zmniejszy się.

Co to jest korelacja?

W danej sytuacji lub zbiorze danych może istnieć więcej niż jedna zmienna. Zmienne te mogą być całkowicie powiązane lub niepowiązane ze sobą. Kluczowe znaczenie ma ustalenie związku między dwiema zmiennymi, aby zachować dokładność podczas obliczania korzystnych wyników. Jest to znane jako korelacja, miara statystyczna określająca związek między dwiema zmiennymi.

Korelacja wyjaśnia liniową zależność między dwiema zmiennymi i pokazuje ruch jednej zmiennej, gdy zmienia się druga zmienna.

Jeśli istnieją dwie zmienne X i Y oraz występuje zmiana X, korelacja mierzyłaby zmianę Y spowodowaną zmianą X. Oblicza, czy Y pokaże dodatnią lub ujemną zmianę ze zmianą X .

Podobnie jak w przypadku kowariancji, istnieją trzy rodzaje korelacji – dodatnia, ujemna i zerowa. W korelacji dodatniej, gdy jedna zmienna rośnie na wykresie, druga zmienna również rośnie. W korelacji ujemnej, jeśli jedna zmienna rośnie, druga zmienna spada. W korelacji dodatniej i ujemnej zmienne rosną i maleją proporcjonalnie lub liniowo. Jeśli korelacja wynosi zero, to zmienne są niepowiązane i nie ma wykresu liniowego.

Korelację mierzy się za pomocą współczynnika Pearsona. Wartość współczynnika korelacji waha się od -1 do 1.

Jaka jest różnica między kowariancją a korelacją?

Terminy kowariancja i korelacja są często używane zamiennie. Jednak nie są takie same. Ludziom trudno jest zrozumieć różnice między nimi. Rozumiemy szczegółowo kowariancję vs korelacja.

1. Co to mierzy?

Kowariancja i korelacja są bardzo podobne i mylące. Oba są miarą zmiennych. Jednak niezwykłą różnicą między nimi jest to, że kowariancja mierzy zmianę między zmiennymi. Mówi, w jaki sposób dwie zmienne są ze sobą powiązane i czy poruszają się w tym samym, czy w przeciwnych kierunkach. Kowariancja nie definiuje, jak zmieniają się zmienne. Potwierdza tylko, czy zmienne są ze sobą powiązane, czy nie.

Z drugiej strony, zakres lub stopień zmiany zmiennych określa się za pomocą korelacji. Jest to funkcja kowariancji.

2. Wartości

Wartość korelacji waha się od -1 do 1. Z drugiej strony wartość kowariancji może być dowolną liczbą. Jego wartość mieści się między negatywną mocą a pozytywną mocą nieskończoności. Korelacja ma wartości standaryzowane, natomiast znaczenie kowariancji nie jest określone. Możemy wyprowadzić wartość korelacji, jeśli znamy współczynnik kowariancji.

3. Zmiana skali

Oznacza to zmianę wyjścia, gdy zmienne są pomnożone przez stałą wartość. Przesunięcie skali nie wpływa na wartość korelacji. Nawet jeśli zmienne zostaną pomnożone przez stałą, korelacja pozostanie taka sama. Nie dotyczy to jednak kowariancji. Wpływa na to zmiana skali. Jeśli zmienne zostaną pomnożone do stałej, kowariancja odpowiednio się zmieni.

Jakie jest zastosowanie kowariancji i korelacji w uczeniu maszynowym?

W uczeniu maszynowym istnieją różne zmienne — zmienne docelowe, niezależne, umiarkowane, wprowadzające w błąd i sterujące. Zmienne te pełnią różne funkcje i odgrywają istotną rolę w algorytmach i technikach ML. Podstawowym zadaniem zmiennych jest dodawanie braków danych w algorytmach. Ponieważ dane nie zawsze są dostępne w ustrukturyzowanej formie, może brakować elementów. Algorytmy nie mogą działać z niepełnymi informacjami. Dlatego inżynierowie oprogramowania lub programiści wykorzystują zmienne w uczeniu maszynowym, aby uzupełnić brakujące wartości.

Jakie są możliwości kariery w uczeniu maszynowym?

Jednym z kluczowych elementów uczenia maszynowego i technologii AI jest zależność zmiennych lub związek między dwiema zmiennymi losowymi. Algorytmy ML i AI dostarczają wyniki, identyfikując relacje między dwiema zmiennymi. Dlatego jeśli chcesz budować karierę w uczeniu maszynowym, musisz znać pojęcia kowariancji i korelacji.

Aby dowiedzieć się więcej o uczeniu maszynowym i sztucznej inteligencji, możesz zapisać się do programu Master of Science in Machine Learning & AI przez upGrad.

Jest to kurs online dla inżynierów, informatyków i specjalistów ds. danych, który pomaga im zdobywać wiedzę na temat uczenia maszynowego i sztucznej inteligencji. Program zapewnia również uczniom status absolwentów Liverpool John Moores University i International Institute of Information Technology w Bangalore.

Kurs pozwala połączyć się z ekspertami branżowymi z Flipkart i Zee5. Masz również możliwość wykonywania wielu projektów branżowych w celu zdobycia odpowiednich umiejętności, takich jak głębokie uczenie się i analityka predykcyjna oraz statystyki.

Oto dwie najlepsze możliwości kariery w uczeniu maszynowym i sztucznej inteligencji:

1. Naukowiec ds. danych

W 2012 r. Harvard Business Review stwierdził, że Data Scientist to najseksowniejsza praca XXI wieku, ponieważ zapotrzebowanie na analityków danych ogromnie rosło. Nawet dzisiaj w wielu sektorach brakuje naukowców zajmujących się danymi. Jeśli intrygują Cię dane, czeka na Ciebie idealna, dobrze płatna praca. Średnia pensja analityków danych w Indiach wynosi prawie ₹ siedem lakhów rocznie. Specjaliści od danych z kilkuletnim doświadczeniem mogą zarobić do 17 lakhów rocznie.

2. Architekt AI

Kolejną pracą, która robi szum w branży, jest AI Architect. Podobnie jak architekt dostarcza rozwiązania swoim klientom, AI Architects oferują również swoim klientom rozwiązania AI. Rozumieją wymagania swoich klientów i proponują odpowiednie technologie. Średnia pensja architekta AI wynosi ₹ sześć lakhów rocznie.

Naucz się online kursu nauki o danych z najlepszych światowych uniwersytetów. Zdobywaj programy Executive PG, Advanced Certificate Programs lub Masters Programs, aby przyspieszyć swoją karierę.

Wniosek

Zmienne odgrywają kluczową rolę w analizie danych i podejmowaniu decyzji w uczeniu maszynowym i sztucznej inteligencji. Korelacja i kowariancja pomagają określić, czy istnieje związek między dwiema zmiennymi. Firmy mogą wtedy przewidywać pożądane wyniki i odpowiednio podejmować decyzje. Jest to jedna z najbardziej złożonych, ale kluczowych koncepcji uczenia maszynowego. Aby zdobyć ekspercką wiedzę na temat uczenia maszynowego i sztucznej inteligencji, możesz kontynuować program upGrad dotyczący uczenia maszynowego i sztucznej inteligencji.

Czy kowariancja i korelacja to to samo?

Nie, kowariancja i korelacja to nie te same pojęcia, chociaż są ze sobą ściśle powiązane. Kowariancja określa liniową zależność między dwiema zmiennymi losowymi, a korelacja mierzy stopień związku między tymi dwiema zmiennymi.

Czy kowariancja i korelacja są istotne w uczeniu maszynowym?

Tak, kowariancja i korelacja są niezbędne w uczeniu maszynowym, ponieważ algorytm ML interpretuje relacje między zmiennymi i odpowiednio dostarcza wyniki. Dlatego musisz poznać kowariancję i korelację.

Jakie umiejętności są niezbędne do kariery w uczeniu maszynowym i sztucznej inteligencji?

Aby zapewnić sobie pracę w branżach ML lub AI, powinieneś być biegły w analizie danych, prawdopodobieństwie i statystykach, programowaniu komputerowym, tworzeniu oprogramowania, regresji liniowej, przetwarzaniu sygnałów, przetwarzaniu języka naturalnego i nie tylko.