9 interesujących pomysłów i tematów projektów regresji liniowej dla początkujących [2022]

Opublikowany: 2021-01-09

Regresja liniowa to popularny temat w uczeniu maszynowym. Jest to nadzorowany algorytm uczenia się i znajduje zastosowanie w wielu sektorach. Jeśli uczysz się na ten temat i chcesz sprawdzić swoje umiejętności, powinieneś wypróbować kilka projektów regresji liniowej. W tym artykule omawiamy to samo.

Mamy pomysły na projekty regresji liniowej dla różnych poziomów umiejętności i dziedzin, dzięki czemu możesz wybrać jeden zgodnie ze swoją wiedzą i zainteresowaniami. Co więcej, możesz modyfikować poziom wyzwania dowolnego projektu, o którym tu wspomnieliśmy, zwiększając (lub zmniejszając) wartości danych dodawanych do zestawu danych.

Dołącz do kursu Deep Learning online z najlepszych światowych uniwersytetów — studiów magisterskich, programów podyplomowych dla kadry kierowniczej oraz zaawansowanego programu certyfikacji w zakresie uczenia się maszynowego i sztucznej inteligencji, aby przyspieszyć swoją karierę.

Spis treści

Co to jest regresja liniowa?

Regresja liniowa to nadzorowany algorytm uczenia w uczeniu maszynowym. Modeluje wartość predykcji według zmiennych niezależnych i pomaga znaleźć związek między tymi zmiennymi a prognozą. Modele regresji zależą od relacji między zmienną niezależną i zmienną zależną oraz liczby wykorzystywanych zmiennych.

Regresja liniowa przewiduje wartość zależną (y) zgodnie ze zmienną niezależną (x). Wyjście jest tutaj wartością zależną, a wejście wartością niezależną. Funkcja hipotezy dla regresji liniowej jest następująca:

Y = 1 + 2 x

Model regresji liniowej znajduje najlepszą linię, która przewiduje wartość y zgodnie z podaną wartością x. Aby uzyskać najlepszą linię, znajduje najbardziej odpowiednie wartości dla 1 i 2 . 1 to wyraz wolny, a 2 to współczynnik x. Kiedy znajdziemy najlepsze wartości dla 1 i 2 , znajdziemy również najlepszą linię dla twojej regresji liniowej.

Teraz, gdy omówiliśmy podstawowe koncepcje regresji liniowej, możemy przejść do naszych pomysłów projektowych dotyczących regresji liniowej.

Nasze najlepsze pomysły na projekty regresji liniowej

Pomysł nr 1: zaplanuj długą jazdę

Załóżmy, że chcesz wybrać się na długą przejażdżkę (z Delhi do Lonawala). Przed wyruszeniem w tak długą podróż najlepiej przygotować budżet i obliczyć, ile trzeba przeznaczyć na dany odcinek. Możesz użyć modelu regresji liniowej, aby określić koszt gazu, który będziesz musiał uzyskać.

W tej regresji liniowej całkowita kwota, którą musiałbyś zapłacić, byłaby zmienną zależną, co oznacza, że ​​byłby to wynik naszego modelu. Odległość między miejscami docelowymi byłaby zmienną niezależną. Aby model był prosty, możemy założyć, że cena paliwa pozostanie stała podczas podróży.

Możesz wybrać dowolne dwa miejsca docelowe dla tego projektu. To świetny pomysł na projekt dla początkujących, ponieważ pozwala na eksperymentowanie i jasne zrozumienie koncepcji. Dodatkowo możesz używać tego modelu, gdy planujesz długą jazdę!

Pomysł nr 2: Porównaj stopy bezrobocia z zyskami na giełdzie

Jeśli jesteś entuzjastą ekonomii lub chcesz wykorzystać swoją wiedzę na temat uczenia maszynowego w tej dziedzinie, to jest to jeden z najlepszych pomysłów na projekt regresji liniowej dla Ciebie. Wszyscy wiemy, jak poważnym problemem dla naszego kraju jest bezrobocie. W tym projekcie znaleźlibyśmy zależność między stopą bezrobocia a wzrostami na giełdzie.

Możesz użyć oficjalnych danych od rządu, aby uzyskać stopy bezrobocia i użyć ich, aby dowiedzieć się, czy istnieje związek między nimi a wzrostami na giełdzie.

Przeczytaj: Implementacja regresji liniowej w Pythonie

Pomysł #3: Porównaj pensje pałkarzy ze średnimi biegami, które zdobywają na mecz

Krykiet jest z pewnością najpopularniejszą grą w Indiach. Możesz wykorzystać swoją wiedzę na temat uczenia maszynowego w tym prostym, ale ekscytującym projekcie, w którym wykreślisz związek między zarobkami odbijających a średnimi przebiegami, jakie zdobywają w każdej grze. Nasi krykieciści należą do jednych z najlepiej zarabiających sportowców na świecie. Praca nad tym projektem pomogłaby ci dowiedzieć się, w jakim stopniu ich średnie mrugnięcia są odpowiedzialne za ich zarobki.

Jeśli jesteś początkujący, możesz zacząć od jednej drużyny i sprawdzać pensje jej odbijających. Z drugiej strony, jeśli chcesz pójść o krok dalej, możesz wziąć pod uwagę wiele drużyn (Australia, Anglia, RPA itp.) I sprawdzić pensje także ich odbijających.

Pomysł 4: Porównaj daty w miesiącu z miesięczną pensją

Ten projekt bada zastosowanie uczenia maszynowego w zasobach ludzkich i zarządzaniu. Jest to jeden z projektów regresji liniowej dla początkujących, więc jeśli wcześniej nie pracowałeś nad takim projektem, możesz zacząć od tego. Tutaj weźmiesz daty obecne w miesiącu i porównasz je z miesięcznym wynagrodzeniem.

Po ustaleniu związku między tymi dwiema zmiennymi możesz zbadać, czy aktualna płaca jest optymalna, czy nie. Możesz wybrać dowolną karierę i znaleźć jej średnią pensję, aby wybrać jako zmienną niezależną. Możesz uczynić ten projekt bardziej wymagającym, omawiając wiele innych zadań poza pierwotną.

Pomysł nr 5: Porównaj średnie temperatury na świecie i poziomy zanieczyszczenia

Ważnym tematem dyskusji jest zanieczyszczenie i jego wpływ na środowisko. Niedawna pandemia pokazała nam również, jak nadal możemy ratować nasze środowisko. W tej dziedzinie również możesz wykorzystać swoje umiejętności uczenia maszynowego. Ten projekt pomoże Ci zrozumieć, w jaki sposób uczenie maszynowe może rozwiązać różne problemy występujące również w tej domenie.

Tutaj wziąłbyś średnie temperatury na świecie z kilku lat i porównał je z poziomem zanieczyszczenia, który miał miejsce w tym czasie. Stworzenie modelu regresji liniowej na ten temat jest łatwe i nie wymaga dużego wysiłku. Jednak z pewnością pomoże Ci wypróbować swoje umiejętności uczenia maszynowego.

Pomysł nr 6: Porównaj lokalną temperaturę z ilością deszczu

To kolejny ekscytujący pomysł na projekt dla miłośników przyrody i środowiska. W tym projekcie musisz znaleźć zależność między lokalną temperaturą a ilością deszczu, która tam występuje. Po ukończeniu tego projektu zobaczysz, jak możesz wykorzystać regresję liniową i inne techniki uczenia maszynowego w geografii i pokrewnych przedmiotach.

Należy utrzymywać temperaturę w stopniach Celsjusza, a ilość deszczu w mm (milimetrach). Na początek możesz wziąć pod uwagę kilka znanych miast w kraju (takich jak New Delhi, Bombaj, Pune, Jaipur) i dodać kolejne w miarę ukończenia projektu.

Pomysł nr 7: Porównaj średni wiek ludzi z ilością ich snu

Sen od zawsze fascynował naszych naukowców. A jeśli jesteś zafascynowany tym tematem, to powinieneś popracować nad tym. W tym projekcie musisz porównać średnią długość życia ludzi z ilością snu, jaką otrzymują.

Jeśli chcesz wejść w dziedzinę biotechnologii lub neuronauki z doświadczeniem w uczeniu maszynowym, to jest to doskonały wybór dla Ciebie. Pomoże Ci zbadać zastosowania regresji liniowej w tych sektorach. Istnieje wiele artykułów naukowych na ten temat, więc nie będziesz mieć problemów ze znalezieniem odpowiednich źródeł danych.

Pomysł nr 8: Porównaj procent osadów w rzece z jej wypływem

To kolejny ekscytujący pomysł na projekt dla pasjonatów środowiska i geografii. Tutaj trzeba porównać procent osadów obecnych w wodzie z poziomem jej odprowadzania. Możesz zacząć od jednej rzeki i uczynić ją trudniejszą, dodając więcej strumieni. Podobnie możesz zacząć od małego strumienia (lub odcinka gigantycznej rzeki), jeśli wcześniej nie pracowałeś nad projektami regresji liniowej.

Odpływ rzeki to objętość płynąca przez jej kanał. Jest to całkowita objętość wody przepływającej przez określony punkt oraz jednostka pomiaru przepływu rzeki w metrach sześciennych na sekundę. Osady to stałe materiały obecne w strumieniu, które przemieszczają się i osadzają się w nowym miejscu przez rzekę.

Pomysł nr 9: Porównaj budżety filmów nominowanych do National Film Awards z liczbą filmów, które wygrały te nagrody

Regresję liniową stosuje się również w sektorze rozrywki. W tym projekcie musisz porównać budżety filmów nominowanych do National Film Awards z liczbą filmów, które zdobyły te nagrody. Dowiesz się, czy budżet filmu wpływa na jego prawdopodobieństwo zdobycia nagrody, czy nie. Możesz zacząć od danych z ostatnich pięciu lat (2014-19). A jeśli chcesz pójść o krok dalej, możesz dodać dane z większej liczby lat i uczynić projekt większym wyzwaniem.

Przeczytaj także: 15 ciekawych pomysłów na projekty uczenia maszynowego dla początkujących

Końcowe przemyślenia

Dotarliśmy do końca naszej listy projektów. Mamy nadzieję, że te pomysły dotyczące regresji liniowej okazały się pomocne. Jeśli masz jakiekolwiek pytania dotyczące regresji liniowej lub tych pomysłów na projekty, nie wahaj się zapytać nas.

Z drugiej strony, jeśli chcesz dowiedzieć się więcej o regresji liniowej, zalecamy odwiedzenie naszego bloga, gdzie znajdziesz wiele cennych zasobów, poradników i artykułów na ten temat. Na początek zapoznaj się z naszym przewodnikiem po regresji liniowej w uczeniu maszynowym .

Możesz sprawdzić program Executive PG w IIT Delhi w uczeniu maszynowym we współpracy z upGrad . IIT Delhi to jedna z najbardziej prestiżowych instytucji w Indiach. Z większą liczbą ponad 500 wewnętrznych członków wydziału, którzy są najlepsi w tej dziedzinie.

Jakie są ważne kroki do wykonania w regresji liniowej?

Analiza regresji liniowej obejmuje coś więcej niż dopasowanie linii liniowej do klastra punktów danych. Składa się z trzech etapów: (1) badanie danych pod kątem korelacji i kierunkowości, (2) przewidywanie modelu, czyli dopasowanie linii, oraz (3) ocena trafności i użyteczności modelu. Na początek użyj wykresu punktowego, aby ocenić dane i zweryfikować kierunkowość i korelację. Dopasowanie linii regresji to drugi etap analizy regresji. Niewyjaśniona reszta jest minimalizowana za pomocą matematycznego estymacji metodą najmniejszych kwadratów. Test istotności jest ostatnim etapem analizy regresji liniowej.

Dlaczego regresja liniowa wymaga rozkładu normalnego?

Niektórzy użytkownicy błędnie uważają, że założenie rozkładu normalnego regresji liniowej ma zastosowanie do ich danych. Mogliby zrobić histogram swojej zmiennej odpowiedzi, aby zobaczyć, czy odbiega ona od normalnego rozkładu. Inni uważają, że zmienna objaśniająca musi mieć rozkład regularnie rozłożony. Żadne nie jest konieczne. Założenie normalności dotyczy rozkładów rezydualnych. Dane mają rozkład normalny, a linia regresji jest dopasowywana do danych, tak aby średnia resztowa wynosiła zero.

Jakie są zalety i wady regresji liniowej?

Najważniejszą zaletą analizy regresji liniowej jest ich liniowość: upraszcza proces szacowania, a co ważniejsze, równania liniowe mają łatwą do zrozumienia interpretację modularną (tj. wagi). Regresja liniowa po prostu uwzględnia średnią zmiennej zależnej. Związek między średnią zmiennej zależnej a zmiennymi niezależnymi bada się za pomocą regresji liniowej. Wartości odstające mogą wpływać na regresję liniową.