9 idei și subiecte interesante pentru proiecte de regresie liniară pentru începători [2022]

Publicat: 2021-01-09

Regresia liniară este un subiect popular în învățarea automată. Este un algoritm de învățare supravegheat și găsește aplicații în multe sectoare. Dacă învățați despre acest subiect și doriți să vă testați abilitățile, atunci ar trebui să încercați câteva proiecte de regresie liniară. În acest articol, discutăm despre același lucru.

Avem idei de proiecte de regresie liniară pentru diferite niveluri de calificare și domenii, astfel încât să puteți alege unul în funcție de expertiza și interesele dvs. Mai mult, puteți modifica nivelul de provocare al oricărui proiect pe care l-am menționat aici prin creșterea (sau scăderea) valorilor datelor pe care le adăugați în setul dvs. de date.

Alăturați-vă Cursului de învățare profundă online de la cele mai bune universități din lume – Master, Programe Executive Postuniversitare și Program de Certificat Avansat în ML și AI pentru a vă accelera cariera.

Cuprins

Ce este o regresie liniară?

Regresia liniară este un algoritm de învățare supravegheat în învățarea automată. Modelează o valoare de predicție în funcție de variabile independente și ajută la găsirea relației dintre aceste variabile și prognoză. Modelele de regresie depind de relația dintre variabilele independente și dependente, precum și de numărul de variabile pe care le folosesc.

Regresia liniară prezice valoarea dependentă (y) conform variabilei independente (x). Ieșirea aici este valoarea dependentă, iar intrarea este valoarea independentă. Funcția de ipoteză pentru regresia liniară este următoarea:

Y = 1 + 2 x

Modelul de regresie liniară găsește cea mai bună linie, care prezice valoarea lui y în funcție de valoarea furnizată a lui x. Pentru a obține cea mai bună linie, găsește cele mai potrivite valori pentru 1 și 2 . 1 este intercepta, iar 2 este coeficientul lui x. Când găsim cele mai bune valori pentru 1 și 2 , găsim și cea mai bună linie pentru regresia dvs. liniară.

Acum că am discutat despre conceptele de bază ale regresiei liniare, putem trece la ideile noastre de proiect de regresie liniară.

Principalele noastre idei de proiecte de regresie liniară

Ideea nr. 1: bugetați un drum lung

Să presupunem că doriți să mergeți cu mașina lungă (de la Delhi la Lonawala). Înainte de a pleca într-o călătorie atât de lungă, cel mai bine este să pregătiți un buget și să vă dați seama cât trebuie să cheltuiți pentru o anumită secțiune. Puteți utiliza aici un model de regresie liniară pentru a determina costul gazului pe care va trebui să îl obțineți.

În această regresie liniară, suma totală de bani pe care ar trebui să o plătiți ar fi variabila dependentă, ceea ce înseamnă că ar fi rezultatul modelului nostru. Distanța dintre destinații ar fi variabila independentă. Pentru a menține modelul simplu, putem presupune că prețul combustibilului ar rămâne constant în timpul călătoriei.

Puteți alege oricare două destinații pentru acest proiect. Este o idee grozavă de proiect pentru începători, deoarece vă permite să experimentați și să înțelegeți clar conceptul. În plus, puteți folosi modelul oricând planificați o călătorie lungă!

Ideea nr. 2: Comparați ratele șomajului cu câștigurile bursiere

Dacă sunteți un pasionat de economie sau dacă doriți să vă folosiți cunoștințele de învățare automată în acest domeniu, atunci aceasta este una dintre cele mai bune idei de proiecte de regresie liniară pentru dvs. Știm cu toții cât de șomajul este o problemă semnificativă pentru țara noastră. În acest proiect, am găsi relația dintre ratele șomajului și câștigurile care au loc pe bursă.

Puteți folosi datele oficiale de la guvern pentru a obține ratele șomajului și le puteți folosi pentru a afla dacă există o relație între acestea și câștigurile de pe bursa.

Citiți: Implementarea regresiei liniare în Python

Ideea nr. 3: Comparați salariile batsmenilor cu rundele medii pe care le înregistrează pe joc

Cricketul este cu siguranță cel mai popular joc din India. Vă puteți folosi cunoștințele de învățare automată în acest proiect simplu, dar captivant, în care veți reprezenta relația dintre salariile batsmenilor și cursele medii pe care le obțin în fiecare joc. Jucătorii noștri de cricket sunt printre unii dintre sportivii cu cele mai mari câștiguri din lume. Lucrul la acest proiect te-ar ajuta să afli cât de mult sunt responsabile mediile lor de bataie pentru câștigurile lor.

Dacă ești începător, poți să începi cu o echipă și să verifici salariile batsilor. Pe de altă parte, dacă doriți să faceți un pas mai departe, puteți lua în considerare mai multe echipe (Australia, Anglia, Africa de Sud etc.) și puteți verifica și salariile batsmenilor lor.

Ideea #4: Comparați datele dintr-o lună cu salariul lunar

Acest proiect explorează aplicarea învățării automate în resurse umane și management. Este printre proiectele de regresie liniară la nivel de începător, așa că dacă nu ați mai lucrat la un astfel de proiect, atunci puteți începe cu acesta. Aici, veți lua datele prezente într-o lună și le veți compara cu salariul lunar.

După ce ați stabilit relația dintre cele două variabile, puteți explora dacă salariul actual este optim sau nu. Puteți alege orice carieră și găsiți salariul mediu pe care să îl selectați ca variabilă independentă. Puteți face acest proiect mai provocator, discutând multe alte locuri de muncă în afară de cea inițială.

Ideea #5: Comparați temperaturile medii globale și nivelurile de poluare

Poluarea și impactul acesteia asupra mediului este un subiect proeminent de discuție. Pandemia recentă ne-a arătat și cum ne putem salva în continuare mediul. Vă puteți folosi abilitățile de învățare automată și în acest domeniu. Acest proiect vă va ajuta să înțelegeți modul în care învățarea automată poate rezolva diversele probleme prezente și în acest domeniu.

Aici, ai lua temperaturile globale medii în câțiva ani și le-ai compara cu nivelul de poluare care a avut loc în acea perioadă. Crearea unui model de regresie liniară pe acest subiect este ușoară și nu ar necesita mult efort. Cu toate acestea, vă va ajuta cu siguranță să vă încercați abilitățile de învățare automată.

Ideea #6: Comparați temperatura locală cu cantitatea de ploaie

Aceasta este o altă idee de proiect interesantă pentru iubitorii de natură și mediu. În acest proiect, trebuie să găsiți relația dintre temperatura locală și cantitatea de ploaie care are loc acolo. După finalizarea acestui proiect, veți vedea cum puteți utiliza regresia liniară și alte tehnici de învățare automată în Geografie și subiecte conexe.

Ar trebui să păstrați temperatura în Celsius și cantitatea de ploaie în mm (milimetri). Pentru început, puteți lua în considerare câteva orașe proeminente ale țării (cum ar fi New Delhi, Mumbai, Pune, Jaipur) și puteți adăuga mai multe pe măsură ce finalizați proiectul.

Ideea #7: Comparați vârsta medie a oamenilor cu cantitatea de somn

Somnul i-a fascinat întotdeauna pe oamenii de știință. Și dacă și tu ești fascinat de acest subiect, atunci ar trebui să lucrezi la acesta. În acest proiect, trebuie să comparați durata medie de viață a oamenilor cu cantitatea de somn pe care o primesc.

Dacă doriți să intrați în domeniul biotehnologiei sau al neuroștiinței cu experiență în învățarea automată, atunci aceasta este o alegere excelentă pentru dvs. Te-ar ajuta să explorezi aplicațiile regresiei liniare în aceste sectoare. Există multe lucrări de cercetare pe această temă, așa că nu veți avea probleme în a găsi surse de date relevante.

Ideea #8: Comparați procentul de sedimente din râu cu deversarea acestuia

Aceasta este o altă idee de proiect interesantă pentru pasionații de mediu și geografie. Aici, trebuie să comparați procentul de sedimente prezente în apă cu nivelul deversării acesteia. Puteți începe cu un singur râu și îl puteți face mai provocator adăugând mai multe cursuri. În mod similar, puteți începe cu un mic pârâu (sau o secțiune a unui râu gigant), dacă nu ați mai lucrat la proiecte de regresie liniară.

Debitul unui râu este volumul care urmează prin canalul său. Este volumul total de apă care curge printr-un anumit punct și unitatea de măsurare a debitului unui râu în metri cubi pe secundă. Sedimentele sunt materiale solide prezente într-un pârâu care se deplasează și se depun într-o nouă locație prin râu.

Ideea nr. 9: Comparați bugetele filmelor nominalizate la Premiile Naționale de Film cu numărul de filme care câștigă aceste premii

Aplicați regresia liniară și în sectorul divertismentului. În acest proiect, trebuie să comparați bugetele filmelor nominalizate la Premiile Naționale de Film cu numărul de filme care au câștigat aceste premii. Ai afla dacă bugetul unui film îi afectează probabilitatea de a câștiga un premiu sau nu. Puteți începe cu datele din ultimii cinci ani (2014-2019). Și dacă doriți să duceți un nivel mai departe, atunci puteți adăuga date de mai mulți ani și puteți face proiectul mai provocator.

Citește și: 15 idei interesante de proiecte de învățare automată pentru începători

Gânduri finale

Am ajuns la finalul listei de proiecte. Sperăm că ați găsit utile aceste idei de proiecte de regresie liniară. Dacă aveți întrebări cu privire la regresia liniară sau aceste idei de proiecte, nu ezitați să ne întrebați.

Pe de altă parte, dacă doriți să aflați mai multe despre regresia liniară, atunci vă recomandăm să accesați blogul nostru, unde veți găsi multe resurse valoroase, ghiduri și articole pe acest subiect. Pentru început, iată ghidul nostru despre regresia liniară în învățarea automată .

Puteți verifica programul Executive PG al IIT Delhi în învățarea automată în asociere cu upGrad . IIT Delhi este una dintre cele mai prestigioase instituții din India. Cu mai mult de 500 de membri ai facultății interne, care sunt cei mai buni în materie.

Care sunt pașii importanți de urmat în regresia liniară?

În analiza regresiei liniare este implicat ceva mai mult decât potrivirea unei linii liniare printr-un grup de puncte de date. Are trei etape: (1) examinarea datelor pentru corelație și direcționalitate, (2) prezicerea modelului, adică potrivirea liniei și (3) evaluarea validității și utilității modelului. Pentru a începe, utilizați un grafic de dispersie pentru a evalua datele și a verifica direcționalitatea și corelația. Potrivirea dreptei de regresie este a doua etapă în analiza regresiei. Reziduul neexplicat este minimizat folosind estimarea matematică a celui mai mic pătrat. Testul de semnificație este etapa finală a analizei de regresie liniară.

De ce regresia liniară are nevoie de distribuție normală?

Unii utilizatori cred în mod eronat că ipoteza distribuției normale a regresiei liniare se aplică datelor lor. Ei ar putea face o histogramă a variabilei de răspuns pentru a vedea dacă se îndepărtează de o distribuție normală. Alții cred că variabila explicativă trebuie să aibă o distribuție regulată. Nici unul nu este necesar. Ipoteza de normalitate se aplică distribuțiilor reziduale. Datele sunt distribuite în mod normal, precum și linia de regresie este potrivită cu datele, astfel încât media reziduală să fie zero.

Care sunt avantajele și dezavantajele regresiei liniare?

Cel mai semnificativ beneficiu al analizei regresiei liniare este liniaritatea lor: simplifică procesul de estimare și, mai important, aceste ecuații liniare au o interpretare modulară ușor de înțeles (adică ponderile). Regresia liniară ia în considerare pur și simplu media variabilei dependente. Legătura dintre media variabilei dependente și variabilele independente este studiată folosind regresia liniară. Valorile abere pot afecta regresia liniară.