15 idei interesante de proiecte de învățare automată pentru începători [2022]

Publicat: 2021-01-10

Cuprins

Idei de proiecte de învățare automată

Pe măsură ce inteligența artificială (IA) continuă să progreseze rapid în 2022, obținerea stăpânirii învățării automate (ML) devine din ce în ce mai importantă pentru toți jucătorii din acest domeniu. Acest lucru se datorează faptului că atât AI, cât și ML se completează reciproc. Deci, dacă sunteți începător, cel mai bun lucru pe care îl puteți face este să lucrați la unele proiecte de învățare automată.

Noi, aici, la upGrad, credem într-o abordare practică, deoarece cunoștințele teoretice singure nu vor fi de ajutor într-un mediu de lucru în timp real. În acest articol, vom explora câteva proiecte interesante de învățare automată la care începătorii pot lucra pentru a-și testa cunoștințele de învățare automată. În acest articol, veți găsi 15 idei de proiecte de învățare automată de top pentru începători pentru a obține experiență practică.

Dar mai întâi, să abordăm întrebarea mai pertinentă care trebuie să stea la pândă în mintea ta: de ce să construiești proiecte de învățare automată?

Când vine vorba de cariere în dezvoltarea de software, este o necesitate pentru dezvoltatorii aspiranți să lucreze la propriile proiecte. Dezvoltarea de proiecte în lumea reală este cea mai bună modalitate de a vă perfecționa abilitățile și de a vă materializa cunoștințele teoretice în experiență practică. Cu cât experimentezi mai multe proiecte de învățare automată , cu atât câștigi mai multe cunoștințe.

În timp ce manualele și materialele de studiu vă vor oferi toate cunoștințele pe care trebuie să le cunoașteți despre Machine Learning, nu puteți stăpâni niciodată cu adevărat ML decât dacă vă investiți timpul în experimente practice din viața reală – proiecte privind Machine Learning. Pe măsură ce începeți să lucrați la idei de proiecte de învățare automată, nu numai că vă veți putea testa punctele forte și punctele slabe, dar veți obține și o expunere care vă poate fi extrem de utilă pentru a vă stimula cariera. În acest tutorial, veți găsi 15 idei interesante de proiecte de învățare automată pentru începători pentru a obține experiență practică în învățarea automată.

Învață cursuri online de învățare automată de la cele mai bune universități din lume. Câștigă programe de master, Executive PGP sau Advanced Certificate pentru a-ți accelera cariera.

Așadar, iată câteva proiecte de învățare automată la care pot lucra începătorii:

Iată câteva idei interesante de proiecte de învățare automată pentru începători

Urmărește videoclipul nostru despre ideile și subiectele de proiecte de învățare automată...

Această listă de idei de proiecte de învățare automată pentru studenți este potrivită pentru începători și pentru cei care abia încep cu învățarea automată sau știința datelor în general. Aceste idei de proiecte de învățare automată vă vor pune în practică toate aspectele practice de care aveți nevoie pentru a reuși în cariera dvs. de profesionist în învățarea automată.

În plus, dacă sunteți în căutarea unor idei de proiecte de învățare automată pentru ultimul an , această listă ar trebui să vă încurajeze. Așa că, fără alte prelungiri, haideți să trecem direct la câteva idei de proiecte de învățare automată care vă vor întări baza și vă vor permite să urcați pe scară.

1. Predictorul prețurilor acțiunilor

Una dintre cele mai bune idei pentru a începe să vă experimentați proiectele practice de învățare automată pentru studenți este să lucrați la Predictorul prețurilor acțiunilor. Organizațiile de afaceri și companiile de astăzi caută software care să monitorizeze și să analizeze performanța companiei și să prezică prețurile viitoare ale diferitelor acțiuni. Și cu atât de multe date disponibile pe bursă, este un focar de oportunități pentru oamenii de știință de date cu înclinație pentru finanțare.

stoc de idei de proiecte de învățare automată

Cu toate acestea, înainte de a începe, trebuie să aveți o cotă echitabilă de cunoștințe în următoarele domenii:

  • Analiza predictivă: Utilizarea diferitelor tehnici AI pentru diferite procese de date, cum ar fi data mining, explorarea datelor etc., pentru a „prevece” comportamentul posibilelor rezultate.
  • Analiza regresivă: Analiza regresivă este un fel de tehnică predictivă bazată pe interacțiunea dintre o variabilă/e dependentă (țintă) și independentă/e (predictor).
  • Analiza acțiunii: În această metodă, sunt analizate toate acțiunile efectuate prin cele două tehnici menționate mai sus, după care rezultatul este alimentat în memoria de învățare automată.
  • Modelare statistică: implică construirea unei descrieri matematice a unui proces din lumea reală și elaborarea incertitudinilor, dacă există, în cadrul procesului respectiv.
Ce este Machine Learning și de ce contează

2. SportsPredictor

În Moneyball lui Michael Lewis , echipa Oakland Athletics a transformat fața baseball-ului prin încorporarea tehnicii de cercetare analitică a jucătorilor în planul lor de joc. Și la fel ca ei, și tu poți revoluționa sportul în lumea reală! Acesta este un proiect excelent de învățare automată pentru începători.

Deoarece nu există lipsă de date în lumea sportului, puteți utiliza aceste date pentru a construi proiecte distractive și creative de învățare automată, cum ar fi folosirea statisticilor sportive de colegiu pentru a prezice care jucător ar avea cea mai bună carieră în anumite sporturi (descoperirea talentelor). De asemenea, puteți opta pentru îmbunătățirea managementului echipei, analizând punctele forte și punctele slabe ale jucătorilor dintr-o echipă și clasificându-le în consecință.

Având în vedere cantitatea de statistici și date sportive disponibile, aceasta este o arenă excelentă pentru a vă perfecționa abilitățile de explorare și vizualizare a datelor. Pentru oricine are un fler în Python, Scikit-Learn va fi alegerea ideală, deoarece include o serie de instrumente utile pentru analiza de regresie, clasificări, asimilare de date și așa mai departe. Menționarea proiectelor de învățare automată pentru ultimul an poate ajuta CV-ul să pară mult mai interesant decât altele.

De 6 ori inteligența artificială a uimit lumea

3. Dezvoltați un analizor de sentimente

Aceasta este una dintre ideile interesante de proiecte de învățare automată. Deși cei mai mulți dintre noi folosim platformele de social media pentru a ne transmite sentimentele și opiniile personale pentru ca lumea să le vadă, una dintre cele mai mari provocări constă în înțelegerea „sentimentelor” din spatele postărilor pe social media.

Idei de proiecte de învățare automată - Analizor de sentimente

Și aceasta este ideea perfectă pentru următorul proiect de învățare automată!

Rețelele de socializare prosperă cu tone de conținut generat de utilizatori. Prin crearea unui sistem ML care ar putea analiza sentimentul din spatele textelor sau al unei postări, ar deveni mult mai ușor pentru organizații să înțeleagă comportamentul consumatorilor. Acest lucru, la rândul său, le-ar permite să-și îmbunătățească serviciul pentru clienți, oferind astfel spațiu pentru satisfacția optimă a consumatorilor.

Puteți încerca să extrageți datele de pe Twitter sau Reddit pentru a începe cu proiectul dvs. de învățare automată care analizează sentimentele. Acesta ar putea fi unul dintre acele cazuri rare de proiecte de deep learning care vă poate ajuta și în alte aspecte.

4. Îmbunătățiți asistența medicală

Aplicațiile AI și ML au început deja să pătrundă în industria sănătății și, de asemenea, transformă rapid fața asistenței medicale globale. Echipamentele portabile pentru îngrijirea sănătății, monitorizarea de la distanță, telemedicina, chirurgia robotică etc., toate sunt posibile datorită algoritmilor de învățare automată alimentați de AI. Ei nu numai că ajută HCP (furnizorii de asistență medicală) să furnizeze servicii de asistență medicală rapide și mai bune, dar reduc, de asemenea, dependența și volumul de muncă al medicilor într-o măsură semnificativă.

idei de proiecte de învățare automată asistență medicală

Deci, de ce să nu vă folosiți abilitățile pentru a dezvolta un proiect impresionant de învățare automată bazat pe asistența medicală? A gestiona un proiect cu algoritmi de învățare automată pentru începători poate fi util pentru a-ți construi cariera cu un început bun.

Industria sănătății are la dispoziție cantități enorme de date. Prin valorificarea acestor date, puteți crea:

  • Sisteme de îngrijire pentru diagnosticare care pot scana automat imagini, raze X etc. și oferă un diagnostic precis al posibilelor boli.
  • Aplicații de îngrijire preventivă care pot prezice posibilitățile de epidemii precum gripa, malaria etc., atât la nivel național, cât și la nivel comunitar.
Aceste 6 tehnici de învățare automată îmbunătățesc asistența medicală

5. Pregătiți algoritmi ML – de la zero!

Aceasta este una dintre ideile excelente de proiecte de învățare automată pentru începători. Scrierea algoritmilor ML de la zero va oferi beneficii duble:

  • În primul rând, scrierea algoritmilor ML este cea mai bună modalitate de a înțelege esențialul mecanicii lor.
  • În al doilea rând, veți învăța cum să transformați instrucțiunile matematice în cod funcțional. Această abilitate va fi utilă în viitoarea ta carieră în învățare automată.

Puteți începe prin a alege un algoritm care este simplu și nu prea complex. În spatele realizării fiecărui algoritm – chiar și a celor mai simple – există mai multe decizii atent calculate. Odată ce ați atins un anumit nivel de stăpânire în construirea unor algoritmi ML simpli, încercați să le modificați și să extindeți funcționalitatea acestora. De exemplu, puteți lua un algoritm de regresie logistică vanilie și puteți adăuga parametri de regularizare pentru a-l transforma într-un algoritm de regresie lasso/crestă. Menționarea proiectelor de învățare automată poate ajuta CV-ul să pară mult mai interesant decât altele.

6. Dezvoltați o rețea neuronală care poate citi scrisul de mână

idei de proiect de învățare automată rețea neuronală

Una dintre cele mai bune idei pentru a începe să vă experimentați proiectele Java practice pentru studenți este lucrul la rețeaua neuronală. Învățarea profundă și rețelele neuronale sunt cele două cuvinte la modă în AI. Acestea ne-au oferit minuni tehnologice precum mașinile fără șofer, recunoașterea imaginilor și așa mai departe.
Deci, acum este momentul să explorezi arena rețelelor neuronale. Începeți proiectul de învățare automată a rețelei neuronale cu provocarea MNIST Handwritten Digit Classification Challenge. Are o interfață foarte ușor de utilizat, ideală pentru începători.

Ingineri de învățare automată: mituri vs. realități

7. Sistemul de prețuri a biletelor de film

Odată cu extinderea platformelor OTT, cum ar fi Netflix, Amazon Prime, oamenii preferă să vizioneze conținutul în funcție de confortul lor. Factori precum prețul, calitatea conținutului și marketingul au influențat succesul acestor platforme.

Costul realizării unui film de lungă durată a crescut exponențial în trecutul recent. Doar 10% dintre filmele realizate fac profit. Concurența acerbă din partea platformelor de televiziune și OTT, împreună cu costul ridicat al biletului, a făcut ca filmele să facă și mai greu câștig de bani. Costul în creștere al biletului de teatru (împreună cu costul floricelelor) lasă sala de cinema goală.

Un sistem avansat de tarifare a biletelor poate ajuta cu siguranță cineaștii și telespectatorii. Prețul biletului poate fi mai mare odată cu creșterea cererii de bilet și invers. Cu cât spectatorul rezervă biletul mai devreme, cu atât costul este mai mic pentru un film cu cerere mare. Sistemul ar trebui să calculeze în mod inteligent prețul în funcție de interesul telespectatorilor, semnalele sociale și factorii cerere-oferta.

8. Proiectul ML Clasificare Iris Flowers

Una dintre cele mai bune idei pentru a începe să vă experimentați proiectele practice de învățare automată pentru studenți este să lucrați la proiectul ML de clasificare Iris Flowers. Setul de date pentru flori de iris este unul dintre cele mai bune seturi de date pentru sarcini de clasificare. Deoarece florile de iris sunt de specii variate, ele pot fi distinse în funcție de lungimea sepalelor și a petalelor. Acest proiect ML își propune să clasifice florile în cele trei specii – Virginica, Setosa sau Versicolor.

Acest proiect ML este de obicei denumit „Hello World” a Machine Learning. Setul de date pentru flori de iris conține atribute numerice și este perfect pentru începători să învețe despre algoritmii ML supravegheați, în principal cum să încarce și să gestioneze datele. De asemenea, deoarece acesta este un set de date mic, se poate încadra cu ușurință în memorie fără a necesita transformări speciale sau capabilități de scalare. Și aceasta este ideea perfectă pentru următorul proiect de învățare automată!

Puteți descărca setul de date iris aici .

9. Proiectul ML de predicție a vânzărilor BigMart

Aceasta este o idee excelentă de proiect ML pentru începători. Acest proiect ML este cel mai bun pentru a învăța cum funcționează algoritmii ML nesupravegheați. Setul de date de vânzări BigMart cuprinde exact date de vânzări din 2013 pentru 1559 de produse din zece puncte de vânzare din diferite orașe.

Scopul aici este de a utiliza setul de date de vânzări BigMart pentru a dezvolta un model de regresie care poate prezice vânzarea fiecăruia dintre cele 1559 de produse în anul următor în cele zece puncte de vânzare BigMart diferite. Setul de date de vânzări BigMart conține atribute specifice pentru fiecare produs și punct de vânzare, ajutându-vă astfel să înțelegeți proprietățile diferitelor produse și magazine care influențează vânzările generale ale BigMart ca marcă.

10. Motoare de recomandare cu setul de date MovieLens

Motoarele de recomandare au devenit extrem de populare în site-urile de cumpărături online și streaming. De exemplu, platformele de streaming de conținut online precum Netflix și Hulu au motoare de recomandare pentru a-și personaliza conținutul în funcție de preferințele individuale ale clienților și istoricul de navigare. Adaptând conținutul pentru a satisface nevoile și preferințele de vizionare ale diferiților clienți, aceste site-uri au reușit să crească cererea pentru serviciile lor de streaming.

Ca începător, puteți încerca să construiți un sistem de recomandare folosind unul dintre cele mai populare seturi de date disponibile pe web – setul de date MovieLens. Acest set de date include peste „25 de milioane de evaluări și un milion de aplicații de etichete aplicate la 62.000 de filme de către 162.000 de utilizatori”. Puteți începe acest proiect prin construirea unei vizualizări în cloud mondial a titlurilor de filme pentru a crea un motor de recomandare de filme pentru MovieLens.

Puteți consulta setul de date MovieLens aici .

11. Prezicerea calității vinului folosind setul de date privind calitatea vinului

Este un fapt bine stabilit că vârsta face vinul mai bun – cu cât vinul este mai vechi, cu atât va avea un gust mai bun. Cu toate acestea, vârsta nu este singurul lucru care determină gustul unui vin. Numeroși factori determină certificarea calității vinului, inclusiv testele fizico-chimice, cum ar fi cantitatea de alcool, aciditatea fixă, aciditatea volatilă, densitatea și nivelul pH-ului, pentru a numi câteva.

În acest proiect ML, trebuie să dezvoltați un model ML care poate explora proprietățile chimice ale unui vin pentru a prezice calitatea acestuia. Setul de date privind calitatea vinului pe care îl veți utiliza pentru acest proiect constă din aproximativ 4898 de observații, inclusiv 11 variabile independente și o variabilă dependentă. Menționarea proiectelor de învățare automată pentru ultimul an poate ajuta CV-ul să pară mult mai interesant decât altele.

12. Clasificarea cifrelor scrise de mână MNIST

Acesta este unul dintre proiectele interesante de învățare automată. Deep Learning și rețelele neuronale au găsit cazuri de utilizare în multe aplicații din lumea reală, cum ar fi recunoașterea imaginilor, generarea automată de text, mașinile fără șofer și multe altele. Cu toate acestea, înainte de a vă aprofunda în aceste domenii complexe ale învățării profunde, ar trebui să începeți cu un set de date simplu, cum ar fi setul de date MNIST. Deci, de ce să nu vă folosiți abilitățile pentru a dezvolta un proiect impresionant de învățare automată bazat pe MNIST?

Proiectul de clasificare a cifrelor MNIST este conceput pentru a instrui mașinile să recunoască cifrele scrise de mână. Deoarece pentru începători, de obicei, este dificil să lucreze cu date de imagine peste date relaționale plate, setul de date MNIST este cel mai bun pentru începători. În acest proiect, veți folosi seturile de date MNIST pentru a vă antrena modelul ML folosind rețele neuronale convoluționale (CNN). Deși setul de date MNIST se poate încadra perfect în memoria computerului dvs. (este foarte mic), sarcina de recunoaștere a cifrelor scrise de mână este destul de dificilă.

Puteți accesa setul de date MNIST aici .

13. Recunoașterea activității umane folosind setul de date pentru smartphone

Aceasta este una dintre cele mai populare idei de proiecte de învățare automată. Setul de date pentru smartphone include înregistrarea activității de fitness și informații a 30 de persoane. Aceste date au fost captate printr-un smartphone echipat cu senzori inerțiali.

Acest proiect ML își propune să construiască un model de clasificare care poate identifica activitățile de fitness umane cu un grad ridicat de acuratețe. Lucrând la acest proiect ML, veți învăța elementele de bază ale clasificării și, de asemenea, cum să rezolvați probleme de clasificare multiplă.

14. Detectarea obiectelor cu Deep Learning

Acesta este unul dintre proiectele interesante de învățare automată de creat. Când vine vorba de clasificarea imaginilor, rețelele neuronale profunde (DNN) ar trebui să fie alegerea ta. În timp ce DNN-urile sunt deja folosite în multe aplicații de clasificare a imaginilor din lumea reală, acest proiect ML își propune să o crească cu un pas.

În acest proiect ML, veți rezolva problema detectării obiectelor prin folosirea DNN-urilor. Va trebui să dezvoltați un model care poate să clasifice obiecte și, de asemenea, să localizeze cu precizie obiecte din diferite clase. Aici, veți trata sarcina de detectare a obiectelor ca pe o problemă de regresie la măștile căsuței de delimitare a obiectelor. De asemenea, veți defini o procedură de inferență multi-scală care poate genera detectii de obiecte de înaltă rezoluție la un cost minim.

15. Detectarea știrilor false

Aceasta este una dintre ideile excelente de proiecte de învățare automată pentru începători, în special modul în care știrile false se răspândesc ca un incendiu acum. Știrile false au un talent pentru a se răspândi ca focul. Și, având în vedere că rețelele sociale ne domină viața chiar acum, a devenit mai important ca niciodată să distingem știrile false de evenimentele reale de știri. Aici poate ajuta Machine Learning. Facebook folosește deja AI pentru a filtra poveștile false și spam din fluxurile utilizatorilor.

Acest proiect ML își propune să folosească tehnicile NLP (Natural Language Processing) pentru a detecta știrile false și poveștile înșelătoare care apar din surse nereputabile. De asemenea, puteți utiliza abordarea clasică de clasificare a textului pentru a proiecta un model care poate face diferența între știrile reale și cele false. În această din urmă metodă, puteți colecta seturi de date atât pentru știri reale, cât și pentru știri false și puteți crea un model ML folosind clasificatorul Naive Bayes pentru a clasifica o știre ca fiind frauduloasă sau reală pe baza cuvintelor și expresiilor folosite în ea.

16. Înregistrați proiectul de e-mail

Setul de date de e-mail Enron conține aproape 500.000 de e-mailuri de la peste 150 de utilizatori. Este un set de date extrem de valoros pentru procesarea limbajului natural. Acest proiect implică construirea unui model ML care utilizează algoritmul de clustering k-means pentru a detecta acțiunile frauduloase. Modelul va separa observațiile în „k” număr de clustere conform modelelor similare din setul de date.

17. Proiectul Parkinson

Setul de date Parkinson include 195 de înregistrări biomedicale ale persoanelor cu 23 de caracteristici variate. Ideea din spatele acestui proiect este de a proiecta un model ML care poate face diferenta intre oamenii sanatosi si cei care sufera de boala Parkinson. Modelul folosește algoritmul XGboost (amplificare a gradientului extrem) bazat pe arbori de decizie pentru a face separarea.

18. Proiect Flickr 30K

Setul de date Flickr 30K constă din peste 30.000 de imagini, fiecare având o lege unică. Veți folosi acest set de date pentru a construi un generator de subtitrări. Ideea este de a construi un model CNN care să poată analiza și extrage în mod eficient caracteristicile dintr-o imagine și să creeze o legendă potrivită care să descrie imaginea în limba engleză.

19. Proiect clienți mall

După cum sugerează și numele, setul de date despre clienții mall -ului include înregistrările persoanelor care au vizitat mall-ul, cum ar fi sexul, vârsta, ID-ul clientului, venitul anual, scorul de cheltuieli etc. Veți construi un model care va folosi aceste date pentru a segmenta clienții. în diferite grupuri în funcție de modelele lor de comportament. O astfel de segmentare a clienților este o tactică de marketing extrem de utilă folosită de mărci și agenți de marketing pentru a crește vânzările și veniturile, în același timp, pentru a crește satisfacția clienților.

20. Proiect cinetică

Pentru acest proiect, veți folosi un set de date extins care include trei seturi de date separate – Kinetics 400, Kinetics 600 și Kinetics 700 – care conține link-uri URL la peste 6,5 milioane de videoclipuri de înaltă calitate. Scopul tău este să creezi un model care poate detecta și identifica acțiunile unui om prin studierea unei serii de observații diferite.

21. Proiect sistem de recomandare

Aceasta este o colecție bogată de seturi de date care conține o gamă diversă de seturi de date colectate de pe site-uri web populare, cum ar fi recenzii de cărți Goodreads, recenzii de produse Amazon, rețele sociale etc. Scopul dvs. este să construiți un motor de recomandare (cum ar fi cele utilizate de Amazon și Netflix) care să poată genera recomandări personalizate pentru produse, filme, muzică etc., bazate pe preferințele clienților, nevoile și comportamentul online.

22. Proiectul de locuințe din Boston

Setul de date privind locuințele din Boston constă din detaliile diferitelor case din Boston, bazate pe factori precum rata de impozitare, rata criminalității, numărul de camere dintr-o casă etc. Este un set de date excelent pentru prezicerea prețurilor diferitelor case din Boston. În acest proiect, veți construi un model care poate prezice prețul unei case noi folosind regresia liniară. Regresia liniară este cea mai potrivită pentru acest proiect, deoarece este utilizată acolo unde datele au o relație liniară între valorile de intrare și de ieșire și când intrarea este necunoscută.

23. Proiect Cityscapes

Acest set de date open source include adnotări de înaltă calitate la nivel de pixeli ale secvențelor video colectate de pe străzile din 50 de orașe diferite. Este extrem de util pentru analiza semantică. Puteți folosi acest set de date pentru a antrena rețele neuronale profunde pentru a analiza și înțelege peisajul urban urban. Proiectul presupune proiectarea unui model care poate realiza segmentarea imaginii și identifica diverse obiecte (mașini, autobuze, camioane, copaci, drumuri, oameni etc.) dintr-o secvență video stradală.

24. Proiect YouTube 8M

Youtube 8M este un set de date uriaș care are 6,1 milioane de ID-uri video YouTube, 350.000 de ore de video, 2,6 miliarde de caracteristici audio/vizuale, 3862 de clase și o medie de 3 etichete pentru fiecare videoclip. Este utilizat pe scară largă pentru proiecte de clasificare video. În acest proiect, veți construi un sistem de clasificare video care poate descrie cu acuratețe un videoclip. Acesta va lua în considerare o serie de intrări diferite și va clasifica videoclipurile în categorii separate.

25. Sunet urban 8K

Setul de date 8K de sunet urban este utilizat pentru clasificarea sunetului. Include o colecție diversă de 8732 de sunete urbane aparținând unor clase diferite, cum ar fi sirene, muzică de stradă, lătrat de câine, ciripit de păsări, oameni care vorbesc etc. Veți proiecta un model de clasificare a sunetului care poate detecta automat ce sunet urban este redat în

26. Proiect IMDB-Wiki

Acest set de date etichetat este probabil una dintre cele mai extinse colecții de imagini ale feței colectate din IMDB și Wikipedia. Are peste 5 milioane de imagini ale feței etichetate cu vârsta și sexul. cu eticheta sex și vârstă. Veți crea un model care poate detecta fețele și le poate prezice vârsta și sexul cu acuratețe. Puteți crea diferite segmente/interval de vârstă, cum ar fi 0-10, 10-20, 30-40 și așa mai departe.

27. Proiect Librispeech

Setul de date librispeech este o colecție masivă de discursuri în limba engleză derivate din proiectul LibriVox. Conține discursuri citite în limba engleză, cu diverse accente, care se întind pe peste 1000 de ore și este instrumentul perfect pentru recunoașterea vorbirii. Obiectivul acestui proiect este de a crea un model care poate traduce automat audio în text. Veți construi un sistem de recunoaștere a vorbirii care poate detecta vorbirea engleză și o poate traduce în format text.

28. Proiect german de referință pentru recunoașterea semnelor de circulație (GTSRB).

Acest set de date conține peste 50.000 de imagini cu semne de circulație segmentate în 43 de clase și care conțin informații despre caseta de delimitare a fiecărui semn de circulație. Este ideal pentru clasificarea multiclasă, care este exact ceea ce vă veți concentra aici. Veți construi un model folosind un cadru de învățare profundă care poate recunoaște căsuța de delimitare a semnelor și poate clasifica semnele de circulație. Proiectul poate fi extrem de util pentru vehiculele autonome, deoarece detectează semne și ajută șoferii să ia măsurile necesare.

29. Rezumat text video meci sportiv

Acest proiect este exact așa cum pare – obținerea unui rezumat precis și concis al unui videoclip sportiv. Este un instrument util pentru site-urile de sport care informează cititorii despre momentele evidențiate ale meciului. Deoarece rețelele neuronale sunt cele mai bune pentru rezumarea textului, veți construi acest model folosind rețele de învățare profundă, cum ar fi 3D-CNN, RNN și LSTM - uri. Mai întâi, veți fragmenta un videoclip sportiv în mai multe secțiuni utilizând algoritmii ML adecvați și apoi utilizați o combinație de SVM (mașini de vectori de suport), rețele neuronale și algoritmul k-means.

30. Generator rezumat întâlnire de afaceri

Rezumarea presupune extragerea celor mai semnificative și valoroase informații din conversații, fișiere audio/video etc., pe scurt și concis. În general, se realizează prin caracteristica de captare a trăsăturilor statistice, lingvistice și sentimentale cu structura de dialog a conversației în cauză. În acest proiect, veți folosi tehnici de învățare profundă și de procesare a limbajului natural pentru a crea rezumate precise ale întâlnirilor de afaceri, menținând în același timp contextul întregii conversații.

31. Analiza sentimentelor pentru depresie

Depresia este o problemă majoră de sănătate la nivel global. În fiecare an, milioane de oameni se sinucid din cauza depresiei și a sănătății mintale precare. De obicei, stigmatizarea asociată problemelor de sănătate mintală și tratamentul întârziat sunt cele două cauze principale din spatele acestui lucru. În acest proiect, veți valorifica datele culese de pe diferite platforme de social media și veți analiza markerii lingvistici din postările pe rețelele sociale pentru a înțelege sănătatea mintală a indivizilor. Ideea este de a crea un model de învățare profundă care poate oferi perspective valoroase și precise asupra sănătății mintale cuiva mult mai devreme decât metodele convenționale.

32. Rezolvator de ecuații scris de mână

Recunoașterea expresiei matematice scrise de mână este un domeniu crucial de studiu în cercetarea vederii computerizate. Veți construi un model și îl veți instrui pentru a rezolva ecuații matematice scrise de mână folosind rețele neuronale convoluționale. Modelul va folosi, de asemenea, tehnici de procesare a imaginii. Acest proiect implică antrenarea modelului cu datele potrivite pentru a-l face expert în citirea cifrelor, simbolurilor etc. scrise de mână, pentru a oferi rezultate corecte pentru ecuații matematice de diferite niveluri de complexitate.

33. Recunoașterea facială pentru a detecta starea de spirit și a recomanda melodii

Este un fapt cunoscut că oamenii ascultă muzică în funcție de starea de spirit și de sentimentele lor actuale. Așadar, de ce să nu creezi o aplicație care să detecteze starea de spirit a unei persoane după expresiile feței și să recomande melodii în consecință? Pentru aceasta, vei folosi elemente și tehnici de viziune computerizată. Scopul este de a crea un model care poate folosi eficient viziunea computerizată pentru a ajuta computerele să obțină o înțelegere la nivel înalt a imaginilor și videoclipurilor.

34. Generator muzical

O compoziție muzicală nu este altceva decât o combinație melodioasă de diferite niveluri de frecvență. În acest proiect, veți proiecta un generator automat de muzică care poate compune piese scurte de muzică cu intervenție umană minimă. Veți folosi algoritmi de învățare profundă și rețele LTSM pentru a construi acest generator de muzică.

35. Sistem de predicție a bolii

Acest proiect ML este conceput pentru a prezice bolile. Veți crea acest model utilizând R and R Studio și Breast Cancer Wisconsin (Diagnostic) Dataset . Acest set de date include două clase de predictori – masa sanilor benign și malign. Este esențial să aveți cunoștințe de bază despre pădurile aleatorii și XGBoost pentru a lucra la acest proiect.

36. Găsirea unei exo-planete locuibile

În ultimul deceniu, am reușit să identificăm multe planete în tranzit și exo-planete. Deoarece interpretarea manuală a potențialelor exoplanete este destul de provocatoare și consumatoare de timp (să nu uităm, este, de asemenea, supusă erorii umane), cel mai bine este să folosiți învățarea profundă pentru a identifica exoplanete. Acest proiect își propune să afle dacă există exoplanete locuibile în jurul nostru folosind CNN-uri și date zgomotoase din seria temporală. Această metodă poate identifica exoplanete locuibile cu mai multă precizie decât metoda celor mai mici pătrate.

37. Regenerare imagini pentru role vechi și deteriorate

Restaurarea bobinelor de imagine vechi sau deteriorate este o sarcină dificilă. Este aproape întotdeauna imposibil să restabiliți fotografiile vechi la starea lor originală. Cu toate acestea, învățarea profundă poate rezolva această problemă. Veți construi un model de învățare profundă care poate identifica defectele dintr-o imagine (zgârieturi, găuri, pliuri, decolorare etc.) și folosind algoritmi Inpainting pentru a o restaura. Puteți chiar colora imagini vechi alb-negru.

Proiecte din industrie din lumea reală

Magenta

Acest proiect de cercetare se concentrează pe explorarea aplicațiilor învățării automate în procesul de creație al artei și muzicii. Veți dezvolta algoritmi unici de învățare prin consolidare și de învățare profundă care pot genera imagini, cântece, muzică și multe altele. Este proiectul perfect pentru mințile creative pasionate de artă și muzică.

BluEx

BluEx se numără printre cele mai importante companii de logistică din India care și-a dezvoltat o bază de fani, datorită livrărilor sale la timp și eficiente. Cu toate acestea, așa cum este adevărat pentru toți furnizorii de logistică, BluEx se confruntă cu o provocare specială care costă atât timp, cât și bani - șoferii săi nu frecventează căile optime de livrare, ceea ce provoacă întârzieri și duce la costuri mai mari ale combustibilului. Veți crea un model ML folosind învățarea prin consolidare care poate găsi calea cea mai eficientă pentru o anumită locație de livrare. Acest lucru poate economisi până la 15% din costul combustibilului pentru BluEx.

Studiourile de mișcare

Motion Studios se laudă că este cea mai mare casă de producție radio din Europa, cu venituri de peste un miliard de dolari. De când compania media și-a lansat reality show-ul, RJ Star, au primit un răspuns fenomenal și sunt inundate de clipuri vocale. Fiind un reality show, există o fereastră de timp limitată pentru alegerea candidaților. Veți construi un model care poate face diferența între vocile masculine și feminine și veți clasifica clipurile vocale pentru a facilita o filtrare mai rapidă. Acest lucru va ajuta la o selecție mai rapidă, ușurând sarcina directorilor emisiunii.

LithionPower

Lithionpower produce baterii pentru vehicule electrice. De obicei, șoferii închiriază bateriile companiei pentru o zi și le înlocuiesc cu o baterie încărcată. Durata de viață a bateriei depinde de factori precum distanța parcursă/zi, depășirea vitezei etc. LithionPower folosește un model de preț variabil bazat pe istoricul de conducere al șoferului. Scopul acestui proiect este de a construi un model de cluster care să grupeze șoferii în funcție de istoricul lor de conducere și să îi stimuleze pe șoferi pe baza acelor clustere. Deși acest lucru va crește profiturile cu 15-20%, va percepe și mai mult de la șoferii care au un istoric slab de conducere.

Concluzie

Iată o listă cuprinzătoare de idei de proiecte de învățare automată . Învățarea automată este încă într-un stadiu incipient în întreaga lume. Sunt multe proiecte de făcut și multe de îmbunătățit. Cu minți inteligente și idei ascuțite, sistemele cu suport pentru afaceri devin mai bune, mai rapide și profitabile. Dacă doriți să excelați în învățarea automată, trebuie să acumulați experiență practică cu astfel de proiecte de învățare automată.

De asemenea, puteți verifica programul nostru Executive PG în Machine Learning și AI de la IIT Delhi . IIT Delhi este una dintre cele mai prestigioase instituții din India. Cu mai mult de 500 de membri ai facultății interne, care sunt cei mai buni în materie.

Numai lucrând cu instrumente ML și algoritmi ML puteți înțelege cum funcționează infrastructurile ML în realitate. Acum, mergeți mai departe și puneți la încercare toate cunoștințele pe care le-ați adunat prin ghidul nostru de idei de proiecte de învățare automată pentru a vă crea propriile proiecte de învățare automată!

Cât de ușor este implementarea acestor proiecte?

Aceste proiecte sunt foarte de bază, cineva cu cunoștințe bune de Machine Learning poate reuși cu ușurință să aleagă și să finalizeze oricare dintre aceste proiecte.

Pot face aceste proiecte pe ML Internship?

Da, așa cum am menționat, aceste idei de proiecte sunt în principiu pentru studenți sau începători. Există o mare posibilitate ca tu să lucrezi la oricare dintre aceste idei de proiecte în timpul stagiului tău.

De ce trebuie să construim proiecte de învățare automată?

Când vine vorba de cariere în dezvoltarea de software, este o necesitate pentru dezvoltatorii aspiranți să lucreze la propriile proiecte. Dezvoltarea de proiecte în lumea reală este cea mai bună modalitate de a vă perfecționa abilitățile și de a vă materializa cunoștințele teoretice în experiență practică.