15 ciekawych pomysłów na projekty uczenia maszynowego dla początkujących [2022]

Opublikowany: 2021-01-10

Spis treści

Pomysły na projekty uczenia maszynowego

Ponieważ sztuczna inteligencja (AI) nadal szybko się rozwija w 2022 roku, osiągnięcie mistrzostwa w uczeniu maszynowym (ML) staje się coraz ważniejsze dla wszystkich graczy w tej dziedzinie. Dzieje się tak, ponieważ zarówno sztuczna inteligencja, jak i uczenie maszynowe wzajemnie się uzupełniają. Jeśli więc jesteś początkującym, najlepszą rzeczą, jaką możesz zrobić, jest praca nad niektórymi projektami uczenia maszynowego.

W upGrad wierzymy w praktyczne podejście, ponieważ sama wiedza teoretyczna nie pomoże w pracy w czasie rzeczywistym. W tym artykule przyjrzymy się kilku interesującym projektom dotyczącym uczenia maszynowego, nad którymi początkujący mogą pracować, aby przetestować swoją wiedzę na temat uczenia maszynowego. W tym artykule znajdziesz 15 najlepszych pomysłów na projekty uczenia maszynowego dla początkujących, aby zdobyć praktyczne doświadczenie.

Ale najpierw zajmijmy się bardziej istotnym pytaniem, które musi czaić się w twoim umyśle: po co budować projekty uczenia maszynowego?

Jeśli chodzi o kariery w tworzeniu oprogramowania, początkujący programiści muszą pracować nad własnymi projektami. Tworzenie rzeczywistych projektów to najlepszy sposób na doskonalenie swoich umiejętności i przekształcenie wiedzy teoretycznej w praktyczne doświadczenie. Im więcej eksperymentujesz z różnymi projektami uczenia maszynowego , tym więcej zdobywasz wiedzy.

Podczas gdy podręczniki i materiały do ​​nauki dostarczą Ci całej wiedzy, którą musisz wiedzieć o uczeniu maszynowym, nigdy nie opanujesz ML, chyba że zainwestujesz swój czas w praktyczne eksperymenty z życia – projekty dotyczące uczenia maszynowego. Gdy zaczniesz pracować nad pomysłami na projekty związane z uczeniem maszynowym, nie tylko będziesz mógł przetestować swoje mocne i słabe strony, ale także zyskasz ekspozycję, która może być niezwykle pomocna w rozwoju Twojej kariery. W tym samouczku znajdziesz 15 ciekawych pomysłów na projekty uczenia maszynowego dla początkujących, aby zdobyć praktyczne doświadczenie w uczeniu maszynowym.

Ucz się kursów online dotyczących uczenia maszynowego z najlepszych światowych uniwersytetów. Zdobywaj programy Masters, Executive PGP lub Advanced Certificate Programy, aby przyspieszyć swoją karierę.

Oto kilka projektów uczenia maszynowego, nad którymi mogą pracować początkujący:

Oto kilka fajnych pomysłów na projekty uczenia maszynowego dla początkujących

Obejrzyj nasz film na temat pomysłów i tematów projektów uczenia maszynowego…

Ta lista pomysłów na projekty związane z uczeniem maszynowym dla uczniów jest odpowiednia dla początkujących i tych, którzy dopiero rozpoczynają naukę maszynową lub ogólnie naukę o danych. Te pomysły na projekty dotyczące uczenia maszynowego zapewnią Ci wszystkie praktyczne funkcje, których potrzebujesz, aby odnieść sukces w swojej karierze jako profesjonalista w zakresie uczenia maszynowego.

Ponadto, jeśli szukasz pomysłów na projekty uczenia maszynowego na ostatni rok , ta lista powinna Ci pomóc. Więc bez zbędnych ceregieli przejdźmy od razu do niektórych pomysłów na projekty uczenia maszynowego , które wzmocnią twoją bazę i pozwolą ci wspinać się po drabinie.

1. Predyktor cen akcji

Jednym z najlepszych pomysłów na rozpoczęcie eksperymentowania z praktycznymi projektami uczenia maszynowego dla studentów jest praca nad predyktorem cen akcji. Organizacje biznesowe i firmy poszukują dziś oprogramowania, które może monitorować i analizować wyniki firmy oraz przewidywać przyszłe ceny różnych akcji. A przy tak dużej ilości danych dostępnych na giełdzie jest to wylęgarnia możliwości dla naukowców zajmujących się danymi ze skłonnością do finansów.

zapas pomysłów na projekty związane z uczeniem maszynowym

Jednak zanim zaczniesz, musisz mieć uczciwą wiedzę w następujących obszarach:

  • Analiza predykcyjna: wykorzystanie różnych technik sztucznej inteligencji do różnych procesów danych, takich jak eksploracja danych, eksploracja danych itp., aby „przewidywać” zachowanie możliwych wyników.
  • Analiza regresji: Analiza regresyjna jest rodzajem techniki predykcyjnej opartej na interakcji między zmienną zależną (docelową) a zmienną niezależną (predyktor).
  • Analiza działania: W tej metodzie wszystkie działania wykonywane przez dwie wymienione powyżej techniki są analizowane, po czym wynik jest wprowadzany do pamięci uczenia maszynowego.
  • Modelowanie statystyczne: Obejmuje tworzenie matematycznego opisu procesu w świecie rzeczywistym i opracowanie ewentualnych niepewności w ramach tego procesu.
Co to jest uczenie maszynowe i dlaczego ma to znaczenie

2. SportsPredictor

W „ Moneyball ” Michaela Lewisa drużyna Oakland Athletics zmieniła oblicze baseballu, włączając do swojego planu gry analityczną technikę skautingu. I tak jak oni, Ty też możesz zrewolucjonizować sport w prawdziwym świecie! To doskonałe projekty uczenia maszynowego dla początkujących.

Ponieważ w świecie sportu nie brakuje danych, możesz wykorzystać te dane do tworzenia zabawnych i kreatywnych projektów uczenia maszynowego, takich jak wykorzystanie statystyk sportowych z uczelni do przewidywania, który zawodnik będzie miał najlepszą karierę w danym sporcie (poszukiwanie talentów). Możesz także zdecydować się na usprawnienie zarządzania zespołem, analizując mocne i słabe strony graczy w zespole i odpowiednio je klasyfikując.

Dzięki ilości dostępnych statystyk i danych sportowych jest to doskonała arena do doskonalenia umiejętności eksploracji danych i wizualizacji. Dla każdego, kto ma talent do Pythona, Scikit-Learn będzie idealnym wyborem, ponieważ zawiera szereg przydatnych narzędzi do analizy regresji, klasyfikacji, pozyskiwania danych i tak dalej. Wzmianka o projektach uczenia maszynowego z ostatniego roku może sprawić, że twoje CV będzie wyglądać o wiele ciekawiej niż inne.

6 razy sztuczna inteligencja zaskoczyła świat

3. Opracuj analizator nastrojów

To jeden z ciekawych pomysłów na projekty związane z uczeniem maszynowym. Chociaż większość z nas korzysta z platform mediów społecznościowych, aby przekazać światu swoje osobiste uczucia i opinie, jednym z największych wyzwań jest zrozumienie „sentymentów” kryjących się za postami w mediach społecznościowych.

pomysły na projekty uczenia maszynowego - analiza sentymentu

To idealny pomysł na Twój kolejny projekt dotyczący uczenia maszynowego!

Media społecznościowe kwitną dzięki mnóstwu treści generowanych przez użytkowników. Tworząc system ML, który mógłby analizować nastroje za tekstami lub postami, organizacjom o wiele łatwiej byłoby zrozumieć zachowania konsumentów. To z kolei pozwoliłoby im na poprawę obsługi klienta, zapewniając tym samym pole do optymalnego zadowolenia konsumentów.

Możesz spróbować wydobyć dane z Twittera lub Reddita, aby rozpocząć analizę nastrojów projektu uczenia maszynowego. To może być jeden z tych rzadkich przypadków projektów głębokiego uczenia się, które mogą pomóc Ci również w innych aspektach.

4. Poprawa opieki zdrowotnej

Aplikacje AI i ML już zaczęły przenikać do branży opieki zdrowotnej i szybko zmieniają oblicze światowej opieki zdrowotnej. Urządzenia do noszenia w służbie zdrowia, zdalne monitorowanie, telemedycyna, chirurgia robotyczna itp. są możliwe dzięki algorytmom uczenia maszynowego wspieranym przez sztuczną inteligencję. Pomagają one nie tylko HCP (dostawcom opieki zdrowotnej) w zapewnianiu szybkiej i lepszej opieki zdrowotnej, ale także w znacznym stopniu zmniejszają zależność lekarzy i ich obciążenie pracą.

pomysły na projekty związane z uczeniem maszynowym opieka zdrowotna

Dlaczego więc nie wykorzystać swoich umiejętności do opracowania imponującego projektu uczenia maszynowego opartego na opiece zdrowotnej? Obsługa projektu z algorytmami uczenia maszynowego dla początkujących może być pomocna w budowaniu kariery z dobrym początkiem.

Branża opieki zdrowotnej ma do dyspozycji ogromne ilości danych. Wykorzystując te dane, możesz stworzyć:

  • Diagnostyczne systemy opieki, które mogą automatycznie skanować obrazy, zdjęcia rentgenowskie itp. i zapewniają dokładną diagnozę możliwych chorób.
  • Zastosowania profilaktyki, które mogą przewidywać możliwości wystąpienia epidemii, takich jak grypa, malaria itp., zarówno na poziomie krajowym, jak i społeczności.
Te 6 technik uczenia maszynowego usprawnia opiekę zdrowotną

5. Przygotuj algorytmy ML – od podstaw!

To jeden z doskonałych pomysłów na projekty uczenia maszynowego dla początkujących. Pisanie algorytmów ML od podstaw przyniesie dwojakie korzyści:

  • Po pierwsze, pisanie algorytmów ML to najlepszy sposób na zrozumienie sedna ich mechaniki.
  • Po drugie, dowiesz się, jak przekształcić instrukcje matematyczne w kod funkcjonalny. Ta umiejętność przyda się w Twojej przyszłej karierze w uczeniu maszynowym.

Możesz zacząć od wyboru algorytmu, który jest prosty i niezbyt skomplikowany. Za wykonaniem każdego algorytmu – nawet najprostszego – stoi kilka starannie obliczonych decyzji. Gdy osiągniesz pewien poziom biegłości w budowaniu prostych algorytmów ML, spróbuj poprawić i rozszerzyć ich funkcjonalność. Na przykład, możesz wziąć algorytm regresji logistycznej wanilii i dodać do niego parametry regularyzacji, aby przekształcić go w algorytm regresji lasso/grzbiet. Wzmianka o projektach uczenia maszynowego może sprawić, że Twoje CV będzie wyglądać o wiele ciekawiej niż inne.

6. Opracuj sieć neuronową, która potrafi czytać pismo ręczne

pomysły na projekty uczenia maszynowego sieć neuronowa

Jednym z najlepszych pomysłów na rozpoczęcie eksperymentowania z praktycznymi projektami Java dla studentów jest praca nad siecią neuronową. Głębokie uczenie i sieci neuronowe to dwa modne hasła w sztucznej inteligencji. To dało nam cuda technologiczne, takie jak samochody bez kierowcy, rozpoznawanie obrazu i tak dalej.
Nadszedł więc czas, aby zbadać arenę sieci neuronowych. Rozpocznij swój projekt uczenia maszynowego sieci neuronowych od wyzwania MNIST odręcznej klasyfikacji cyfr. Ma bardzo przyjazny dla użytkownika interfejs, idealny dla początkujących.

Inżynierowie uczenia maszynowego: mity a rzeczywistość

7. System cen biletów do kina

Wraz z rozwojem platform OTT, takich jak Netflix, Amazon Prime, ludzie wolą oglądać treści zgodnie ze swoją wygodą. Czynniki takie jak ceny, jakość treści i marketing miały wpływ na sukces tych platform.

Koszt nakręcenia pełnometrażowego filmu gwałtownie wzrósł w niedalekiej przeszłości. Tylko 10% zrealizowanych filmów przynosi zyski. Silna konkurencja ze strony platform telewizyjnych i OTT wraz z wysokimi kosztami biletów sprawiły, że filmom jest jeszcze trudniej zarabiać pieniądze. Rosnący koszt biletu do teatru (wraz z kosztem popcornu) sprawia, że ​​sala kinowa jest pusta.

Zaawansowany system wyceny biletów z pewnością może pomóc twórcom i widzom. Cena biletu może wzrosnąć wraz ze wzrostem popytu na bilet i odwrotnie. Im wcześniej widz zarezerwuje bilet, tym mniejszy będzie koszt filmu o dużym popycie. System powinien mądrze kalkulować ceny w zależności od zainteresowania widzów, sygnałów społecznościowych i czynników podażowo-popytowych.

8. Klasyfikacja kwiatów irysa ML Project

Jednym z najlepszych pomysłów na rozpoczęcie eksperymentowania z praktycznymi projektami uczenia maszynowego dla studentów jest praca nad projektem klasyfikacji Iris Flowers ML. Zestaw danych o kwiatach tęczówki jest jednym z najlepszych zestawów danych do zadań klasyfikacyjnych. Ponieważ kwiaty tęczówki są różnych gatunków, można je rozróżnić na podstawie długości działek i płatków. Ten projekt ML ma na celu zaklasyfikowanie kwiatów do jednego z trzech gatunków – Virginica, Setosa lub Versicolor.

Ten konkretny projekt ML jest zwykle określany jako „Hello World” uczenia maszynowego. Zestaw danych o kwiatach tęczówki zawiera atrybuty liczbowe i jest idealny dla początkujących, aby poznać nadzorowane algorytmy ML, głównie jak ładować i obsługiwać dane. Ponadto, ponieważ jest to mały zestaw danych, można go łatwo zmieścić w pamięci bez konieczności specjalnych przekształceń lub możliwości skalowania. To idealny pomysł na Twój kolejny projekt dotyczący uczenia maszynowego!

Zestaw danych tęczówki można pobrać tutaj .

9. Projekt ML dotyczący prognoz sprzedaży BigMart

To doskonały pomysł na projekt ML dla początkujących. Ten projekt ML najlepiej nadaje się do nauki działania nienadzorowanych algorytmów ML. Zestaw danych sprzedażowych BigMart zawiera dokładnie dane dotyczące sprzedaży z 2013 r. dla 1559 produktów w dziesięciu punktach sprzedaży w różnych miastach.

Celem jest tutaj wykorzystanie zestawu danych sprzedaży BigMart do opracowania modelu regresji, który może przewidzieć sprzedaż każdego z 1559 produktów w nadchodzącym roku w dziesięciu różnych punktach sprzedaży BigMart. Zestaw danych sprzedaży BigMart zawiera określone atrybuty dla każdego produktu i punktu sprzedaży, co pomaga zrozumieć właściwości różnych produktów i sklepów, które wpływają na ogólną sprzedaż BigMart jako marki.

10. Silniki rekomendacji z zestawem danych MovieLens

Silniki rekomendacji stały się niezwykle popularne w sklepach internetowych i witrynach oferujących transmisje strumieniowe. Na przykład platformy do strumieniowego przesyłania treści online, takie jak Netflix i Hulu, mają silniki rekomendacji, które umożliwiają dostosowywanie ich treści do indywidualnych preferencji klientów i historii przeglądania. Dostosowując treści do potrzeb oglądania i preferencji różnych klientów, witryny te były w stanie zwiększyć popyt na swoje usługi przesyłania strumieniowego.

Jako początkujący możesz spróbować swoich sił w budowaniu systemu rekomendacji przy użyciu jednego z najpopularniejszych zestawów danych dostępnych w sieci – zestawu danych MovieLens. Ten zestaw danych obejmuje ponad „25 milionów ocen i milion aplikacji do tagów zastosowanych do 62 000 filmów przez 162 000 użytkowników”. Możesz rozpocząć ten projekt od zbudowania wizualizacji tytułów filmów w chmurze, aby stworzyć silnik rekomendacji filmów dla MovieLens.

Możesz sprawdzić zbiór danych MovieLens tutaj .

11. Przewidywanie jakości wina za pomocą zestawu danych dotyczących jakości wina

Wiadomo, że wiek czyni wino lepszym – im starsze wino, tym lepiej będzie smakować. Jednak nie tylko wiek decyduje o smaku wina. O certyfikacji jakości wina decyduje wiele czynników, w tym testy fizykochemiczne, takie jak ilość alkoholu, kwasowość ustalona, ​​kwasowość lotna, gęstość i poziom pH, aby wymienić tylko kilka.

W tym projekcie ML musisz opracować model ML, który może badać właściwości chemiczne wina w celu przewidywania jego jakości. Zbiór danych o jakości wina, którego będziesz używać w tym projekcie, składa się z około 4898 obserwacji, w tym 11 zmiennych niezależnych i jednej zmiennej zależnej. Wzmianka o projektach uczenia maszynowego z ostatniego roku może sprawić, że twoje CV będzie wyglądać o wiele ciekawiej niż inne.

12. Klasyfikacja cyfr odręcznych MNIST

To jeden z ciekawszych projektów uczenia maszynowego. Głębokie uczenie i sieci neuronowe znalazły przypadki użycia w wielu rzeczywistych aplikacjach, takich jak rozpoznawanie obrazów, automatyczne generowanie tekstu, samochody bez kierowcy i wiele innych. Jednak zanim zagłębisz się w te złożone obszary Deep Learning, powinieneś zacząć od prostego zestawu danych, takiego jak zestaw danych MNIST. Dlaczego więc nie wykorzystać swoich umiejętności do opracowania imponującego projektu uczenia maszynowego opartego na MNIST?

Projekt klasyfikacji cyfr MNIST ma na celu nauczenie maszyn rozpoznawania odręcznych cyfr. Ponieważ początkującym zwykle trudno jest pracować z danymi obrazu na płaskich danych relacyjnych, zestaw danych MNIST jest najlepszy dla początkujących. W tym projekcie użyjesz zestawów danych MNIST do trenowania modelu ML przy użyciu splotowych sieci neuronowych (CNN). Chociaż zestaw danych MNIST może bezproblemowo zmieścić się w pamięci komputera (jest bardzo mały), zadanie rozpoznawania odręcznych cyfr jest dość trudne.

Możesz uzyskać dostęp do zbioru danych MNIST tutaj .

13. Rozpoznawanie aktywności człowieka za pomocą zestawu danych smartfona

To jeden z popularnych pomysłów na projekty związane z uczeniem maszynowym. Zestaw danych smartfona zawiera zapis aktywności fizycznej i informacje 30 osób. Dane te zostały przechwycone za pomocą smartfona wyposażonego w czujniki bezwładnościowe.

Ten projekt ML ma na celu zbudowanie modelu klasyfikacji, który może z dużą dokładnością identyfikować czynności związane ze sprawnością człowieka. Pracując nad tym projektem ML, nauczysz się podstaw klasyfikacji, a także rozwiązywania problemów wieloklasyfikacji.

14. Wykrywanie obiektów za pomocą głębokiego uczenia

To jeden z ciekawszych projektów uczenia maszynowego do stworzenia. Jeśli chodzi o klasyfikację obrazów, najlepszym wyborem powinny być głębokie sieci neuronowe (DNN). Chociaż DNN są już używane w wielu rzeczywistych aplikacjach do klasyfikacji obrazów, ten projekt ML ma na celu podkręcenie go.

W tym projekcie ML rozwiążesz problem wykrywania obiektów, wykorzystując DNN. Będziesz musiał opracować model, który może zarówno klasyfikować obiekty, jak i precyzyjnie lokalizować obiekty różnych klas. Tutaj potraktujesz zadanie wykrywania obiektów jako problem regresji do masek ograniczających obiekty. Zdefiniujesz również wieloskalową procedurę wnioskowania, która może generować wykrywanie obiektów o wysokiej rozdzielczości przy minimalnych kosztach.

15. Wykrywanie fałszywych wiadomości

Jest to jeden z doskonałych pomysłów na projekt uczenia maszynowego dla początkujących, zwłaszcza jak fałszywe wiadomości rozprzestrzeniają się teraz lotem błyskawicy. Fałszywe wiadomości mają talent do rozprzestrzeniania się lotem błyskawicy. A ponieważ media społecznościowe dominują teraz w naszym życiu, odróżnienie fałszywych wiadomości od prawdziwych wydarzeń stało się ważniejsze niż kiedykolwiek. Tutaj może pomóc uczenie maszynowe. Facebook już wykorzystuje sztuczną inteligencję do filtrowania fałszywych i spamerskich historii z kanałów użytkowników.

Ten projekt ML ma na celu wykorzystanie technik NLP (Natural Language Processing) do wykrywania fałszywych wiadomości i wprowadzających w błąd historii, które pochodzą z niereputowanych źródeł. Możesz również użyć klasycznego podejścia do klasyfikacji tekstu, aby zaprojektować model, który będzie w stanie odróżnić prawdziwe i fałszywe wiadomości. W tej drugiej metodzie możesz zbierać zestawy danych zarówno dla prawdziwych, jak i fałszywych wiadomości i stworzyć model ML za pomocą klasyfikatora Naive Bayes, aby sklasyfikować wiadomość jako nieprawdziwą lub prawdziwą na podstawie użytych w niej słów i fraz.

16. Zapisz projekt e-mailowy

Zbiór danych e-mail Enron zawiera prawie 500 000 wiadomości e-mail od ponad 150 użytkowników. Jest to niezwykle cenny zbiór danych do przetwarzania języka naturalnego. Ten projekt obejmuje zbudowanie modelu ML, który wykorzystuje algorytm grupowania k-średnich do wykrywania nieuczciwych działań. Model podzieli obserwacje na liczbę „k” skupień według podobnych wzorców w zbiorze danych.

17. Projekt Parkinsona

Zbiór danych dotyczących choroby Parkinsona obejmuje 195 danych biomedycznych osób o 23 różnych cechach. Ideą tego projektu jest zaprojektowanie modelu ML, który pozwoli odróżnić osoby zdrowe od osób cierpiących na chorobę Parkinsona. W modelu zastosowano algorytm XGboost (extreme gradient boosting) oparty na drzewach decyzyjnych do wykonania separacji.

18. Projekt Flickr 30K

Zbiór danych Flickr 30K składa się z ponad 30 000 obrazów, z których każdy ma unikalny podpis. Użyjesz tego zbioru danych do zbudowania generatora podpisów obrazów. Pomysł polega na zbudowaniu modelu CNN, który będzie w stanie skutecznie analizować i wyodrębniać cechy z obrazu oraz stworzyć odpowiedni podpis opisujący obraz w języku angielskim.

19. Projekt klientów centrum handlowego

Jak sama nazwa wskazuje, zbiór danych klientów centrum handlowego zawiera rekordy osób, które odwiedziły centrum handlowe, takie jak płeć, wiek, identyfikator klienta, roczny dochód, wynik wydatków itp. Zbudujesz model, który będzie wykorzystywał te dane do segmentacji klientów na różne grupy w oparciu o ich wzorce zachowań. Taka segmentacja klientów jest bardzo przydatną taktyką marketingową stosowaną przez marki i marketerów w celu zwiększenia sprzedaży i przychodów, jednocześnie zwiększając satysfakcję klientów.

20. Projekt kinetyki

W tym projekcie użyjesz obszernego zestawu danych , który obejmuje trzy oddzielne zestawy danych — Kinetics 400, Kinetics 600 i Kinetics 700 — zawierające łącza URL do ponad 6,5 miliona wysokiej jakości filmów. Twoim celem jest stworzenie modelu, który może wykrywać i identyfikować działania człowieka, badając szereg różnych obserwacji.

21. Projekt systemu rekomendacji

Jest to bogaty zbiór danych zawierający różnorodne zbiory danych zebrane z popularnych stron internetowych, takich jak recenzje książek Goodreads, recenzje produktów Amazon, media społecznościowe itp. Twoim celem jest zbudowanie silnika rekomendacji (takiego jak te używane przez Amazon i Netflix), który może generować spersonalizowane rekomendacje dotyczące produktów, filmów, muzyki itp. na podstawie preferencji, potrzeb i zachowań klientów w Internecie.

22. Projekt mieszkaniowy w Bostonie

Zestaw danych mieszkaniowych w Bostonie zawiera szczegółowe informacje o różnych domach w Bostonie w oparciu o takie czynniki, jak stawka podatkowa, wskaźnik przestępczości, liczba pokoi w domu itp. Jest to doskonały zestaw danych do przewidywania cen różnych domów w Bostonie. W tym projekcie zbudujesz model, który może przewidzieć cenę nowego domu za pomocą regresji liniowej. Regresja liniowa najlepiej nadaje się do tego projektu, ponieważ jest używana tam, gdzie dane mają liniową zależność między wartościami wejściowymi i wyjściowymi oraz gdy dane wejściowe są nieznane.

23. Projekt Cityscapes

Ten zbiór danych o otwartym kodzie źródłowym zawiera wysokiej jakości adnotacje na poziomie pikseli sekwencji wideo zebrane z ulic w 50 różnych miastach. Jest niezwykle przydatny do analizy semantycznej. Możesz użyć tego zestawu danych do trenowania głębokich sieci neuronowych w celu analizy i zrozumienia miejskiego pejzażu miejskiego. Projekt polega na zaprojektowaniu modelu, który potrafi dokonać segmentacji obrazu i zidentyfikować różne obiekty (samochody, autobusy, ciężarówki, drzewa, drogi, ludzie itp.) z sekwencji wideo ulicy.

24. Projekt YouTube 8M

Youtube 8M to ogromny zbiór danych, który zawiera 6,1 miliona identyfikatorów wideo YouTube, 350 000 godzin wideo, 2,6 miliarda funkcji audio/wideo, 3862 klas i średnio 3 etykiety dla każdego filmu. Jest szeroko stosowany w projektach klasyfikacji wideo. W tym projekcie zbudujesz system klasyfikacji wideo, który może dokładnie opisać wideo. Rozważy szereg różnych danych wejściowych i podzieli filmy na osobne kategorie.

25. Dźwięk miejski 8K

Zestaw danych 8K dźwięku miejskiego służy do klasyfikacji dźwięku. Zawiera zróżnicowaną kolekcję 8732 dźwięków miejskich należących do różnych klas, takich jak syreny, muzyka uliczna, szczekanie psów, śpiew ptaków, rozmawianie ludzi itp. Zaprojektujesz model klasyfikacji dźwięków, który może automatycznie wykryć, który dźwięk miejski jest odtwarzany w

26. Projekt IMDB-Wiki

Ten oznaczony zbiór danych jest prawdopodobnie jednym z najobszerniejszych zbiorów obrazów twarzy zebranych z IMDB i Wikipedii. Zawiera ponad 5 milionów zdjęć twarzy oznaczonych wiekiem i płcią. z oznaczeniem płci i wieku. Stworzysz model, który potrafi wykrywać twarze i dokładnie przewidywać ich wiek i płeć. Możesz tworzyć różne segmenty/zakresy wiekowe, takie jak 0-10, 10-20, 30-40 i tak dalej.

27. Projekt Librispeech

Zbiór danych librispeech to ogromny zbiór przemówień w języku angielskim pochodzących z projektu LibriVox. Zawiera przemówienia czytane w języku angielskim z różnymi akcentami, które trwają ponad 1000 godzin i jest idealnym narzędziem do rozpoznawania mowy. Celem tego projektu jest stworzenie modelu, który może automatycznie tłumaczyć dźwięk na tekst. Zbudujesz system rozpoznawania mowy, który potrafi wykrywać mowę angielską i tłumaczyć ją na format tekstowy.

28. Niemiecki projekt benchmarku rozpoznawania znaków drogowych (GTSRB)

Ten zbiór danych zawiera ponad 50 000 obrazów znaków drogowych podzielonych na 43 klasy i zawierających informacje o polu ograniczającym każdego znaku drogowego. Idealnie nadaje się do klasyfikacji wieloklasowej, na czym dokładnie się skupisz. Zbudujesz model przy użyciu struktury głębokiego uczenia się, która potrafi rozpoznawać obwiednię znaków i klasyfikować znaki drogowe. Projekt może być niezwykle przydatny dla pojazdów autonomicznych, ponieważ wykrywa znaki i pomaga kierowcom w podejmowaniu niezbędnych działań.

29. Podsumowanie tekstu wideo meczu sportowego

Ten projekt jest dokładnie taki, jak brzmi – uzyskanie dokładnego i zwięzłego podsumowania sportowego wideo. Jest to przydatne narzędzie dla serwisów sportowych, które informują czytelników o skrótach meczów. Ponieważ sieci neuronowe najlepiej nadają się do podsumowania tekstu, zbudujesz ten model przy użyciu sieci głębokiego uczenia, takich jak 3D-CNN, RNN i LSTM . Najpierw podzielisz wideo sportowe na wiele sekcji, używając odpowiednich algorytmów ML, a następnie użyjesz kombinacji SVM (maszyny obsługujące wektory), sieci neuronowych i algorytmu k-średnich.

30. Generator podsumowań spotkań biznesowych

Podsumowanie polega na wyodrębnieniu najbardziej znaczących i wartościowych informacji z rozmów, plików audio/wideo itp., zwięźle i zwięźle. Odbywa się to zazwyczaj za pomocą funkcji uchwycającej cechy statystyczne, językowe i sentymentalne wraz ze strukturą dialogową danej rozmowy. W tym projekcie wykorzystasz techniki głębokiego uczenia się i przetwarzania języka naturalnego do tworzenia precyzyjnych podsumowań spotkań biznesowych z zachowaniem kontekstu całej rozmowy.

31. Analiza sentymentu dla depresji

Depresja jest głównym problemem zdrowotnym na całym świecie. Każdego roku miliony ludzi popełniają samobójstwa z powodu depresji i złego stanu zdrowia psychicznego. Zazwyczaj piętno związane z problemami ze zdrowiem psychicznym i opóźnionym leczeniem to dwie główne przyczyny tego stanu rzeczy. W tym projekcie wykorzystasz dane zebrane z różnych platform mediów społecznościowych i przeanalizujesz markery językowe w postach w mediach społecznościowych, aby zrozumieć zdrowie psychiczne osób. Pomysł polega na stworzeniu modelu głębokiego uczenia się, który może zaoferować cenny i dokładny wgląd w stan zdrowia psychicznego znacznie wcześniej niż konwencjonalne metody.

32. Odręczne rozwiązywanie równań

Rozpoznawanie odręcznych wyrażeń matematycznych jest kluczowym obszarem badań w badaniach wizji komputerowej. Zbudujesz model i nauczysz go rozwiązywania odręcznych równań matematycznych za pomocą splotowych sieci neuronowych. Model będzie również wykorzystywał techniki przetwarzania obrazu. Ten projekt polega na uczeniu modelu odpowiednimi danymi, aby był biegły w odczytywaniu odręcznych cyfr, symboli itp., aby dostarczać prawidłowe wyniki dla równań matematycznych o różnym poziomie złożoności.

33. Rozpoznawanie twarzy do wykrywania nastroju i polecania piosenek

Wiadomo, że ludzie słuchają muzyki w oparciu o ich aktualny nastrój i uczucia. Dlaczego więc nie stworzyć aplikacji, która potrafi wykrywać nastrój danej osoby na podstawie jej mimiki i odpowiednio polecać piosenki? W tym celu użyjesz elementów i technik widzenia komputerowego. Celem jest stworzenie modelu, który może skutecznie wykorzystać wizję komputerową, aby pomóc komputerom w zrozumieniu obrazów i filmów na wysokim poziomie.

34. Generator muzyki

Kompozycja muzyczna to nic innego jak melodyjne połączenie różnych poziomów częstotliwości. W tym projekcie zaprojektujesz automatyczny generator muzyki, który może komponować krótkie utwory muzyczne przy minimalnej ingerencji człowieka. Do budowy tego generatora muzyki użyjesz algorytmów głębokiego uczenia i sieci LTSM.

35. System przewidywania chorób

Ten projekt ML ma na celu przewidywanie chorób. Utworzysz ten model za pomocą R and R Studio i Breast Cancer Wisconsin (Diagnostic) Dataset . Ten zestaw danych obejmuje dwie klasy predyktorów – łagodną i złośliwą masę piersi. Do pracy nad tym projektem niezbędna jest podstawowa wiedza na temat lasów losowych i XGBoost.

36. Znalezienie nadającej się do zamieszkania egzoplanety

W ciągu ostatniej dekady odnieśliśmy sukces w identyfikacji wielu tranzytujących i egzoplanet. Ponieważ ręczna interpretacja potencjalnych egzoplanet jest dość trudna i czasochłonna (nie zapominajmy, że jest również obarczona błędem człowieka), najlepiej jest używać głębokiego uczenia do identyfikacji egzoplanet. Ten projekt ma na celu sprawdzenie, czy wokół nas są jakieś egzoplanety nadające się do zamieszkania, korzystając z CNN i zaszumionych danych szeregów czasowych. Ta metoda może identyfikować egzoplanety nadające się do zamieszkania z większą precyzją niż metoda najmniejszych kwadratów.

37. Regeneracja obrazu dla starych i uszkodzonych rolek

Odnawianie starych lub uszkodzonych rolek z obrazami to trudne zadanie. Przywrócenie starych zdjęć do ich pierwotnego stanu jest prawie zawsze niemożliwe. Jednak głębokie uczenie może rozwiązać ten problem. Zbudujesz model głębokiego uczenia, który może zidentyfikować defekty obrazu (zadrapania, dziury, zagięcia, odbarwienia itp.) i użyć algorytmów Inpainting do jego przywrócenia. Możesz nawet pokolorować stare czarno-białe obrazy.

Realne projekty branżowe

Magenta

Ten projekt badawczy koncentruje się na badaniu zastosowań uczenia maszynowego w procesie tworzenia sztuki i muzyki. Opracujesz unikalne algorytmy uczenia ze wzmacnianiem i głębokiego uczenia się, które mogą generować obrazy, piosenki, muzykę i wiele więcej. To idealny projekt dla kreatywnych umysłów pasjonujących się sztuką i muzyką.

BlueEx

BluEx jest jedną z wiodących firm logistycznych w Indiach, która zyskała sporą rzeszę fanów dzięki terminowym i wydajnym dostawom. Jednak, jak wszyscy dostawcy usług logistycznych, BluEx stoi przed jednym szczególnym wyzwaniem, które kosztuje zarówno czas, jak i pieniądze – jego kierowcy nie korzystają z optymalnych tras dostaw, co powoduje opóźnienia i prowadzi do wyższych kosztów paliwa. Stworzysz model ML za pomocą uczenia się wzmacniającego, który może znaleźć najbardziej wydajną ścieżkę dla określonej lokalizacji dostawy. Dzięki temu BluEx może zaoszczędzić do 15% kosztów paliwa.

Studia Ruchu

Motion Studios szczyci się tym, że jest największym w Europie producentem radia z przychodami przekraczającymi miliard dolarów. Odkąd firma medialna uruchomiła swój reality show, RJ Star, otrzymali fenomenalny odzew i są zalewani klipami głosowymi. Ponieważ jest to reality show, wybór kandydatów jest ograniczony. Zbudujesz model, który potrafi rozróżniać głosy męskie i żeńskie oraz klasyfikować klipy głosowe, aby ułatwić szybszą filtrację. Pomoże to w szybszej selekcji, co ułatwi zadanie kierownikom pokazów.

LithionPower

Lithionpower buduje akumulatory do pojazdów elektrycznych. Zazwyczaj kierowcy wynajmują firmowe akumulatory na jeden dzień i wymieniają je na naładowany akumulator. Żywotność baterii zależy od takich czynników, jak przejechany dystans/dzień, przekroczenie prędkości itp. LithionPower wykorzystuje model cenowy oparty na historii jazdy kierowcy. Celem tego projektu jest zbudowanie modelu klastra, który grupuje kierowców według ich historii jazdy i motywuje kierowców w oparciu o te klastry. Chociaż zwiększy to zyski o 15-20%, będzie również pobierać więcej od kierowców, którzy mają słabą historię jazdy.

Wniosek

Oto pełna lista pomysłów na projekty związane z uczeniem maszynowym . Uczenie maszynowe jest wciąż na wczesnym etapie na całym świecie. Jest wiele projektów do zrobienia i wiele do ulepszenia. Dzięki inteligentnym umysłom i pomysłowym pomysłom systemy wspierające biznes stają się lepsze, szybsze i zyskowne. Jeśli chcesz osiągnąć sukces w uczeniu maszynowym, musisz zebrać praktyczne doświadczenie z takimi projektami uczenia maszynowego.

Możesz również sprawdzić nasz program Executive PG w zakresie uczenia maszynowego i sztucznej inteligencji z IIT Delhi . IIT Delhi to jedna z najbardziej prestiżowych instytucji w Indiach. Z większą liczbą ponad 500 wewnętrznych członków wydziału, którzy są najlepsi w tej dziedzinie.

Tylko pracując z narzędziami ML i algorytmami ML możesz zrozumieć, jak w rzeczywistości działają infrastruktury ML. Teraz śmiało przetestuj całą wiedzę zgromadzoną w naszym przewodniku po pomysłach na projekty uczenia maszynowego, aby zbudować własne projekty uczenia maszynowego!

Jak łatwo zrealizować te projekty?

Te projekty są bardzo proste, ktoś z dobrą znajomością uczenia maszynowego może z łatwością wybrać i zakończyć dowolny z tych projektów.

Czy mogę wykonywać te projekty na stażu ML?

Tak, jak wspomniano, te pomysły na projekty są zasadniczo dla studentów lub początkujących. Istnieje duże prawdopodobieństwo, że podczas stażu będziesz pracować nad którymkolwiek z tych pomysłów na projekt.

Dlaczego musimy budować projekty uczenia maszynowego?

Jeśli chodzi o kariery w tworzeniu oprogramowania, początkujący programiści muszą pracować nad własnymi projektami. Tworzenie rzeczywistych projektów to najlepszy sposób na doskonalenie swoich umiejętności i przekształcenie wiedzy teoretycznej w praktyczne doświadczenie.