10 najlepszych projektów ML w czasie rzeczywistym dla studentów i profesjonalistów
Opublikowany: 2021-12-12Jeśli chodzi o technologię, posiadanie samej wiedzy teoretycznej z podręczników zaprowadzi Cię tylko do tej pory. Tylko wtedy, gdy podejmiesz praktyczne podejście, możesz opanować daną technologię lub umiejętności. A czy jest lepszy sposób na zrobienie tego niż zdobycie kilku projektów w czasie rzeczywistym?
To samo dotyczy dziedziny uczenia maszynowego (ML) i sztucznej inteligencji (AI). Projekty związane z uczeniem maszynowym pomagają poznać wszystkie praktyczne aspekty, których potrzebujesz, aby zdobyć doświadczenie w środowisku pracy w czasie rzeczywistym i sprawić, że będziesz mieć zatrudnienie w branży. Co więcej, obecna i przewidywana wielkość globalnego rynku sztucznej inteligencji sprawia, że logicznym jest osiągnięcie przez graczy w tej dziedzinie mistrzostwa w uczeniu maszynowym. Dlatego bez zbędnych ceregieli przedstawiamy 10 najlepszych projektów uczenia głębokiego i pomysłów na projekty uczenia maszynowego dla początkujących i profesjonalistów, którzy chcą wyróżnić swoje CV.
Spis treści
Pomysły na projekty uczenia maszynowego dla studentów i profesjonalistów
Poniżej znajduje się lista interesujących pomysłów na projekty uczenia maszynowego dla studentów i profesjonalistów, aby uzyskać bezpośredni kontakt z uczeniem maszynowym.
1. Klasyfikacja cyfr MNIST
Klasyfikacja cyfrowa MNIST to jeden z najciekawszych projektów głębokiego uczenia się dla początkujących. Głębokie uczenie i sieci neuronowe z pewnością mają zaawansowane zastosowania w świecie rzeczywistym, takie jak automatyczne generowanie tekstu, rozpoznawanie obrazów, autonomiczne samochody itp. Ale zanim zajmiesz się tymi złożonymi aplikacjami, praca nad zbiorem danych MNIST to świetny sposób na przełamanie lodów. Ten projekt ma na celu wytrenowanie modelu uczenia maszynowego w zakresie rozpoznawania odręcznych cyfr przy użyciu zestawów danych MNIST i splotowych sieci neuronowych (CNN). Ogólnie rzecz biorąc, jest to idealny projekt dla tych, dla których praca z danymi relacyjnymi nad danymi obrazu jest mniej trudna.
2. Klasyfikacja kwiatów tęczówki
Często uważany za „Hello World” projektów uczenia maszynowego, projekt klasyfikacji kwiatów tęczówki jest najlepszym miejscem dla początkujących, aby rozpocząć przygodę z uczeniem maszynowym. Projekt opiera się na zbiorze danych o kwiatach tęczówki i ma na celu zaklasyfikowanie pięknych fioletowych kwiatów do trzech gatunków – versicolor, virginica i setosa. Gatunki można rozróżnić na podstawie płatków i działek kielicha. Zestaw danych ma atrybuty liczbowe i wymaga od początkujących, aby poznali nadzorowane algorytmy uczenia maszynowego oraz sposób ładowania i obsługi danych. Co więcej, zestaw danych jest mały i łatwo mieści się w pamięci bez konieczności dodatkowego przekształcania lub skalowania.
3. System rekomendacji muzycznych
W witrynach zakupów online, takich jak Amazon, system podczas realizacji zakupu tworzy rekomendacje produktów – te, które klient prawdopodobnie kupi na podstawie swoich wcześniejszych zakupów. Podobnie witryny do strumieniowego przesyłania filmów / muzyki, takie jak Netflix i Spotify, są całkiem dobre w sugerowaniu filmów i piosenek, które mogą się spodobać określonemu użytkownikowi. Korzystając z zestawu danych usługi strumieniowego przesyłania muzyki, możesz utworzyć podobny spersonalizowany system rekomendacji w swoim projekcie uczenia maszynowego. Celem jest określenie, jaki nowy utwór lub wykonawca może polubić użytkownik na podstawie jego wcześniejszych wyborów i przewidzieć szanse, że użytkownik dostroi się do utworu w określonym czasie.
4. Predyktor cen akcji
Jeśli jesteś skłonny do finansów, predyktor cen akcji jest jednym z najlepszych projektów uczenia maszynowego, które możesz zbadać. Większość dzisiejszych organizacji biznesowych i firm opartych na danych stale potrzebuje oprogramowania, które może dokładnie monitorować i analizować wyniki firmy oraz prognozować przyszłe ceny różnych akcji. Przy ogromnej ilości dostępnych danych giełdowych praca nad predyktorem cen akcji jest ekscytującą okazją zarówno dla naukowców zajmujących się danymi, jak i entuzjastów uczenia maszynowego. Jednak praca nad tym projektem będzie wymagała solidnej wiedzy z zakresu analizy predykcyjnej, analizy działań, analizy regresji i modelowania statystycznego.
5. Odręczne rozwiązywanie równań
Sprawienie, by Twój model uczenia maszynowego rozpoznawał cyfry pisane odręcznie, to dopiero początek. Ci, którzy pokonali projekt klasyfikacji cyfrowej MNIST na poziomie początkującym, mogą pójść o krok do przodu i zbudować projekt, który może rozwiązywać odręcznie pisane równania za pomocą CNN. Rozpoznawanie odręcznych równań matematycznych jest jednym z najbardziej kłopotliwych zagadnień w dziedzinie badań nad wizją komputerową. Jednak dzięki połączeniu CNN i niektórych technik przetwarzania obrazu możliwe jest wytrenowanie odręcznie napisanego równego rozwiązania za pomocą cyfr matematycznych i odręcznych symboli. Projekt jest krokiem w kierunku digitalizacji kroków rozwiązywania równania matematycznego zapisanego długopisem i papierem.
6. Analiza nastrojów na podstawie postów w mediach społecznościowych
Platforma mediów społecznościowych, taka jak Facebook czy Instagram, może być po prostu miejscem wyrażania osobistych uczuć i opinii przeciętnemu użytkownikowi. Jednak dla firm jest to droga do badania zachowań konsumenckich. Media społecznościowe są pełne treści generowanych przez użytkowników. Zrozumienie nastrojów kryjących się za każdym tekstem lub obrazem ma kluczowe znaczenie dla organizacji biznesowych w celu poprawy obsługi klienta w oparciu o badanie zachowań konsumentów w czasie rzeczywistym. Co więcej, analiza markerów językowych w postach w mediach społecznościowych może pomóc w stworzeniu modelu głębokiego uczenia się, który zapewni spersonalizowany wgląd w stan zdrowia psychicznego użytkownika wcześniej niż w przypadku konwencjonalnych metod. Możesz wydobyć dane z Reddit lub Twittera, aby rozpocząć ten projekt.
7. Przewidywanie kwalifikowalności pożyczki
Banki zazwyczaj przechodzą bardzo rygorystyczny proces przed zatwierdzeniem pożyczki. Ale dzięki postępom w uczeniu maszynowym możliwe jest szybsze i znacznie dokładniejsze przewidywanie kwalifikowalności pożyczek. Model uczenia maszynowego do przewidywania uprawnień do pożyczki zostanie przeszkolony przy użyciu zestawu danych składającego się z danych dotyczących wnioskodawcy, takich jak kwota pożyczki, płeć, dochód, stan cywilny, liczba osób na utrzymaniu, kwalifikacje, historia karty kredytowej i tym podobne. Projekt będzie obejmował szkolenie i testowanie modelu przy użyciu walidacji krzyżowej, a dowiesz się, jak budować modele statystyczne, takie jak XGBoost, Gradient Boosting i metryki, takie jak punktacja MCC, krzywa ROC itp.
8. Przewidywanie jakości wina
Zestaw danych do prognozowania jakości wina jest dość popularny wśród studentów rozpoczynających naukę w dziedzinie nauki o danych. Polega na wykorzystaniu kwasowości lotnej, kwasowości stałej, gęstości i alkoholu do przewidywania jakości czerwonego wina. W tym projekcie można zastosować podejście klasyfikacyjne lub regresyjne. Zmienna jakości wina, którą musisz przewidzieć w zbiorze danych, mieści się w zakresie od 0 do 10 i możesz to zrobić, budując model regresji. Innym podejściem byłoby utworzenie trzech kategorii (niskiej, średniej i wysokiej), rozbicie 0-10 na oddzielne przedziały i przekształcenie ich w wartości kategoryczne. W związku z tym można zbudować dowolny model klasyfikacji dla predykcji.
9. Przewidywanie cen domu
Jeśli jesteś początkującym uczeniem maszynowym, możesz użyć zestawu danych o cenach domów Kaggle, aby zbudować projekt prognozowania cen domów. Cena konkretnego domu jest zmienną docelową w tym zbiorze danych. Twój model ML musi przewidywać cenę na podstawie informacji takich jak lokalizacja, liczba pokoi i media. Ponieważ jest to problem regresji, początkujący mogą zastosować podejście oparte na regresji liniowej, aby zbudować model. Ci, którzy chcą przyjąć bardziej zaawansowane podejście, mogą użyć funkcji zwiększania gradientu lub losowego regresora lasu do przewidywania cen domów. Zestaw danych zawiera również wiele zmiennych kategorycznych, które wymagają technik, takich jak kodowanie etykiet i kodowanie na gorąco.
10. Segmentacja klientów w Pythonie
Dla tych, którzy chcą zacząć korzystać z nienadzorowanego uczenia maszynowego, zestaw danych do segmentacji klientów w Kaggle jest najlepszym rozwiązaniem. Zestaw danych składa się z danych klientów, takich jak płeć, wiek, roczny dochód i wynik wydatków. Musisz użyć tych zmiennych, aby pogrupować podobnych klientów w podobne klastry. Główne cele projektu to osiągnięcie segmentacji klientów, identyfikacja docelowych klientów dla różnych strategii marketingowych oraz zrozumienie rzeczywistych mechanizmów strategii marketingowych. Aby wykonać te zadania, można użyć klastrowania hierarchicznego lub klastrowania k-średnich.
Droga naprzód
upGrad oferuje internetowy program Executive PG w zakresie uczenia maszynowego i sztucznej inteligencji ukierunkowany na przekazywanie umiejętności na żądanie, takich jak NLP, głębokie uczenie, MLOps i budowanie strategii AI.
Najważniejsze punkty programu:
- Prestiżowe uznanie od IIIT Bangalore
- 450+ godzin nauki z projektami branżowymi
- Zajęcia z kodowania na żywo i warsztaty budowania profilu
- Sieci branżowe i równorzędne z obsługą uczenia się 360 stopni
Reputacja upGrad jako jednej z najlepszych wyższych platform EdTech jest niezrównana. Jego światowej klasy, istotne dla branży programy wpłynęły na ponad 500 000 pracujących profesjonalistów na całym świecie i nadal zaspokajają potrzeby edukacyjne ponad 40 000 osób uczących się w 85 krajach. Zarejestruj się w upGrad, aby dowiedzieć się więcej o najbardziej pożądanych kursach i certyfikatach.
Czy uczenie maszynowe wymaga kodowania?
Tak, kodowanie jest koniecznością, jeśli chcesz rozpocząć karierę w uczeniu maszynowym. Java, C++ i Python to podstawy języka programowania dla uczenia maszynowego, ale mogą być bardziej szczegółowe. Im lepsze umiejętności kodowania, tym lepiej zrozumiesz, jak działają algorytmy, a co za tym idzie będziesz je monitorować i optymalizować.
Czy uczenie maszynowe jest skomplikowane?
Wiele narzędzi do uczenia maszynowego jest dość trudnych w użyciu i wymaga znajomości statystyki, zaawansowanej matematyki i inżynierii oprogramowania. Istnieje jednak wiele koncepcji na poziomie początkującym dla początkujących. Na przykład wiele nienadzorowanych i nadzorowanych modeli uczenia się zaimplementowanych w Pythonie i R jest dostępnych bezpłatnie i można je dość łatwo skonfigurować na komputerach osobistych. Prosta regresja liniowa lub logistyczna przydaje się również w przypadku różnych zadań uczenia maszynowego.
Jaki rodzaj matematyki jest potrzebny do uczenia maszynowego?
Musisz opanować matematykę, aby wykonywać zadania i projekty związane z uczeniem maszynowym. Niektóre koncepcje matematyczne niezbędne dla uczenia maszynowego i algorytmów sztucznej inteligencji obejmują algebra liniową, rachunek różniczkowy, matematykę dyskretną, teorię prawdopodobieństwa i statystykę.