Dzień z życia Data Scientist: czym się zajmują?

Opublikowany: 2021-07-21

Jednym z najczęściej zadawanych pytań jest opisanie „ dnia z życia data scientist”. W tym miejscu staraliśmy się przedstawić jasny opis tego, jak wygląda podejmowanie świadomej decyzji, czy ten wybór kariery jest dla Ciebie właściwy.

Na początku postawmy sprawę jasno. Niemal niemożliwe jest scharakteryzowanie choćby jednego dnia z życia analityka danych. Ponieważ praca jest tak zróżnicowana, a zawód tak złożony, typowy dzień będzie zależał od wielu czynników. Jednym z głównych czynników jest rodzaj projektu danych, nad którym pracujesz, który może zmieniać się co miesiąc lub co kwartał. Druga kwestia jest bardziej systemowa i zależy od rodzaju organizacji, w której pracujesz.

Jeśli struktura jest hierarchiczna, doświadczenie będzie inne, jeśli będzie oparte na zespole, będzie inne. Trzecim parametrem, który wpływa na typowy dzień, jest Twoja rola w zespole. Niezależnie od tego, czy jesteś starszym, młodszym, czy też pojedynczym analitykiem danych w zespole, lub inne takie względy mają wpływ na typowy dzień pracy.

Ale kiedy weźmiesz średnią z nich wszystkich, zwykły dzień dla naukowca danych może wyglądać mniej więcej tak, jak poniżej. Istnieją trzy główne funkcje, które analityk danych wykonuje w ciągu jednego dnia. Nic dziwnego, że większość czasu zajmuje kodowanie. Równowaga czasu idzie na spotkania i myślenie, oba z grubsza podzielone równo.

W tym przypadku myślenie odnosi się do osobistej refleksji, a w czasie spotkania możemy uwzględnić myślenie grupowe. Należy pamiętać, że nigdzie nie ma projektu, który można ukończyć w ciągu jednego dnia. Tak więc, przez większość dni twoja praca będzie obejmować jedną z trzech kwestii dotyczących nieustannych dyskusji, przemyśleń lub pracy nad istniejącym projektem, z którego przerwałeś poprzedniego dnia. Omówmy niektóre z nich nieco bardziej szczegółowo.

Spis treści

Kodowanie

Jako naukowiec zajmujący się danymi możesz oczekiwać, że zajmie to około 70% twojego czasu. Może nawet to przekroczyć. Nie jest to niespodzianką, biorąc pod uwagę, że głównym zadaniem analityka danych jest kodowanie. Jak każdy naukowiec, analityk danych ma do dyspozycji różne narzędzia i języki.

Niektóre z bardziej znanych to Python, SQL i Bash. Z tego powodu kodowanie jest najważniejszą ze wszystkich umiejętności, których możesz się nauczyć, jeśli chcesz zostać naukowcem danych. Statystyka i myślenie biznesowe uzupełniają inne kluczowe umiejętności, ale ich znaczenie dla kodowania jest mniejsze. Dowiedz się więcej o dostępnych narzędziach do analizy danych.

Jednak kodowanie to obszerne słowo i musimy podjąć próbę poznania niektórych typowych zadań związanych z kodowaniem. Niektóre z nich zostały pokrótce podane w poniższych zdaniach. Czyszczenie i formatowanie danych jest prawdopodobnie najbardziej pracochłonną i czasochłonną pracą w ramach kodowania.

Może to zabrzmieć sprzecznie z intuicją, gdy ci to wyjaśnimy, ale nadal się utrzymuje. Proces ten polega na przeniesieniu danych do rozpoznawalnego formatu, który można kodować na kolejnych etapach projektu. Chociaż można to wyjaśnić w jednym wierszu, osiągnięcie tego jest jednym z najtrudniejszych procesów.

Po zakończeniu czyszczenia i formatowania danych następne zadanie zazwyczaj obejmuje prototypowanie. Wykonujesz prototypy, aby porównać dane z różnymi metodami analitycznymi i metodami uczenia maszynowego.

Pomoże Ci to wybrać najlepszą metodę. Ten etap jest często uważany za trudny przez wielu analityków danych, ale jako pierwsi zwrócą uwagę, że jest to również jedna z najbardziej ekscytujących części całej sekwencji. Dzieje się tak, ponieważ na tym etapie surowe dane stają się cenne, podobnie jak wydobywanie metali szlachetnych z rudy.

Wspomnieliśmy już o niektórych narzędziach i dla każdego z nich istnieje kompatybilne oprogramowanie do prototypowania. Możesz tutaj mieszać i dopasowywać, aby zobaczyć, co działa w danym środowisku i co jest dla Ciebie najbardziej komfortowe. Pamiętaj, że ten etap nie służy do ostatecznego wnioskowania danych. Zamiast tego jest to punkt, w którym chcesz sprawdzić, co działa, a co nie.

Poniższe kroki mogą się różnić w zależności od ostatecznego celu projektu. Na przykład może to być spotkanie z zespołem lub seniorami. W takich przypadkach konieczne byłoby przekształcenie danych w reprezentację wizualną i zgłoszenie wyników. Te rzeczy będą musiały znaleźć się w twojej prezentacji.

Z drugiej strony, jeśli jest to raport, który Twoi koledzy mogą przydać się w przyszłości, to Twoim głównym zadaniem po prototypowaniu powinno być zautomatyzowanie go i udostępnienie go wszystkim w firmie. Wreszcie, co być może najbardziej ekscytujące, jeśli odpowiadasz za uczenie maszynowe lub analizę, która zostanie przekształcona w usługę lub produkt, Twoim zadaniem będzie wymyślenie wdrożenia. W tym momencie programiści również Ci pomogą.

Przeczytaj: Wynagrodzenie analityka danych w Indiach

Dlatego, podsumowując to, czego nauczyliśmy się do tej pory w kodowaniu, pierwsze kilka kroków obejmuje czyszczenie i formatowanie danych, a następnie prototypowanie. Kolejne kroki mogą obejmować tworzenie wizualizacji danych, automatyzację projektu, wdrażanie modeli do wykorzystania jako produkt lub usługa, żeby wymienić tylko kilka.

Inne różne czynności mogły zostać uwzględnione w tej sekcji, ale pojawiają się one od czasu do czasu i nie są częścią normalnego procesu. Obejmują one naprawianie błędów, samouczki dotyczące nowych pakietów i bibliotek oraz obsługę wcześniej napisanych skryptów. Kiedy jesteś naukowcem danych, zawsze jest coś do zrobienia.

Spotkania, prezentacje, rozmowy i burza mózgów z grupą

Ponieważ kodowanie zajmuje około 70% czasu, pozostało 30%. W sumie 15% całkowitego czasu spędza się na spotkaniach z ludźmi. Mogą one przybierać różne formy, takie jak formalne spotkania, sesje jeden na jeden, prezentacje, dyskusje przy dystrybutorze wody, a nawet czat grupowy.

Kontakt z członkami zespołu jest niezwykle ważny, ponieważ często w całym zespole jest tylko jeden analityk danych, który nie jest dokładnie świadomy tego, co robisz. Musisz je zabrać ze sobą. Nie pozwólmy jednak, aby wydawało się to zbyt wybredne, ponieważ dzięki temu możesz dążyć do większej współpracy z nimi. Możesz uzyskać od nich większą pomoc w swoich projektach dotyczących dużych zbiorów danych, a tym samym mieć większy wpływ.

Dlatego ważne jest, abyś nawiązał kontakt ze swoimi kolegami, nawet jeśli jesteś z natury introwertykiem jako naukowiec danych. Ale tutaj potrzebne jest słowo ostrzeżenia. Szczególnie w większych firmach istnieje zwyczaj organizowania spotkań przez cały dzień. Wiąże się to z siedzeniem i mówieniem oraz brakiem czasu na faktyczne kodowanie. Pod koniec dnia zobaczysz, że twoja praca narasta, a nikt cię nie wspiera. Dlatego utrzymuj kontakt ze swoimi współpracownikami, ale nie przesadzaj do punktu, w którym przyniesie to efekt przeciwny do zamierzonego.

Sposób, w jaki poradzisz sobie z tym problemem, może mieć kluczowe znaczenie dla Twoich szans na postęp w organizacji. Przede wszystkim pamiętaj, że nie powinno się spędzać więcej niż 15% czasu pracy na spotkaniu, żeby przyjąć przybliżenie. Mając na uwadze ten punkt odniesienia, początkowo nawiąż więź z kolegami z zespołu i menedżerem. Następnie usiądź z nimi i wyjaśnij im, na czym polega twoja praca, abyś musiał być obecny tylko na spotkaniach, które są niezbędne dla twojej pracy.

Czas na myślenie

Niektórym może się to wydawać absurdalne, ale bezwzględnie konieczne jest spędzenie co najmniej 15% dnia na myśleniu. Nauka o danych nie jest dziecinnie prosta i wymaga dużo ciężkiej pracy. Dlatego jeśli nie myślisz i nie planujesz swojego dnia, kontynuowanie jest prawie niemożliwe. Musisz znaleźć najlepsze modele statystyczne, poprawnie zinterpretować dane, potrzebujesz słów, aby przedstawić wyniki, a do tego wszystkiego potrzebujesz czasu na samotne przemyślenie.

Podczas myślenia, jeśli nie możesz uporządkować myśli, przejdź do rysowania lub szkicowania. Trzymaj tablicę blisko siebie. Lub użyj zwykłego, starego papieru. Ale jako naukowiec zajmujący się danymi, zawsze możesz użyć zaawansowanego technologicznie narzędzia, takiego jak Miro, które jest internetowym narzędziem do mapowania myśli.

Kodowanie to główna część Twojej pracy, ale może zdziałać cuda, gdy połączysz je ze szkicowaniem i myśleniem. Cofnięcie się do myślenia pozwala zobaczyć szerszy obraz, który często gubi się w drobnych szczegółach kodowania. Choć wygląda to na przestój, często jest to najważniejszy moment na zwiększenie produktywności.

Różne czynności i wnioski

Przed wyjazdem na cały dzień trzeba znaleźć czas na odpowiedzi na wszystkie maile. Uprzejmie jest odpowiedzieć tego samego dnia i należy to zrobić. Oczekuje się, że w ciągu dnia będziesz zajęty, więc znajdź czas pod koniec dnia. Przejrzyj dzień, który właśnie zakończyłeś i zaplanuj następny dzień, aby zachować ciągłość i wydajność.

Podsumowując, 70% czasu pracy analityka danych zajmuje kodowanie. Saldo po 15% przeznacza się na spotkania i myślenie, a koniec dnia przeznacza się na różne zajęcia. To satysfakcjonująca kariera, do której aspiruje wielu.

Jeśli jesteś ciekawy, jak uczyć się nauki o danych, aby być na czele szybkiego postępu technologicznego, sprawdź program Executive PG w dziedzinie nauki o danych i podnoś swoje umiejętności na przyszłość.

Przygotuj się na karierę przyszłości

DYPLOM PG Z IIIT-B, PONAD 100 GODZIN NAUKI W KLASIE, PONAD 400 GODZIN NAUKI ONLINE I 360 STOPNI WSPARCIA KARIERY
Ucz się więcej