O zi în viața omului de știință a datelor: ce fac ei?

Publicat: 2021-07-21

Una dintre cele mai frecvente întrebări este de a descrie „ o zi din viața unui cercetător de date”. Aici am încercat să oferim o descriere ușoară a modului în care arată să luați o decizie informată dacă această alegere de carieră este cea potrivită pentru dvs.

De la început, să fim foarte clari. Este aproape imposibil să caracterizezi doar o zi din viața unui cercetător de date. Pentru că meseria este atât de variată și profesia atât de complexă, o zi obișnuită va depinde de mai mulți factori. Unul dintre factorii principali este tipul de proiect de date la care lucrați, care se poate schimba lunar sau trimestrial. Al doilea aspect este mai sistemic și depinde de tipul de organizație în care lucrați.

Dacă structura de acolo este ierarhică, experiența va fi diferită, dacă este bazată pe echipă, va fi diferită. Al treilea parametru care influențează o zi obișnuită este rolul tău în cadrul echipei. Indiferent dacă sunteți senior sau junior sau singurul cercetător de date al echipei, sau alte asemenea considerații de rol vă influențează ziua de lucru tipică.

Dar odată ce le-ai luat în medie pe toate, o zi obișnuită pentru un cercetător de date ar putea arăta ceva ca ceea ce urmează. Există trei funcții principale pe care un cercetător de date le îndeplinește într-o zi. Deloc surprinzător, majoritatea timpului este dedicat codificării. Timpul de echilibru se petrece în întâlniri și gândire, ambele împărțite aproximativ în mod egal.

Aici, gândirea se referă la reflecția personală și putem include gândirea de grup în timpul întâlnirii. Este esențial să rețineți că nu există niciun proiect pe care să îl puteți finaliza într-o singură zi. Așadar, în majoritatea zilelor, slujba dvs. va implica oricare dintre cele trei privind discuțiile continue, gândurile sau lucrul la proiectul existent de unde v-ați oprit în ziua precedentă. Să discutăm câteva dintre ele mai detaliat.

Cuprins

Codificarea

În calitate de cercetător de date, vă puteți aștepta să vă ia aproximativ 70% din timp. Poate chiar să depășească asta. Aceasta nu este o surpriză, având în vedere că sarcina principală a unui cercetător de date este să codifice. La fel ca orice alt om de știință, un cercetător de date are, de asemenea, diverse instrumente și limbi la dispoziție.

Unele dintre cele mai familiare sunt Python, SQL și Bash. Din acest motiv, codificarea este cea mai importantă dintre toate abilitățile pe care le puteți învăța dacă doriți să deveniți un cercetător de date. Statisticile și gândirea în afaceri completează celelalte abilități cheie, dar își reduc importanța pentru codificare. Aflați mai multe despre instrumentele disponibile pentru cercetătorii de date.

Cu toate acestea, codificare este un cuvânt vast și trebuie să încercăm să învățăm despre unele dintre sarcinile tipice care intră în codificare. Unele dintre ele sunt prezentate pe scurt în propozițiile următoare. Curățarea și formatarea datelor este probabil cea mai laborioasă și mai consumatoare de timp în domeniul codării.

Poate suna contra-intuitiv odată ce ți-l explicăm, dar încă se menține. Acest proces implică aducerea datelor într-un format recunoscut pe care îl puteți codifica în continuare în etapele următoare ale proiectului. Deși acest lucru poate fi explicat într-o singură linie, realizarea acestuia este unul dintre cele mai grele procese.

Odată ce completăm curățarea și formatarea datelor, următoarea sarcină implică de obicei prototiparea. Faceți prototipuri pentru a verifica datele cu diferite metode de analiză și metode de învățare automată.

Acest lucru vă ajută să alegeți metoda care se potrivește cel mai bine. Această etapă este adesea considerată o provocare de mulți oameni de știință ai datelor, dar ei vor fi primii care vor sublinia că este, de asemenea, una dintre cele mai interesante părți ale întregii secvențe. Asta pentru că datele brute devin valoroase cu acest pas, la fel ca extragerea metalului prețios dintr-un minereu.

Am menționat câteva dintre instrumente înainte și există un software de prototipare compatibil pentru fiecare dintre ele. Puteți combina și potrivi aici și să vedeți ce funcționează într-un anumit mediu și ce vi se pare cel mai confortabil. Rețineți că această etapă nu este pentru o concluzie finală a datelor. În schimb, acesta este punctul în care doriți să verificați ce funcționează și ce nu.

Următorii pași pot varia în funcție de scopul final al proiectului. De exemplu, ar putea fi pentru o întâlnire cu echipa sau seniori. În astfel de cazuri, ar trebui să vă transformați datele în reprezentare vizuală și să raportați constatările. Aceste lucruri vor trebui apoi să intre în prezentarea dvs.

Pe de altă parte, dacă este un raport pentru care colegii tăi s-ar putea folosi în viitor, atunci munca ta principală după prototipare ar trebui să fie cum să-l automatizezi și să-l faci accesibil pentru toată lumea din companie. În cele din urmă, și poate cel mai interesant, dacă sunteți responsabil cu învățarea automată sau analiza care va fi transformată într-un serviciu sau într-un produs, atunci sarcina dvs. va fi să vă dați seama de implementare. În acest moment, dezvoltatorii vă vor ajuta și ei.

Citiți: Salariul Data Scientist în India

Prin urmare, pentru a rezuma ceea ce am învățat până acum în codificare, primii pași implică curățarea și formatarea datelor, urmate de prototipare. Pașii următori pot include crearea de vizualizări de date, automatizarea proiectului, implementarea modelelor dvs. pentru a le utiliza ca produs sau serviciu, pentru a numi câteva.

Alte activități diverse ar fi putut fi incluse în această secțiune, dar ele apar din când în când și nu fac parte din procesul normal. Acestea implică remedierea erorilor, tutoriale despre pachete și biblioteci noi și întreținerea scripturilor scrise anterior. Există întotdeauna ceva de făcut atunci când ești un cercetător al datelor.

Întâlniri, prezentări, discuții și brainstorming cu grupul

Deoarece codarea ocupă aproximativ 70% din timp, a mai rămas un sold de 30%. În total, 15% din timpul total este petrecut întâlniri cu oamenii. Acestea pot lua diferite forme, cum ar fi întâlniri formale, sesiuni unu-la-unu, prezentări, discuții la răcitorul de apă sau chiar chat de grup.

Este extrem de important să iei legătura cu membrii echipei tale, deoarece de multe ori există doar un om de știință de date în întreaga echipă și ei nu sunt exact conștienți de ceea ce faci. Trebuie să le iei cu tine. Dar să nu facem să pară prea exigent, deoarece acest lucru vă permite să căutați o mai mare cooperare cu ei. Puteți obține mai multă asistență de la aceștia în proiectele dvs. de date mari și, prin urmare, aveți un impact mai mare.

Prin urmare, este important să dezvolți relații cu colegii tăi, chiar dacă s-ar putea să fii natural introvertit ca cercetător al datelor. Dar un cuvânt de precauție este necesar aici. În special la companiile mai mari, există un obicei de a avea întâlniri pe tot parcursul zilei. Aceasta implică să stai și să vorbești și să nu ai timp să faci coduri reale. La sfârșitul zilei, îți vei găsi munca îngrămăduită, fără nimeni care să te sprijine. Prin urmare, rămâneți în contact cu colegii tăi, dar nu exagera până la un punct în care devine contraproductiv.

Modul în care gestionați această problemă poate fi crucial pentru șansele dumneavoastră de progres în organizație. În primul rând, amintiți-vă că nu trebuie să petreceți mai mult de 15% din orele de lucru într-o întâlnire, pentru a lua o aproximare. Ținând cont de acest punct de referință, dezvoltați inițial o legătură cu colegii dvs. de echipă și cu managerul dvs. După aceea, așează-te cu ei și explică-le ce presupune munca ta, astfel încât trebuie să fii prezent doar la întâlnirile care sunt esențiale pentru munca ta.

Timp de gândire

Acest lucru poate părea absurd pentru unii, dar este absolut esențial să petreceți cel puțin 15% din zi gândind. Știința datelor nu este o joacă de copii și implică multă muncă grea. Prin urmare, dacă nu vă gândiți și nu vă planificați ziua, este aproape imposibil să continuați. Trebuie să descoperi cele mai bune modele statistice, trebuie să interpretezi corect datele, ai nevoie de cuvinte pentru a raporta constatările și, pentru toate acestea, ai nevoie de timp pentru a gândi singur.

În timpul gândirii, dacă nu vă puteți organiza gândurile, treceți la mâzgălire sau schiță. Ține o tablă albă lângă tine. Sau folosiți hârtie simplă, veche. Dar, ca om de știință a datelor, puteți utiliza întotdeauna un instrument de înaltă tehnologie, cum ar fi Miro, care este un instrument online de cartografiere a minții.

Codarea este cea mai mare parte a muncii tale, dar poate face minuni atunci când o poți combina cu schița și gândirea. Revenirea la gândire vă permite să vedeți imaginea de ansamblu, care se pierde adesea în minusculele detalii ale codificării. Deși pare o perioadă de nefuncționare, este adesea momentul cel mai critic pentru a crește productivitatea.

Activități diverse și concluzii

Înainte de a pleca pentru o zi, trebuie să-ți faci timp pentru a răspunde la toate e-mailurile. Este politicos să răspundeți în aceeași zi și ar trebui să faceți acest lucru. În timpul zilei, se așteaptă să fii ocupat, așa că fă-ți timp la sfârșitul zilei. Revizuiți ziua pe care tocmai ați terminat-o și planificați pentru a doua zi pentru a menține continuitatea și eficiența.

Pentru a rezuma, 70% din timpul de lucru pentru un cercetător de date este dedicat codificării. Sold 15% fiecare intră în întâlniri și gândire, sfârșitul zilei fiind păstrat pentru diverse activități. Este o carieră plină de satisfacții la care mulți aspiră.

Dacă sunteți curios să învățați știința datelor pentru a fi în fața progreselor tehnologice rapide, consultați programul Executive PG în știința datelor de la upGrad și IIIT-B și perfecționați-vă pentru viitor.

Pregătiți-vă pentru o carieră a viitorului

DIPLOMA PG DIN IIIT-B, 100+ ORE DE ÎNVĂȚARE LA CLASĂ, 400+ ORE DE ÎNVĂȚARE ONLINE ȘI SISTEMUL DE CARIERĂ 360 DE GRADE
Aflați mai multe