Un giorno nella vita di Data Scientist: cosa fanno?

Pubblicato: 2021-07-21

Una delle domande più frequenti è quella di descrivere “ un giorno nella vita di un data scientist”. Qui abbiamo cercato di dare una breve descrizione di come appare per prendere una decisione informata se questa scelta di carriera è quella giusta per te.

All'inizio, cerchiamo di essere molto chiari. È quasi impossibile caratterizzare un solo giorno nella vita di un data scientist. Poiché il lavoro è così vario e la professione così complessa, una giornata tipo dipenderà da molteplici fattori. Uno dei fattori principali è il tipo di progetto dati su cui stai lavorando, che può cambiare mensilmente o trimestralmente. La seconda considerazione è più sistemica e dipende dal tipo di organizzazione in cui lavori.

Se la struttura è gerarchica, l'esperienza sarà diversa, se è basata sul team, sarà diversa. Il terzo parametro che influenza una giornata tipo è il tuo ruolo all'interno della squadra. Che tu sia un senior o un junior o il singolo data scientist del team, o altre considerazioni di ruolo simili influenzano la tua tipica giornata lavorativa.

Ma una volta presi in considerazione tutti, una giornata normale per un data scientist potrebbe assomigliare a quella che segue. Ci sono tre funzioni principali che un data scientist svolge in un giorno. Non sorprende che la maggior parte del tempo sia dedicata alla codifica. Il tempo dell'equilibrio passa negli incontri e nel pensiero, entrambi approssimativamente divisi equamente.

Qui, il pensiero si riferisce alla riflessione personale e possiamo includere il pensiero di gruppo nel tempo delle riunioni. È fondamentale tenere a mente che non c'è nessun progetto da nessuna parte che puoi finire in un solo giorno. Quindi, nella maggior parte dei giorni, il tuo lavoro coinvolgerà uno dei tre che riguardano discussioni continue, pensieri o lavoro sul progetto esistente da dove ti eri fermato il giorno precedente. Discutiamone alcuni in modo leggermente più dettagliato.

Sommario

Codifica

Come data scientist, puoi aspettarti che ci vorrà circa il 70% del tuo tempo. Può anche superarlo. Non è una sorpresa considerando che il compito principale di un data scientist è codificare. Proprio come qualsiasi altro scienziato, anche un data scientist ha a disposizione vari strumenti e linguaggi.

Alcuni dei più familiari sono Python, SQL e Bash. Per questo motivo, la codifica è la più importante tra tutte le abilità che puoi imparare se vuoi diventare un data scientist. Statistica e Business Thinking completano le altre abilità chiave, ma diminuiscono di importanza per la programmazione. Ulteriori informazioni sugli strumenti di data scientist disponibili.

Tuttavia, codifica è una parola vasta e dobbiamo fare dei tentativi per conoscere alcuni dei compiti tipici della codifica. Alcuni di essi sono brevemente riportati nelle seguenti frasi. La pulizia e la formattazione dei dati è forse il lavoro più laborioso e dispendioso in termini di tempo all'interno della codifica.

Può sembrare controintuitivo una volta che te lo spieghiamo, ma vale comunque. Questo processo consiste nel portare i dati in un formato riconoscibile su cui è possibile codificare ulteriormente nelle fasi successive del progetto. Sebbene ciò possa essere spiegato in una riga, raggiungerlo è uno dei processi più ardui.

Una volta completate la pulizia e la formattazione dei dati, l'attività successiva prevede in genere la prototipazione. Esegui la prototipazione per controllare i dati rispetto a vari metodi di analisi e metodi di apprendimento automatico.

Questo ti aiuta a scegliere quale metodo si adatta meglio. Questa fase è spesso considerata impegnativa da molti data scientist, ma saranno i primi a sottolineare che è anche una delle parti più emozionanti dell'intera sequenza. Questo perché i dati grezzi diventano preziosi con questo passaggio, proprio come estrarre metallo prezioso da un minerale.

Abbiamo menzionato alcuni degli strumenti in precedenza e per ciascuno di essi esiste un software di prototipazione compatibile. Puoi mescolare e abbinare qui e vedere cosa funziona in un particolare ambiente e cosa ti sembra più a tuo agio. Ricorda che questa fase non è per un'inferenza finale dei dati. Invece, questo è il punto in cui vuoi controllare cosa funziona e cosa no.

I seguenti passaggi possono variare a seconda dell'obiettivo finale del progetto. Ad esempio, potrebbe essere per un incontro con il tuo team o con gli anziani. In questi casi, dovresti trasformare i tuoi dati in una rappresentazione visiva e riportare i risultati. Queste cose dovranno quindi entrare nella tua presentazione.

D'altra parte, se si tratta di un report che i tuoi colleghi potrebbero trovare utile in futuro, il tuo lavoro principale dopo la prototipazione dovrebbe essere come automatizzarlo e renderlo accessibile a tutti in azienda. Infine, e forse la cosa più interessante, se sei responsabile dell'apprendimento automatico o dell'analisi che verrà trasformata in un servizio o in un prodotto, il tuo compito sarà capire l'implementazione. A questo punto, anche gli sviluppatori ti assisteranno.

Leggi: Stipendio per data scientist in India

Pertanto, per riassumere ciò che abbiamo imparato finora nella codifica, i primi due passaggi riguardano la pulizia e la formattazione dei dati, seguite dalla prototipazione. I passaggi successivi possono includere la creazione di visualizzazioni di dati, l'automazione del progetto, l'implementazione di modelli da utilizzare come prodotto o servizio, solo per citarne alcuni.

Altre attività varie avrebbero potuto essere incluse in questa sezione, ma si verificano di tanto in tanto e non fanno parte del normale processo. Riguardano la correzione di bug, tutorial su nuovi pacchetti e librerie e la manutenzione di script scritti in precedenza. C'è sempre qualcosa da fare quando sei un data scientist.

Incontro, Presentazioni, Colloquio e Brainstorming con il Gruppo

Poiché la codifica richiede circa il 70% del tempo, è rimasto un saldo del 30%. A conti fatti, il 15% del tempo totale è dedicato all'incontro con le persone. Questi possono assumere forme diverse come riunioni formali, sessioni individuali, presentazioni, discussioni sul refrigeratore d'acqua o persino chat di gruppo.

Entrare in contatto con i membri del tuo team è di vitale importanza perché spesso c'è un solo scienziato di dati nell'intero team e non sono esattamente consapevoli di ciò che fai. Devi portarli con te. Ma non facciamolo sembrare troppo meticoloso perché così facendo puoi cercare una maggiore collaborazione con loro. Puoi ottenere maggiore assistenza da loro nei tuoi progetti di big data e quindi avere un impatto maggiore.

Pertanto, è importante sviluppare un rapporto con i tuoi colleghi, anche se potresti essere naturalmente introverso come scienziato dei dati. Ma qui è necessaria una parola di cautela. Soprattutto nelle aziende più grandi, c'è l'abitudine di tenere riunioni durante il giorno. Ciò comporta sedersi e parlare e non avere il tempo per eseguire la codifica vera e propria. Alla fine della giornata, scoprirai che il tuo lavoro si sta accumulando senza che nessuno ti supporti. Pertanto, rimani in contatto con i tuoi colleghi di lavoro ma non esagerare fino al punto in cui diventa controproducente.

Il modo in cui gestisci questo problema può essere cruciale per le tue possibilità di progressione nell'organizzazione. Prima di tutto, ricorda che non dovresti spendere più del 15% delle tue ore di lavoro in una riunione, per fare un'approssimazione. Tenendo presente questo benchmark, inizialmente sviluppa un legame con i tuoi compagni di squadra e il tuo manager. Dopodiché, siediti con loro e spiega loro cosa comporta il tuo lavoro in modo che tu debba essere presente solo negli incontri che sono essenziali per il tuo lavoro.

Tempo di pensiero

Questo potrebbe sembrare assurdo per alcuni, ma è assolutamente fondamentale dedicare almeno il 15% della giornata a pensare. La scienza dei dati non è un gioco da ragazzi e richiede molto lavoro duro. Pertanto, se non pensi e non pianifichi la tua giornata, è quasi impossibile procedere. Devi capire i migliori modelli statistici, devi interpretare correttamente i dati, hai bisogno delle parole per riportare i risultati e, per tutto questo, hai bisogno di tempo per pensare da solo.

Durante il pensiero, se ti ritrovi incapace di organizzare i tuoi pensieri, passa a scarabocchiare o disegnare. Tieni una lavagna vicino a te. Oppure usa carta normale e vecchia. Ma come data scientist, puoi sempre utilizzare uno strumento ad alta tecnologia come Miro, che è uno strumento di mappatura mentale online.

La programmazione è la parte principale del tuo lavoro, ma può fare miracoli quando puoi combinarla con lo schizzo e il pensiero. Fare un passo indietro per pensare ti consente di vedere il quadro più ampio, che spesso si perde nelle minuscole minuzie della codifica. Sebbene sembri un periodo di inattività, è spesso il momento più critico per aumentare la produttività.

Attività varie e conclusione

Prima di partire per la giornata, bisogna trovare il tempo per rispondere a tutte le e-mail. È solo educato rispondere lo stesso giorno e dovresti farlo. Durante il giorno, dovresti essere impegnato, quindi trova del tempo alla fine della giornata. Rivedi il giorno che hai appena finito e pianifica il giorno successivo per mantenere la continuità e l'efficienza.

Per riassumere, il 70% del tempo di lavoro di un data scientist è dedicato alla codifica. Saldo 15% ciascuno va nelle riunioni e nel pensiero, con la fine della giornata riservata alle varie attività. È una carriera gratificante a cui molti aspirano.

Se sei curioso di imparare la scienza dei dati per essere all'avanguardia nei rapidi progressi tecnologici, dai un'occhiata al programma Executive PG in Data Science di upGrad & IIIT-B e migliora le tue competenze per il futuro.

Prepararsi per una carriera del futuro

DIPLOMA PG DA IIIT-B, 100+ ORE DI APPRENDIMENTO IN AULA, 400+ ORE DI APPRENDIMENTO ONLINE E SUPPORTO ALLA CARRIERA A 360 GRADI
Per saperne di più