Um dia na vida do cientista de dados: o que eles fazem?
Publicados: 2021-07-21Uma das perguntas mais frequentes é descrever “ um dia na vida de um cientista de dados”. Aqui tentamos dar uma descrição clara de como é tomar uma decisão informada se esta escolha de carreira é a certa para você.
Para começar, sejamos muito claros. É quase impossível caracterizar apenas um dia na vida de um cientista de dados. Como o trabalho é tão variado e a profissão tão complexa, um dia típico dependerá de vários fatores. Um dos principais fatores é o tipo de projeto de dados em que você está trabalhando, que pode mudar mensalmente ou trimestralmente. A segunda consideração é mais sistêmica e depende do tipo de organização em que você trabalha.
Se a estrutura lá for hierárquica, a experiência será diferente, se for em equipe, será diferente. O terceiro parâmetro que influencia um dia típico é o seu papel dentro da equipe. Se você é um sênior ou um júnior ou o único cientista de dados da equipe, ou outras considerações de função influenciam seu dia de trabalho típico.
Mas uma vez que você faça uma média de todos eles, um dia comum para um cientista de dados pode parecer algo como o que se segue. Existem três funções principais que um cientista de dados realiza em um dia. Sem surpresa, a maior parte do tempo vai para a codificação. O tempo de equilíbrio é gasto em reuniões e pensamentos, ambos divididos aproximadamente igualmente.
Aqui, o pensamento refere-se à reflexão pessoal, e podemos incluir o pensamento de grupo na hora do encontro. É crucial ter em mente que não há nenhum projeto em qualquer lugar que você possa terminar em um único dia. Assim, na maioria dos dias, seu trabalho envolverá qualquer um dos três sobre discussões contínuas, pensamentos ou trabalho no projeto existente de onde você parou no dia anterior. Vamos discutir alguns deles com um pouco mais de detalhes.
Índice
Codificação
Como cientista de dados, você pode esperar que isso leve cerca de 70% do seu tempo. Pode até ultrapassar isso. Isso não é uma surpresa, considerando que o principal trabalho de um cientista de dados é codificar. Assim como qualquer outro cientista, um cientista de dados também tem várias ferramentas e linguagens à sua disposição.
Alguns dos mais familiares são Python, SQL e Bash. Por esse motivo, a codificação é a mais importante de todas as habilidades que você pode aprender se quiser se tornar um cientista de dados. Estatística e Business Thinking completam as outras habilidades-chave, mas diminuem em importância para a codificação. Saiba mais sobre as ferramentas de cientista de dados disponíveis.
No entanto, codificação é uma palavra vasta, e devemos tentar aprender sobre algumas das tarefas típicas que envolvem a codificação. Alguns deles são brevemente apresentados nas frases a seguir. A limpeza e formatação de dados é talvez o trabalho mais trabalhoso e demorado dentro da codificação.
Pode parecer contra-intuitivo uma vez que explicamos para você, mas ainda é válido. Esse processo envolve trazer os dados para um formato reconhecível que você pode codificar ainda mais nos próximos estágios do projeto. Embora isso possa ser explicado em uma linha, alcançá-lo é um dos processos mais árduos.
Depois de concluir a limpeza e a formatação dos dados, a próxima tarefa geralmente envolve a prototipagem. Você faz prototipagem para verificar os dados em relação a vários métodos de análise e métodos de aprendizado de máquina.
Isso ajuda você a escolher qual método se encaixa melhor. Esse estágio é frequentemente considerado desafiador por muitos cientistas de dados, mas eles serão os primeiros a apontar que também é uma das partes mais emocionantes de toda a sequência. Isso porque os dados brutos se tornam valiosos com essa etapa, assim como extrair metal precioso de um minério.
Mencionamos algumas das ferramentas antes, e há software de prototipagem compatível para cada uma delas. Você pode misturar e combinar aqui e ver o que funciona em um ambiente específico e o que é mais confortável para você. Lembre-se que esta etapa não é para uma inferência final dos dados. Em vez disso, este é o ponto em que você deseja verificar o que funciona e o que não funciona.
As etapas a seguir podem variar dependendo do objetivo final do projeto. Por exemplo, pode ser para uma reunião com sua equipe ou idosos. Nesses casos, você precisaria transformar seus dados em representação visual e relatar as descobertas. Essas coisas precisarão entrar em sua apresentação.
Por outro lado, se for um relatório para o qual seus colegas possam encontrar uso no futuro, seu trabalho principal após a prototipagem deve ser como automatizá-lo e torná-lo acessível para todos na empresa. Finalmente, e talvez o mais empolgante, se você for responsável pelo aprendizado de máquina ou análise que será transformado em um serviço ou produto, seu trabalho será descobrir a implementação. Neste ponto, os desenvolvedores também irão ajudá-lo.
Leia: Salário de Cientista de Dados na Índia
Portanto, para resumir o que aprendemos até agora em codificação, as primeiras etapas envolvem limpeza e formatação de dados, seguidas de prototipagem. As etapas subsequentes podem incluir a criação de visualizações de dados, automatização do projeto, implementação de seus modelos para uso como produto ou serviço, para citar alguns.
Outras atividades diversas poderiam ter sido incluídas nesta seção, mas surgem de tempos em tempos e não fazem parte do processo normal. Eles envolvem correção de bugs, tutoriais sobre novos pacotes e bibliotecas e manutenção de scripts escritos anteriormente. Sempre há algo a fazer quando você é um cientista de dados.
Reunião, Apresentações, Conversas e Brainstorming com o Grupo
Como a codificação ocupa cerca de 70% do tempo, resta um saldo de 30%. No saldo, 15% do tempo total é gasto em reuniões com pessoas. Estes podem assumir diferentes formas, como reuniões formais, sessões individuais, apresentações, discussões sobre o bebedouro ou mesmo bate-papo em grupo.
Entrar em contato com os membros de sua equipe é de vital importância porque geralmente há apenas um cientista de dados em toda a equipe e eles não estão exatamente cientes do que você faz. Você deve levá-los junto com você. Mas não vamos fazer com que pareça muito fastidioso, porque isso permite que você busque uma maior cooperação com eles. Você pode obter mais assistência deles em seus projetos de big data e, portanto, ter um impacto maior.
Portanto, é importante que você desenvolva um relacionamento com seus colegas, mesmo que você seja naturalmente introvertido como cientista de dados. Mas uma palavra de cautela é necessária aqui. Especialmente em empresas maiores, há o hábito de fazer reuniões ao longo do dia. Isso envolve sentar e conversar e não ter tempo para fazer a codificação real. No final do dia, você encontrará seu trabalho se acumulando sem ninguém para apoiá-lo. Portanto, permaneça em contato com seus colegas de trabalho, mas não exagere a ponto de se tornar contraproducente.
A maneira como você gerencia essa questão pode ser crucial para suas chances de progressão na organização. Antes de mais nada, lembre-se de que você não deve passar mais de 15% do seu horário de trabalho em uma reunião, para fazer uma aproximação. Mantendo esse ponto de referência em mente, inicialmente desenvolva um vínculo com seus colegas de equipe e seu gerente. Depois disso, sente-se com eles e explique o que seu trabalho envolve para que você precise estar presente apenas nas reuniões essenciais ao seu trabalho.
Tempo de Pensamento
Isso pode parecer absurdo para alguns, mas é absolutamente crítico passar pelo menos 15% do dia pensando. A ciência de dados não é brincadeira de criança e envolve muito trabalho duro. Portanto, se você não pensar e planejar o seu dia, é quase impossível prosseguir. Você precisa descobrir os melhores modelos estatísticos, precisa interpretar corretamente os dados, precisa das palavras para relatar as descobertas e, para tudo isso, precisa de tempo para pensar sozinho.
Durante o pensamento, se você não conseguir organizar seus pensamentos, passe a rabiscar ou esboçar. Mantenha um quadro branco perto de você. Ou use papel comum e velho. Mas, como cientista de dados, você sempre pode usar uma ferramenta de alta tecnologia como o Miro, que é uma ferramenta de mapeamento mental online.
A codificação é a parte principal do seu trabalho, mas pode fazer maravilhas quando você pode combiná-la com esboços e pensamento. Retroceder para pensar permite que você veja a imagem maior, que muitas vezes se perde nas pequenas minúcias da codificação. Embora pareça um tempo de inatividade, geralmente é o momento mais crítico para aumentar a produtividade.
Atividades Diversas e Conclusão
Antes de sair para o dia, é preciso ter tempo para responder a todos os e-mails. É apenas educado responder no mesmo dia e você deve fazê-lo. Durante o dia, espera-se que você esteja ocupado, então reserve um tempo no final do dia. Revise o dia que acabou de terminar e planeje o dia seguinte para manter a continuidade e a eficiência.
Para resumir, 70% do tempo de trabalho de um cientista de dados é dedicado à codificação. Saldo 15% cada um vai para reuniões e reflexão, com o final do dia reservado para diversas atividades. É uma carreira gratificante à qual muitos aspiram.
Se você está curioso sobre aprender ciência de dados para estar na frente dos avanços tecnológicos em ritmo acelerado, confira o Programa PG Executivo em Ciência de Dados do upGrad & IIIT-B e se qualifique para o futuro.