Un día en la vida del científico de datos: ¿Qué hacen?

Publicado: 2021-07-21

Una de las preguntas más frecuentes es describir “ un día en la vida de un científico de datos”. Aquí hemos tratado de dar una descripción ligera de cómo se ve para tomar una decisión informada sobre si esta elección de carrera es la adecuada para usted.

De entrada, seamos muy claros. Es casi imposible caracterizar solo un día en la vida de un científico de datos. Debido a que el trabajo es tan variado y la profesión tan compleja, un día típico dependerá de múltiples factores. Uno de los factores principales es el tipo de proyecto de datos en el que está trabajando, que puede cambiar mensual o trimestralmente. La segunda consideración es más sistémica y depende del tipo de organización en la que trabaje.

Si la estructura allí es jerárquica, la experiencia será diferente, si es en equipo, será diferente. El tercer parámetro que influye en un día típico es su rol dentro del equipo. Si usted es un senior o junior o el único científico de datos del equipo, u otras consideraciones de roles similares influyen en su día laboral típico.

Pero una vez que toma la media de todos ellos, un día normal para un científico de datos podría parecerse a lo que sigue. Hay tres funciones principales que un científico de datos realiza en un día. Como era de esperar, la mayor parte del tiempo se dedica a la codificación. El tiempo restante se dedica a las reuniones y al pensamiento, ambos divididos aproximadamente por igual.

Aquí, el pensamiento se refiere a la reflexión personal, y podemos incluir el pensamiento grupal en el tiempo de reunión. Es crucial tener en cuenta que no hay ningún proyecto en ningún lugar que puedas terminar en un solo día. Por lo tanto, la mayoría de los días, su trabajo implicará cualquiera de los tres relacionados con continuar las discusiones, los pensamientos o el trabajo en el proyecto existente desde donde se detuvo el día anterior. Analicemos algunos de ellos con un poco más de detalle.

Tabla de contenido

Codificación

Como científico de datos, puede esperar que le tome alrededor del 70% de su tiempo. Incluso puede superar eso. Eso no es una sorpresa considerando que el trabajo principal de un científico de datos es codificar. Al igual que cualquier otro científico, un científico de datos también tiene varias herramientas y lenguajes a su disposición.

Algunos de los más familiares son Python, SQL y Bash. Por esta razón, la codificación es la más importante de todas las habilidades que puedes aprender si quieres convertirte en un científico de datos. Las estadísticas y el pensamiento empresarial completan las otras habilidades clave, pero pierden importancia para la codificación. Obtenga más información sobre las herramientas de científico de datos disponibles.

Sin embargo, la codificación es una palabra muy amplia, y debemos intentar aprender sobre algunas de las tareas típicas que intervienen en la codificación. Algunos de ellos se dan brevemente en las siguientes oraciones. La limpieza y el formateo de datos es quizás el trabajo más laborioso y lento dentro de la codificación.

Puede sonar contradictorio una vez que te lo explicamos, pero sigue siendo válido. Este proceso implica llevar los datos a un formato reconocible que puede codificar más en las próximas etapas del proyecto. Si bien esto se puede explicar en una sola línea, lograrlo es uno de los procesos más arduos.

Una vez que completamos la limpieza y el formateo de datos, la siguiente tarea generalmente implica la creación de prototipos. Haces prototipos para comparar los datos con varios métodos de análisis y métodos de aprendizaje automático.

Esto le ayuda a elegir qué método se adapta mejor. Muchos científicos de datos a menudo consideran que esta etapa es un desafío, pero serán los primeros en señalar que también es una de las partes más emocionantes de toda la secuencia. Esto se debe a que los datos sin procesar se vuelven valiosos con este paso, al igual que extraer un metal precioso de un mineral.

Mencionamos algunas de las herramientas antes, y existe un software de creación de prototipos compatible para cada una de ellas. Puede mezclar y combinar aquí y ver qué funciona en un entorno particular y qué se siente más cómodo para usted. Recuerde que esta etapa no es para una inferencia final de los datos. En cambio, este es el punto en el que desea verificar qué funciona y qué no.

Los siguientes pasos pueden variar dependiendo del objetivo final del proyecto. Por ejemplo, podría ser para una reunión con su equipo o personas mayores. En tales casos, necesitaría convertir sus datos en una representación visual e informar los hallazgos. Estas cosas deberán incluirse en su presentación.

Por otro lado, si se trata de un informe que sus colegas podrían encontrar útil en el futuro, entonces su trabajo principal después de la creación de prototipos debería ser cómo automatizarlo y hacerlo accesible para todos en la empresa. Finalmente, y quizás lo más emocionante, si está a cargo del aprendizaje automático o el análisis que se convertirá en un servicio o producto, entonces su trabajo será descubrir la implementación. En este punto, los desarrolladores también te ayudarán.

Leer: Salario del científico de datos en India

Por lo tanto, para resumir lo que hemos aprendido hasta ahora en la codificación, los primeros pasos implican la limpieza y el formateo de datos, seguidos por la creación de prototipos. Los pasos posteriores pueden incluir la creación de visualizaciones de datos, la automatización del proyecto, la implementación de sus modelos para usarlos como un producto o servicio, por nombrar algunos.

Se podrían haber incluido otras actividades misceláneas en esta sección, pero surgen de vez en cuando y no forman parte del proceso normal. Implican la corrección de errores, tutoriales sobre nuevos paquetes y bibliotecas, y el mantenimiento de scripts escritos previamente. Siempre hay algo que hacer cuando eres un científico de datos.

Reunión, Presentaciones, Conversación y Lluvia de Ideas con el Grupo

Dado que la codificación ocupa aproximadamente el 70 % del tiempo, queda un 30 % restante. En el balance, el 15% del tiempo total se dedica a reunirse con personas. Estos pueden tomar diferentes formas, como reuniones formales, sesiones individuales, presentaciones, discusiones sobre el enfriador de agua o incluso chat grupal.

Ponerse en contacto con los miembros de su equipo es de vital importancia porque, a menudo, solo hay un científico de datos en todo el equipo y no saben exactamente lo que hace. Debes llevarlos contigo. Pero no lo hagamos parecer demasiado fastidioso porque hacerlo le permite buscar una mayor cooperación con ellos. Puede obtener más asistencia de ellos en sus proyectos de big data y, por lo tanto, tener un mayor impacto.

Por lo tanto, es importante que desarrolle una buena relación con sus colegas, incluso si es naturalmente introvertido como científico de datos. Pero una palabra de precaución es necesaria aquí. Especialmente en las empresas más grandes, existe la costumbre de tener reuniones durante todo el día. Esto implica sentarse y hablar y no tener tiempo para hacer la codificación real. Al final del día, encontrará que su trabajo se acumula sin nadie allí para apoyarlo. Por lo tanto, permanezca en contacto con sus compañeros de trabajo, pero no se exceda hasta el punto en que se vuelva contraproducente.

La forma en que maneja este problema puede ser crucial para sus posibilidades de progreso en la organización. En primer lugar, recuerda que no se supone que pases más del 15% de tu jornada laboral en una reunión, por hacer una aproximación. Teniendo en cuenta este punto de referencia, desarrolle inicialmente un vínculo con sus compañeros de equipo y su gerente. Después de eso, siéntese con ellos y explíqueles en qué consiste su trabajo para que solo necesite estar presente en las reuniones que son esenciales para su trabajo.

Tiempo de pensar

Esto puede parecer absurdo para algunos, pero es absolutamente crítico pasar al menos el 15% del día pensando. La ciencia de datos no es un juego de niños e implica mucho trabajo duro. Por lo tanto, si no piensa y planifica su día, es casi imposible continuar. Necesita descubrir los mejores modelos estadísticos, necesita interpretar correctamente los datos, necesita las palabras para informar los hallazgos y, para todo esto, necesita tiempo para pensar solo.

Mientras piensa, si no puede organizar sus pensamientos, pase a hacer garabatos o bocetos. Mantenga una pizarra cerca de usted. O use papel normal y viejo. Pero como científico de datos, siempre puede usar una herramienta de alta tecnología como Miro, que es una herramienta de mapas mentales en línea.

La codificación es la parte principal de su trabajo, pero puede hacer maravillas cuando puede combinarla con dibujar y pensar. Retroceder para pensar le permite ver el panorama general, que a menudo se pierde en las pequeñas minucias de la codificación. Si bien parece un tiempo de inactividad, a menudo es el momento más crítico para aumentar la productividad.

Actividades Misceláneas y Conclusión

Antes de comenzar el día, uno debe hacer tiempo para responder todos los correos electrónicos. Es de buena educación responder el mismo día y debe hacerlo. Durante el día, se espera que estés ocupado, así que haz tiempo al final del día. Revisa el día que acabas de terminar y planifica el día siguiente para mantener la continuidad y la eficiencia.

En resumen, el 70 % del tiempo de trabajo de un científico de datos se dedica a la codificación. El 15% restante se destina a reuniones y reflexiones, y el final del día se reserva para diversas actividades. Es una carrera gratificante a la que muchos aspiran.

Si tiene curiosidad por aprender ciencia de datos para estar al frente de los avances tecnológicos vertiginosos, consulte el Programa PG ejecutivo en ciencia de datos de upGrad & IIIT-B y mejore sus habilidades para el futuro.

Prepárate para una carrera del futuro

DIPLOMA PG DE IIIT-B, MÁS DE 100 HORAS DE APRENDIZAJE EN EL AULA, MÁS DE 400 HORAS DE APRENDIZAJE EN LÍNEA Y APOYO PROFESIONAL DE 360 GRADOS
Aprende más