Une journée dans la vie d'un data scientist : que font-ils ?
Publié: 2021-07-21L'une des questions les plus fréquemment posées est de décrire " une journée dans la vie d'un data scientist". Ici, nous avons essayé de donner une brève description de ce à quoi il ressemble pour prendre une décision éclairée si ce choix de carrière est le bon pour vous.
D'entrée de jeu, soyons très clairs. Il est quasiment impossible de caractériser une seule journée dans la vie d'un data scientist. Parce que le travail est si varié et le métier si complexe, une journée type dépendra de multiples facteurs. L'un des principaux facteurs est le type de projet de données sur lequel vous travaillez, qui peut changer mensuellement ou trimestriellement. La deuxième considération est plus systémique et dépend du type d'organisation dans laquelle vous travaillez.
Si la structure y est hiérarchique, l'expérience sera différente, si elle est en équipe, elle sera différente. Le troisième paramètre qui influence une journée type est votre rôle au sein de l'équipe. Que vous soyez un senior ou un junior ou le seul data scientist de l'équipe, ou d'autres considérations de ce type influencent votre journée de travail typique.
Mais une fois que vous avez pris une moyenne de tous, une journée ordinaire pour un scientifique des données pourrait ressembler à ce qui suit. Il y a trois fonctions principales qu'un data scientist accomplit en une journée. Sans surprise, la majorité du temps est consacrée au codage. Le reste du temps est consacré aux réunions et à la réflexion, les deux étant à peu près également répartis.
Ici, la pensée fait référence à la réflexion personnelle, et nous pouvons inclure la pensée de groupe dans le temps de réunion. Il est crucial de garder à l'esprit qu'il n'existe aucun projet que vous puissiez terminer en une seule journée. Ainsi, la plupart des jours, votre travail impliquera l'un ou l'autre des trois concernant la poursuite des discussions, des réflexions ou du travail sur le projet existant à partir duquel vous vous étiez arrêté la veille. Laissez-nous discuter de certains d'entre eux un peu plus en détail.
Table des matières
Codage
En tant que data scientist, vous pouvez vous attendre à ce que cela prenne environ 70 % de votre temps. Il peut même dépasser cela. Ce n'est pas une surprise étant donné que le travail principal d'un data scientist est de coder. Comme tout autre scientifique, un data scientist dispose également de divers outils et langages.
Certains des plus connus sont Python, SQL et Bash. Pour cette raison, le codage est la plus importante de toutes les compétences que vous pouvez acquérir si vous souhaitez devenir un data scientist. Les statistiques et la pensée commerciale complètent les autres compétences clés, mais leur importance diminue par rapport au codage. En savoir plus sur les outils de science des données disponibles.
Cependant, le codage est un vaste mot, et nous devons essayer d'en savoir plus sur certaines des tâches typiques qui entrent dans le codage. Certains d'entre eux sont brièvement donnés dans les phrases suivantes. Le nettoyage et le formatage des données est peut-être le travail le plus laborieux et le plus long du codage.
Cela peut sembler contre-intuitif une fois que nous vous l'avons expliqué, mais cela tient toujours. Ce processus implique de mettre les données dans un format reconnaissable que vous pouvez coder plus loin dans les prochaines étapes du projet. Bien que cela puisse s'expliquer en une ligne, y parvenir est l'un des processus les plus ardus.
Une fois que nous avons terminé le nettoyage et le formatage des données, la tâche suivante implique généralement le prototypage. Vous effectuez un prototypage pour vérifier les données par rapport à diverses méthodes d'analyse et méthodes d'apprentissage automatique.
Cela vous aide à choisir la méthode qui vous convient le mieux. Cette étape est souvent considérée comme difficile par de nombreux scientifiques des données, mais ils seront les premiers à souligner qu'il s'agit également de l'une des parties les plus excitantes de toute la séquence. En effet, les données brutes deviennent précieuses avec cette étape, un peu comme l'extraction de métal précieux d'un minerai.
Nous avons déjà mentionné certains des outils, et il existe un logiciel de prototypage compatible pour chacun d'eux. Vous pouvez mélanger et assortir ici et voir ce qui fonctionne dans un environnement particulier et ce qui vous semble le plus confortable. N'oubliez pas que cette étape n'est pas destinée à une inférence finale des données. Au lieu de cela, c'est le point où vous voulez vérifier ce qui fonctionne et ce qui ne fonctionne pas.
Les étapes suivantes peuvent varier en fonction de l'objectif final du projet. Par exemple, cela pourrait être pour une réunion avec votre équipe ou des seniors. Dans de tels cas, vous devrez transformer vos données en représentation visuelle et rapporter les résultats. Ces choses devront ensuite entrer dans votre présentation.
D'un autre côté, s'il s'agit d'un rapport que vos collègues pourraient utiliser à l'avenir, votre tâche principale après le prototypage devrait être de savoir comment l'automatiser et le rendre accessible à tous dans l'entreprise. Enfin, et peut-être le plus excitant, si vous êtes en charge de l'apprentissage automatique ou de l'analyse qui seront transformés en un service ou un produit, votre travail consistera à comprendre la mise en œuvre. À ce stade, les développeurs vous aideront également.
Lire : Salaire d'un Data Scientist en Inde
Par conséquent, pour résumer ce que nous avons appris jusqu'à présent en matière de codage, les deux premières étapes impliquent le nettoyage et le formatage des données, suivis du prototypage. Les étapes suivantes peuvent inclure la création de visualisations de données, l'automatisation du projet, la mise en œuvre de vos modèles à utiliser en tant que produit ou service, pour n'en nommer que quelques-unes.
D'autres activités diverses auraient pu être incluses dans cette section, mais elles surgissent de temps à autre et ne font pas partie du processus normal. Ils impliquent la correction de bogues, des tutoriels sur les nouveaux packages et bibliothèques et la maintenance des scripts précédemment écrits. Il y a toujours quelque chose à faire quand on est data scientist.
Réunion, présentations, échanges et brainstorming avec le groupe
Étant donné que le codage prend environ 70 % du temps, il reste un solde de 30 %. Dans le reste, 15% du temps total est consacré à rencontrer des gens. Celles-ci peuvent prendre différentes formes telles que des réunions formelles, des séances individuelles, des présentations, des discussions autour de la fontaine à eau ou même des discussions de groupe.
Entrer en contact avec les membres de votre équipe est d'une importance vitale car il n'y a souvent qu'un seul data scientist dans toute l'équipe, et ils ne sont pas exactement conscients de ce que vous faites. Vous devez les emmener avec vous. Mais ne le faisons pas paraître trop fastidieux, car cela vous permet de rechercher une plus grande coopération avec eux. Vous pouvez obtenir plus d'assistance de leur part dans vos projets de big data et donc avoir un plus grand impact.
Par conséquent, il est important que vous développiez des relations avec vos collègues, même si vous êtes naturellement introverti en tant que data scientist. Mais une mise en garde s'impose ici. Surtout dans les grandes entreprises, il y a une habitude d'avoir des réunions tout au long de la journée. Cela implique de s'asseoir et de parler et de ne pas avoir le temps de faire du codage réel. À la fin de la journée, vous trouverez votre travail empilé sans personne pour vous soutenir. Par conséquent, restez en contact avec vos collègues de travail mais n'en faites pas trop au point que cela devienne contre-productif.
La façon dont vous gérez ce problème peut être cruciale pour vos chances de progression dans l'organisation. Tout d'abord, rappelez-vous que vous n'êtes pas censé passer plus de 15% de vos heures de travail en réunion, pour prendre une approximation. En gardant cette référence à l'esprit, développez d'abord un lien avec vos coéquipiers et votre manager. Après cela, asseyez-vous avec eux et expliquez-leur ce que votre travail implique afin que vous n'ayez besoin d'être présent que dans les réunions qui sont essentielles à votre travail.
Temps de réflexion
Cela peut sembler absurde pour certains, mais il est absolument essentiel de passer au moins 15 % de la journée à réfléchir. La science des données n'est pas un jeu d'enfant et implique beaucoup de travail difficile. Par conséquent, si vous ne réfléchissez pas et ne planifiez pas votre journée, il est presque impossible de continuer. Vous devez trouver les meilleurs modèles statistiques, vous devez interpréter correctement les données, vous avez besoin de mots pour rapporter les résultats, et pour tout cela, vous avez besoin de temps pour réfléchir seul.
Pendant la réflexion, si vous vous trouvez incapable d'organiser vos pensées, passez au griffonnage ou au croquis. Gardez un tableau blanc près de vous. Ou utilisez du vieux papier ordinaire. Mais en tant que data scientist, vous pouvez toujours utiliser un outil de haute technologie tel que Miro, qui est un outil de cartographie mentale en ligne.
Le codage est la majeure partie de votre travail, mais il peut faire des merveilles lorsque vous pouvez le combiner avec des croquis et de la réflexion. Prendre du recul pour réfléchir vous permet d'avoir une vue d'ensemble, qui se perd souvent dans les minuscules détails du codage. Bien que cela ressemble à un temps d'arrêt, c'est souvent le moment le plus critique pour augmenter la productivité.
Activités diverses et conclusion
Avant de partir pour la journée, il faut prendre le temps de répondre à tous les mails. Il est seulement poli de répondre le jour même et vous devriez le faire. Pendant la journée, on s'attend à ce que vous soyez occupé, alors prenez du temps en fin de journée. Passez en revue la journée que vous venez de terminer et planifiez le lendemain pour maintenir la continuité et l'efficacité.
Pour résumer, 70% du temps de travail d'un data scientist est consacré au codage. Le solde de 15 % est consacré aux réunions et à la réflexion, la fin de la journée étant réservée à diverses activités. C'est une carrière enrichissante à laquelle beaucoup aspirent.
Si vous êtes curieux d'apprendre la science des données pour être à l'avant-garde des avancées technologiques rapides, consultez le programme exécutif PG upGrad & IIIT-B en science des données et améliorez vos compétences pour l'avenir.