Ein Tag im Leben von Data Scientists: Was machen sie?
Veröffentlicht: 2021-07-21Eine der am häufigsten gestellten Fragen ist, „ einen Tag im Leben eines Datenwissenschaftlers“ zu beschreiben. Hier haben wir versucht, eine einfache Beschreibung zu geben, wie es aussieht, um eine fundierte Entscheidung zu treffen, ob diese Berufswahl die richtige für Sie ist.
Lassen Sie uns zu Beginn ganz klar sein. Es ist fast unmöglich, nur einen Tag im Leben eines Datenwissenschaftlers zu charakterisieren. Da der Job so abwechslungsreich und der Beruf so komplex ist, hängt ein typischer Tag von mehreren Faktoren ab. Einer der Hauptfaktoren ist die Art des Datenprojekts, an dem Sie arbeiten, das sich monatlich oder vierteljährlich ändern kann. Die zweite Überlegung ist eher systemischer Natur und hängt von der Art der Organisation ab, in der Sie arbeiten.
Wenn die Struktur dort hierarchisch ist, wird die Erfahrung anders sein, wenn sie teambasiert ist, wird sie anders sein. Der dritte Parameter, der einen typischen Tag beeinflusst, ist Ihre Rolle im Team. Ob Sie ein Senior oder ein Junior oder der einzelne Datenwissenschaftler des Teams sind, oder andere solche Rollenüberlegungen beeinflussen Ihren typischen Arbeitstag.
Aber wenn man sie alle zusammenfasst, könnte ein gewöhnlicher Tag für einen Datenwissenschaftler ungefähr so aussehen wie im Folgenden. Es gibt drei Hauptaufgaben, die ein Data Scientist an einem Tag erfüllt. Es überrascht nicht, dass die meiste Zeit in die Codierung gesteckt wird. Die Ausgleichszeit geht in Besprechungen und Nachdenken, beides ungefähr zu gleichen Teilen.
Denken bezieht sich hier auf persönliche Reflexion, und wir können Gruppendenken in die Besprechungszeit einbeziehen. Es ist wichtig zu bedenken, dass es kein Projekt gibt, das Sie an einem einzigen Tag abschließen können. An den meisten Tagen wird Ihre Arbeit also einen der drei Bereiche beinhalten, in denen es darum geht, Diskussionen, Gedanken oder die Arbeit an dem bestehenden Projekt dort fortzusetzen, wo Sie am Vortag aufgehört haben. Lassen Sie uns einige davon etwas detaillierter besprechen.
Inhaltsverzeichnis
Kodierung
Als Data Scientist können Sie damit rechnen, dass es etwa 70 % Ihrer Zeit in Anspruch nimmt. Das kann er sogar noch übertreffen. Das ist keine Überraschung, wenn man bedenkt, dass die Hauptaufgabe eines Datenwissenschaftlers das Programmieren ist. Wie jedem anderen Wissenschaftler stehen auch einem Data Scientist verschiedene Tools und Sprachen zur Verfügung.
Einige der bekannteren sind Python, SQL und Bash. Aus diesem Grund ist das Programmieren die wichtigste aller Fähigkeiten, die Sie lernen können, wenn Sie Data Scientist werden möchten. Statistik und Business Thinking runden die anderen Schlüsselkompetenzen ab, verlieren aber gegenüber dem Programmieren an Bedeutung. Erfahren Sie mehr über die verfügbaren Data Scientist-Tools.
Codieren ist jedoch ein weites Wort, und wir müssen versuchen, etwas über einige der typischen Aufgaben zu lernen, die mit dem Codieren einhergehen. Einige davon werden in den folgenden Sätzen kurz wiedergegeben. Die Datenbereinigung und -formatierung ist vielleicht die mühsamste und zeitaufwändigste Aufgabe beim Programmieren.
Es mag kontraintuitiv klingen, sobald wir es Ihnen erklärt haben, aber es gilt immer noch. Bei diesem Prozess werden die Daten in ein erkennbares Format gebracht, das Sie in den nächsten Phasen des Projekts weiter codieren können. Während dies in einer Zeile erklärt werden kann, ist es einer der mühsamsten Prozesse, dies zu erreichen.
Sobald wir die Datenbereinigung und -formatierung abgeschlossen haben, umfasst die nächste Aufgabe normalerweise das Prototyping. Sie führen Prototyping durch, um die Daten anhand verschiedener Analysemethoden und Methoden des maschinellen Lernens zu überprüfen.
Dies hilft Ihnen bei der Auswahl der am besten geeigneten Methode. Diese Phase wird von vielen Datenwissenschaftlern oft als herausfordernd angesehen, aber sie werden die ersten sein, die darauf hinweisen, dass es auch einer der aufregendsten Teile der gesamten Sequenz ist. Denn mit diesem Schritt werden Rohdaten wertvoll, ähnlich wie bei der Gewinnung von Edelmetall aus einem Erz.
Wir haben einige der Tools bereits erwähnt, und für jedes von ihnen gibt es kompatible Prototyping-Software. Sie können hier mischen und anpassen und sehen, was in einer bestimmten Umgebung funktioniert und was sich für Sie am angenehmsten anfühlt. Denken Sie daran, dass diese Phase nicht für eine endgültige Inferenz der Daten dient. Stattdessen ist dies der Punkt, an dem Sie überprüfen möchten, was funktioniert und was nicht.
Die folgenden Schritte können je nach Endziel des Projekts variieren. Zum Beispiel könnte es für ein Meeting mit Ihrem Team oder Ihren Vorgesetzten sein. In solchen Fällen müssten Sie Ihre Daten in eine visuelle Darstellung umwandeln und die Ergebnisse melden. Diese Dinge müssen dann in Ihre Präsentation einfließen.
Wenn es sich andererseits um einen Bericht handelt, für den Ihre Kollegen in Zukunft Verwendung finden könnten, dann sollte Ihre Hauptaufgabe nach dem Prototyping darin bestehen, ihn zu automatisieren und für alle im Unternehmen zugänglich zu machen. Schließlich, und vielleicht am spannendsten, wenn Sie für maschinelles Lernen oder Analysen verantwortlich sind, die in einen Service oder ein Produkt umgewandelt werden, dann besteht Ihre Aufgabe darin, die Implementierung herauszufinden. An dieser Stelle werden Ihnen auch Entwickler behilflich sein.
Lesen Sie: Data Scientist Gehalt in Indien
Um zusammenzufassen, was wir bisher beim Codieren gelernt haben, umfassen die ersten paar Schritte die Datenbereinigung und -formatierung, gefolgt vom Prototyping. Die nachfolgenden Schritte können das Erstellen von Datenvisualisierungen, die Automatisierung des Projekts, die Implementierung Ihrer Modelle zur Verwendung als Produkt oder Dienstleistung umfassen, um nur einige zu nennen.
Andere verschiedene Aktivitäten hätten in diesen Abschnitt aufgenommen werden können, aber sie tauchen von Zeit zu Zeit auf und sind nicht Teil des normalen Prozesses. Sie umfassen Fehlerbeseitigung, Tutorials zu neuen Paketen und Bibliotheken sowie die Wartung zuvor geschriebener Skripte. Als Data Scientist gibt es immer etwas zu tun.
Treffen, Präsentationen, Gespräche und Brainstorming mit der Gruppe
Da das Codieren etwa 70 % der Zeit in Anspruch nimmt, bleibt ein Rest von 30 % übrig. Insgesamt werden 15 % der Gesamtzeit damit verbracht, sich mit Menschen zu treffen. Diese können verschiedene Formen annehmen, wie z. B. formelle Meetings, Einzelsitzungen, Präsentationen, Diskussionen über die Wasserspender oder sogar Gruppenchats.
Der Kontakt zu Ihren Teammitgliedern ist von entscheidender Bedeutung, da es im gesamten Team oft nur einen Datenwissenschaftler gibt, der nicht genau weiß, was Sie tun. Sie müssen sie mitnehmen. Aber lassen Sie es uns nicht zu anspruchsvoll erscheinen, denn wenn Sie dies tun, können Sie eine stärkere Zusammenarbeit mit ihnen anstreben. Sie können von ihnen mehr Unterstützung für Ihre Big-Data-Projekte erhalten und somit eine größere Wirkung erzielen.
Daher ist es wichtig, dass Sie eine Beziehung zu Ihren Kollegen aufbauen, auch wenn Sie als Datenwissenschaftler von Natur aus introvertiert sind. Aber hier ist ein Wort der Vorsicht geboten. Gerade in größeren Unternehmen ist es üblich, über den Tag verteilt Meetings abzuhalten. Dazu gehört das Sitzen und Reden und keine Zeit zum eigentlichen Programmieren. Am Ende des Tages stapelt sich Ihre Arbeit, ohne dass jemand da ist, der Sie unterstützt. Bleiben Sie daher mit Ihren Kollegen in Kontakt, aber übertreiben Sie es nicht so weit, dass es kontraproduktiv wird.
Die Art und Weise, wie Sie mit diesem Problem umgehen, kann entscheidend für Ihre Aufstiegschancen in der Organisation sein. Denken Sie zunächst daran, dass Sie nicht mehr als 15 % Ihrer Arbeitszeit in einem Meeting verbringen sollten, um eine Annäherung zu nehmen. Unter Berücksichtigung dieses Maßstabs entwickeln Sie zunächst eine Bindung zu Ihren Teamkollegen und Ihrem Vorgesetzten. Setzen Sie sich danach mit ihnen zusammen und erklären Sie ihnen, was Ihre Arbeit beinhaltet, damit Sie nur bei den Besprechungen anwesend sein müssen, die für Ihre Arbeit unerlässlich sind.
Denkzeit
Das mag manchen absurd erscheinen, aber es ist absolut entscheidend, mindestens 15 % des Tages mit Denken zu verbringen. Data Science ist kein Kinderspiel und mit viel Fleißarbeit verbunden. Wenn Sie also nicht nachdenken und Ihren Tag planen, ist es fast unmöglich, fortzufahren. Sie müssen die besten statistischen Modelle herausfinden, Sie müssen die Daten richtig interpretieren, Sie brauchen die Worte, um die Ergebnisse zu berichten, und für all dies brauchen Sie Zeit, um allein zu denken.
Wenn Sie während des Denkens feststellen, dass Sie Ihre Gedanken nicht ordnen können, gehen Sie zum Kritzeln oder Skizzieren über. Halten Sie ein Whiteboard in Ihrer Nähe. Oder verwenden Sie normales, altes Papier. Aber als Datenwissenschaftler können Sie immer ein High-Tech-Tool wie Miro verwenden, ein Online-Mind-Mapping-Tool.
Programmieren ist der Hauptteil Ihrer Arbeit, aber es kann Wunder wirken, wenn Sie es mit Skizzieren und Denken kombinieren. Wenn Sie zurücktreten, um nachzudenken, können Sie das Gesamtbild sehen, das oft in den winzigen Details der Codierung verloren geht. Auch wenn es nach Ausfallzeit aussieht, ist es oft die kritischste Zeit, um die Produktivität zu steigern.
Verschiedene Aktivitäten und Fazit
Bevor man für den Tag aufbricht, muss man sich Zeit nehmen, um alle E-Mails zu beantworten. Es ist nur höflich, am selben Tag zu antworten, und Sie sollten dies auch tun. Tagsüber wird von Ihnen erwartet, dass Sie beschäftigt sind, also nehmen Sie sich am Ende des Tages Zeit. Überprüfen Sie den Tag, den Sie gerade beendet haben, und planen Sie für den nächsten Tag, um Kontinuität und Effizienz aufrechtzuerhalten.
Zusammenfassend gehen 70 % der Arbeitszeit eines Data Scientists in die Programmierung. Jeweils 15 % des Restbetrags fließen in Meetings und Nachdenken, wobei das Ende des Tages für verschiedene Aktivitäten reserviert wird. Es ist eine lohnende Karriere, die viele anstreben.
Wenn Sie neugierig darauf sind, Data Science zu lernen, um an der Spitze des rasanten technologischen Fortschritts zu stehen, sehen Sie sich das Executive PG Program in Data Science von upGrad & IIIT-B an und bilden Sie sich für die Zukunft weiter.