Один день из жизни Data Scientist: чем они занимаются?

Опубликовано: 2021-07-21

Один из наиболее часто задаваемых вопросов — описать « один день из жизни специалиста по данным». Здесь мы попытались дать краткое описание того, как выглядит принятие обоснованного решения о том, подходит ли вам этот выбор карьеры.

Прежде всего, давайте будем предельно ясны. Почти невозможно охарактеризовать один день из жизни специалиста по данным. Поскольку работа настолько разнообразна, а профессия настолько сложна, обычный день будет зависеть от множества факторов. Одним из основных факторов является тип проекта данных, над которым вы работаете, который может меняться ежемесячно или ежеквартально. Второе соображение более системное и зависит от того, в какой организации вы работаете.

Если структура там иерархическая, опыт будет другой, если командный, то другой. Третий параметр, влияющий на типичный день, — это ваша роль в команде. Независимо от того, являетесь ли вы старшим или младшим, или единственным специалистом по данным в команде, или другие подобные ролевые соображения влияют на ваш типичный рабочий день.

Но если вы возьмете среднее значение из них всех, обычный день специалиста по данным может выглядеть примерно так, как показано ниже. За день специалист по данным выполняет три основные функции. Неудивительно, что большая часть времени уходит на кодирование. Баланс времени уходит на встречи и размышления, которые примерно делятся поровну.

Здесь мышление относится к личным размышлениям, и мы можем включить групповое мышление во время встречи. Важно помнить, что нет ни одного проекта, который вы могли бы закончить за один день. Таким образом, в большинстве дней ваша работа будет включать в себя одно из трех, касающихся продолжения обсуждений, мыслей или работы над существующим проектом, на котором вы остановились в предыдущий день. Остановимся на некоторых из них чуть подробнее.

Оглавление

Кодирование

Как специалист по данным, вы можете ожидать, что это займет около 70% вашего времени. Он может даже превышать это. Это неудивительно, учитывая, что основная работа специалиста по данным — кодирование. Как и любой другой ученый, специалист по данным также имеет в своем распоряжении различные инструменты и языки.

Некоторые из наиболее знакомых — Python, SQL и Bash. По этой причине кодирование является самым важным из всех навыков, которые вы можете освоить, если хотите стать специалистом по данным. Статистика и бизнес-мышление дополняют другие ключевые навыки, но их важность для программирования снижается. Узнайте больше о доступных инструментах для специалистов по данным.

Тем не менее, кодирование — это обширное слово, и мы должны попытаться узнать о некоторых типичных задачах, связанных с кодированием. Некоторые из них кратко приведены в следующих предложениях. Очистка и форматирование данных — пожалуй, самая трудоемкая и трудоемкая работа в кодировании.

Это может показаться нелогичным, как только мы объясним вам это, но это все еще верно. Этот процесс включает в себя приведение данных в распознаваемый формат, который вы можете кодировать на следующих этапах проекта. Хотя это можно объяснить одной строкой, достижение этого является одним из самых трудоемких процессов.

Как только мы завершаем очистку и форматирование данных, следующая задача обычно связана с прототипированием. Вы делаете прототип, чтобы проверить данные на соответствие различным методам аналитики и методам машинного обучения.

Это поможет вам выбрать наиболее подходящий метод. Этот этап часто считается сложным для многих специалистов по данным, но они будут первыми, кто укажет, что это также одна из самых захватывающих частей всей последовательности. Это связано с тем, что на этом этапе необработанные данные становятся ценными, подобно извлечению драгоценного металла из руды.

Мы упоминали некоторые инструменты ранее, и для каждого из них существует совместимое программное обеспечение для прототипирования. Вы можете смешивать и сочетать здесь и смотреть, что работает в конкретной среде и что вам наиболее удобно. Помните, что этот этап не предназначен для окончательного вывода данных. Вместо этого вы хотите проверить, что работает, а что нет.

Следующие шаги могут варьироваться в зависимости от конечной цели проекта. Например, это может быть встреча с вашей командой или старшими. В таких случаях вам нужно будет превратить ваши данные в визуальное представление и сообщить о результатах. Затем эти вещи нужно будет включить в вашу презентацию.

С другой стороны, если это отчет, который ваши коллеги могут использовать в будущем, то ваша основная задача после прототипирования должна заключаться в том, чтобы автоматизировать его и сделать его доступным для всех в компании. Наконец, и, пожалуй, самое интересное, если вы отвечаете за машинное обучение или анализ, которые будут превращены в услугу или продукт, то ваша работа будет заключаться в том, чтобы выяснить, как это реализовать. На этом этапе вам также помогут разработчики.

Читайте: Зарплата специалиста по данным в Индии

Таким образом, чтобы обобщить то, что мы узнали о кодировании, первые несколько шагов включают очистку и форматирование данных, а затем прототипирование. Последующие шаги могут включать в себя создание визуализаций данных, автоматизацию проекта, реализацию ваших моделей для использования в качестве продукта или услуги, и это лишь некоторые из них.

В этот раздел можно было бы включить и другие разные виды деятельности, но они возникают время от времени и не являются частью обычного процесса. Они включают в себя исправление ошибок, учебные пособия по новым пакетам и библиотекам и поддержку ранее написанных скриптов. Всегда есть чем заняться, если вы специалист по данным.

Встреча, презентации, беседы и мозговой штурм с группой

Так как кодирование занимает около 70% времени, остается остаток в 30%. В итоге 15% всего времени уходит на встречи с людьми. Они могут принимать различные формы, такие как официальные встречи, встречи один на один, презентации, обсуждения за кулером с водой или даже групповой чат.

Связаться с членами вашей команды жизненно важно, потому что часто во всей команде есть только один специалист по данным, и они точно не знают, чем вы занимаетесь. Вы должны взять их с собой. Но давайте не будем делать это слишком привередливым, потому что это позволяет вам добиваться большего сотрудничества с ними. Вы можете получить от них больше помощи в своих проектах по работе с большими данными и, следовательно, оказать большее влияние.

Следовательно, важно, чтобы вы установили взаимопонимание со своими коллегами, даже если вы, как специалист по данным, от природы интроверт. Но здесь необходимо предостережение. Особенно в больших компаниях есть привычка проводить встречи в течение дня. Это включает в себя сидение и разговоры и отсутствие времени для фактического кодирования. В конце концов, вы обнаружите, что ваша работа накапливается, и никто не может вас поддержать. Поэтому оставайтесь на связи со своими коллегами по работе, но не переусердствуйте, пока это не станет контрпродуктивным.

То, как вы решаете эту проблему, может иметь решающее значение для ваших шансов на продвижение в организации. Прежде всего, помните, что вы не должны проводить на совещаниях более 15% своего рабочего времени, если примерно. Помня об этом ориентире, сначала наладьте связь со своими товарищами по команде и вашим менеджером. После этого сядьте с ними и объясните им, в чем заключается ваша работа, чтобы вам нужно было присутствовать только на тех собраниях, которые необходимы для вашей работы.

Время обдумывания

Некоторым это может показаться абсурдным, но абсолютно необходимо тратить на размышления не менее 15% дня. Наука о данных — это не детская игра, она требует много тяжелой работы. Поэтому, если вы не думаете и не планируете свой день, двигаться дальше практически невозможно. Вам нужно найти лучшие статистические модели, вам нужно правильно интерпретировать данные, вам нужны слова, чтобы сообщить о результатах, и для всего этого вам нужно время, чтобы подумать в одиночестве.

Если во время размышлений вы обнаружите, что не можете организовать свои мысли, перейдите к рисованию или наброску. Держите доску рядом с собой. Или используйте обычную старую бумагу. Но как специалист по данным вы всегда можете использовать высокотехнологичный инструмент, такой как Miro, который представляет собой онлайн-инструмент для составления карт разума.

Кодирование — основная часть вашей работы, но оно может творить чудеса, когда вы можете сочетать его с набросками и размышлениями. Отступив назад, чтобы подумать, вы сможете увидеть более широкую картину, которая часто теряется в крошечных мелочах кодирования. Хотя это выглядит как время простоя, часто это самое критическое время для повышения производительности.

Разные действия и заключение

Прежде чем уйти в течение дня, нужно найти время, чтобы ответить на все электронные письма. Это только вежливо ответить в тот же день, и вы должны сделать это. Ожидается, что в течение дня вы будете заняты, поэтому найдите время в конце дня. Проанализируйте день, который вы только что закончили, и спланируйте следующий день, чтобы сохранить непрерывность и эффективность.

Подводя итог, можно сказать, что 70% рабочего времени специалиста по данным уходит на кодирование. Остаток 15% уходит на встречи и размышления, а в конце дня остается на различные мероприятия. Это достойная карьера, к которой стремятся многие.

Если вам интересно изучать науку о данных, чтобы быть в авангарде быстро развивающихся технологий, ознакомьтесь с программой Executive PG upGrad & IIIT-B по науке о данных и повышайте свою квалификацию для будущего.

Подготовьтесь к карьере будущего

ДИПЛОМ PG ОТ IIIT-B, 100+ ЧАСОВ ОБУЧЕНИЯ В КЛАССЕ, 400+ ЧАСОВ ОНЛАЙН-ОБУЧЕНИЯ И 360 ГРАДУСОВ КАРЬЕРНОЙ ПОДДЕРЖКИ
Узнать больше