データサイエンティストの1日:彼らは何をしますか?
公開: 2021-07-21最もよくある質問の1つは、 「データサイエンティストの1日」について説明することです。 ここでは、このキャリアの選択があなたにとって正しいものであるかどうかを情報に基づいた決定を下すためにどのように見えるかについて簡単に説明しようとしました。
最初に、非常に明確にしましょう。 データサイエンティストの人生の1日だけを特徴づけることはほぼ不可能です。 仕事は非常に多様で、職業は非常に複雑であるため、通常の日は複数の要因に依存します。 主な要因の1つは、作業中のデータプロジェクトのタイプであり、月ごとまたは四半期ごとに変更される可能性があります。 2番目の考慮事項はより体系的であり、所属する組織の種類によって異なります。
階層構造の場合はエクスペリエンスが異なり、チームベースの場合はエクスペリエンスが異なります。 通常の日に影響を与える3番目のパラメーターは、チーム内でのあなたの役割です。 あなたがシニア、ジュニア、またはチームの単一のデータサイエンティストであるかどうか、あるいは他のそのような役割の考慮事項は、あなたの典型的な就業日に影響を与えます。
しかし、それらすべてを平均すると、データサイエンティストの通常の日は次のようになります。 データサイエンティストが1日に達成する主な機能は3つあります。 当然のことながら、ほとんどの時間はコーディングに費やされます。 バランスの時間は会議と思考に費やされ、どちらも大まかに均等に分けられます。
ここで、思考とは個人的な反省を指し、会議の時間にグループ思考を含めることができます。 1日で完了できるプロジェクトはどこにもありません。 したがって、ほとんどの日、あなたの仕事には、前日に停止した場所からの既存のプロジェクトに関する継続的な議論、考え、または作業に関する3つのいずれかが含まれます。 それらのいくつかについてもう少し詳しく説明しましょう。
目次
コーディング
データサイエンティストとして、あなたはそれがあなたの時間の約70%かかると予想することができます。 それを超えることさえできます。 データサイエンティストの主な仕事がコーディングであることを考えると、これは驚くべきことではありません。 他の科学者と同じように、データサイエンティストもさまざまなツールと言語を自由に使用できます。
よく知られているものには、Python、SQL、Bashなどがあります。 このため、データサイエンティストになりたい場合に習得できるすべてのスキルの中で、コーディングが最も重要です。 統計とビジネス思考は他の重要なスキルを締めくくりますが、コーディングの重要性は低下します。 利用可能なデータサイエンティストツールの詳細をご覧ください。
ただし、コーディングは広大な言葉であり、コーディングに含まれる典型的なタスクのいくつかについて学習する必要があります。 それらのいくつかは、次の文章で簡単に説明されています。 データのクリーニングとフォーマットは、コーディングの中でおそらく最も面倒で時間のかかる作業です。
説明すると直感に反するように聞こえるかもしれませんが、それでも当てはまります。 このプロセスには、プロジェクトの次の段階でさらにコーディングできる認識可能な形式にデータを取り込むことが含まれます。 これは一行で説明できますが、それを達成することは最も困難なプロセスの1つです。
データのクリーニングとフォーマットが完了したら、次のタスクには通常、プロトタイピングが含まれます。 さまざまな分析手法や機械学習手法に対してデータをチェックするために、プロトタイピングを行います。
これは、どの方法が最適かを選択するのに役立ちます。 この段階は、多くのデータサイエンティストによって困難であると見なされることがよくありますが、シーケンス全体の中で最もエキサイティングな部分の1つでもあることを最初に指摘します。 これは、鉱石から貴金属を抽出するのと同じように、このステップで生データが貴重になるためです。
以前にいくつかのツールについて説明しましたが、それぞれに互換性のあるプロトタイピングソフトウェアがあります。 ここで組み合わせて、特定の環境で何が機能し、何が最も快適に感じるかを確認できます。 この段階は、データの最終的な推論ではないことに注意してください。 代わりに、これは、何が機能し、何が機能しないかを確認するポイントです。
次の手順は、プロジェクトの最終目的によって異なります。 たとえば、チームや先輩との会議などです。 このような場合、データを視覚的な表現に変換し、結果を報告する必要があります。 これらのことはあなたのプレゼンテーションに入る必要があります。
一方、同僚が将来使用する可能性のあるレポートである場合、プロトタイピング後の主な仕事は、それを自動化し、社内のすべての人がアクセスできるようにする方法です。 最後に、おそらく最もエキサイティングなことに、サービスまたは製品に変換される機械学習または分析を担当している場合、あなたの仕事は実装を理解することです。 この時点で、開発者も支援します。
読む:インドのデータサイエンティスト給与
したがって、コーディングでこれまでに学んだことを要約すると、最初の2つのステップでは、データのクリーニングとフォーマットを行い、次にプロトタイピングを行います。 後続の手順には、データの視覚化の作成、プロジェクトの自動化、製品またはサービスとして使用するモデルの実装などが含まれます。
他の雑多な活動がこのセクションに含まれている可能性がありますが、それらは時々発生し、通常のプロセスの一部ではありません。 それらには、バグ修正、新しいパッケージとライブラリに関するチュートリアル、および以前に作成されたスクリプトの保守が含まれます。 あなたがデータサイエンティストであるとき、常に何かすることがあります。
グループとのミーティング、プレゼンテーション、会話、ブレーンストーミング
コーディングには約70%の時間がかかるため、残りの30%が残ります。 残りの部分では、合計時間の15%が人との会議に費やされています。 これらは、正式な会議、1対1のセッション、プレゼンテーション、ウォータークーラーに関するディスカッション、さらにはグループチャットなど、さまざまな形をとることができます。
チーム全体にデータサイエンティストが1人しかいないことが多く、チームメンバーはあなたが何をしているのかを正確に認識していないため、チームメンバーと連絡を取ることは非常に重要です。 あなたはそれらをあなたと一緒に持っていかなければなりません。 しかし、これを行うことであなたは彼らとのより大きな協力を求めることができるので、それをあまりにも気難しいように思わせないようにしましょう。 ビッグデータプロジェクトで彼らからより多くの支援を得ることができるため、より大きな影響を与えることができます。
したがって、データサイエンティストとして自然に内向的である場合でも、同僚との関係を築くことが重要です。 ただし、ここでは注意が必要です。 特に大企業では、一日中会議を開く習慣があります。 これには、座って話し、実際のコーディングを行う時間がないことが含まれます。 一日の終わりに、あなたはあなたの仕事があなたをサポートするためにそこに誰もいない状態で積み重なっているのを見つけるでしょう。 したがって、同僚と連絡を取り続けますが、逆効果になるまでやりすぎないでください。
この問題を管理する方法は、組織の進歩の可能性にとって非常に重要です。 まず、概算として、勤務時間の15%以上を会議に費やすことは想定されていないことを忘れないでください。 このベンチマークを念頭に置いて、最初にチームメートやマネージャーとの絆を築きます。 その後、彼らと一緒に座って、あなたの仕事が何を伴うのかを彼らに説明してください。そうすれば、あなたはあなたの仕事に不可欠な会議だけに出席する必要があります。
思考時間
これは一部の人にはばかげているように見えるかもしれませんが、1日の少なくとも15%を考えて過ごすことが絶対に重要です。 データサイエンスは子供の遊びではなく、多くの困難な作業を伴います。 したがって、あなたがあなたの一日を考えて計画しなければ、先に進むことはほとんど不可能です。 最良の統計モデルを理解する必要があり、データを正しく解釈する必要があり、調査結果を報告するための言葉が必要です。これらすべてについて、一人で考える時間が必要です。
考えているときに、自分の考えを整理できない場合は、落書きやスケッチに移ります。 ホワイトボードを近くに置いてください。 または、普通の古い紙を使用します。 しかし、データサイエンティストとして、オンラインマインドマッピングツールであるMiroなどのハイテクツールをいつでも使用できます。
コーディングはあなたの仕事の主要な部分ですが、スケッチや思考と組み合わせることができると不思議に思うことがあります。 考えに戻ると、全体像を見ることができます。これは、コーディングの小さな細かな点で失われることがよくあります。 ダウンタイムのように見えますが、生産性を高めるための最も重要な時期であることがよくあります。
その他の活動と結論
その日に出発する前に、すべての電子メールに返信する時間を作る必要があります。 同じ日に返答するのは礼儀正しいだけであり、そうすべきです。 日中は忙しいことが予想されますので、一日の終わりに時間を作ってください。 終了したばかりの日を確認し、継続性と効率を維持するために次の日の計画を立てます。
要約すると、データサイエンティストの作業時間の70%がコーディングに費やされます。 バランス15%はそれぞれ会議と思考に費やされ、1日の終わりはさまざまな活動のために保持されます。 多くの人が目指すやりがいのあるキャリアです。
ペースの速い技術の進歩の最前線に立つためにデータサイエンスを学ぶことに興味がある場合は、upGrad&IIIT-BのデータサイエンスのエグゼクティブPGプログラムをチェックして、将来に向けてスキルを磨いてください。