데이터 과학자의 하루: 그들은 무엇을 하나요?
게시 됨: 2021-07-21가장 자주 묻는 질문 중 하나는 " 데이터 과학자의 하루"를 설명하는 것입니다. 여기에서 우리는 이 직업 선택이 당신에게 적합한지 여부에 대해 정보에 입각한 결정을 내리는 것이 어떻게 보이는지에 대한 간단한 설명을 제공하려고 노력했습니다.
처음에 매우 명확하게 합시다. 데이터 과학자의 삶에서 단 하루 를 특징짓는 것은 거의 불가능에 가깝습니다 . 직업은 매우 다양하고 직업은 매우 복잡하기 때문에 일반적인 하루는 여러 요인에 따라 달라집니다. 주요 요인 중 하나는 작업 중인 데이터 프로젝트의 유형으로 월별 또는 분기별로 변경될 수 있습니다. 두 번째 고려 사항은 보다 체계적이며 귀하가 일하는 조직의 종류에 따라 다릅니다.
구조가 계층적이면 경험이 달라지고 팀 기반이면 달라집니다. 일반적인 하루에 영향을 미치는 세 번째 매개변수는 팀 내에서의 역할입니다. 당신이 팀의 선배인지 후배인지, 단일 데이터 과학자인지 또는 기타 그러한 역할 고려 사항이 일반적인 근무 시간에 영향을 미칩니다.
그러나 일단 모든 것을 의미한다면 데이터 과학자의 평범한 하루는 다음과 같을 것입니다. 데이터 과학자가 하루에 수행하는 세 가지 주요 기능이 있습니다. 당연히 대부분의 시간이 코딩에 사용됩니다. 균형 시간은 회의와 생각에 소요되며 둘 다 대략 동등하게 나뉩니다.
여기서 생각은 개인적인 반성을 의미하며, 회의 시간에 집단적 사고를 포함할 수 있습니다. 하루에 끝낼 수 있는 프로젝트는 어디에도 없다는 점을 명심하는 것이 중요합니다. 따라서 대부분의 날에는 전날 중단했던 기존 프로젝트에 대한 지속적인 토론, 생각 또는 작업과 관련된 세 가지 작업 중 하나가 귀하의 업무에 포함될 것입니다. 그 중 일부를 조금 더 자세히 논의해 보겠습니다.
목차
코딩
데이터 과학자는 시간의 약 70%가 소요될 것으로 예상할 수 있습니다. 그 이상도 가능합니다. 데이터 과학자의 주요 업무가 코딩이라는 점을 고려하면 이는 놀라운 일이 아닙니다. 다른 과학자와 마찬가지로 데이터 과학자도 다양한 도구와 언어를 마음대로 사용할 수 있습니다.
더 친숙한 것들 중 일부는 Python, SQL 및 Bash입니다. 그렇기 때문에 데이터 사이언티스트가 되고자 한다면 배울 수 있는 모든 기술 중 코딩이 가장 중요합니다. 통계 및 비즈니스 사고는 다른 핵심 기술을 보완하지만 코딩에 대한 중요성은 줄어듭니다. 사용 가능한 데이터 과학자 도구에 대해 자세히 알아보세요.
그러나 코딩은 방대한 단어이며 코딩에 들어가는 몇 가지 일반적인 작업에 대해 배우려고 노력해야 합니다. 그 중 일부는 다음 문장에 간략하게 나와 있습니다. 데이터 정리 및 서식 지정 은 아마도 코딩에서 가장 힘들고 시간이 많이 걸리는 작업일 것입니다.
일단 설명하면 직관적이지 않게 들릴 수 있지만 여전히 유효합니다. 이 프로세스에는 프로젝트의 다음 단계에서 추가로 코딩할 수 있는 인식 가능한 형식으로 데이터를 가져오는 작업이 포함됩니다. 이것은 한 줄로 설명할 수 있지만 그것을 달성하는 것은 가장 힘든 과정 중 하나입니다.
데이터 정리 및 형식 지정을 완료하면 다음 작업에는 일반적으로 프로토타이핑이 포함됩니다. 다양한 분석 방법과 머신 러닝 방법에 대해 데이터를 확인하기 위해 프로토타이핑을 합니다.
이것은 가장 적합한 방법을 선택하는 데 도움이 됩니다. 이 단계는 종종 많은 데이터 과학자들에게 도전적인 것으로 간주되지만 전체 시퀀스에서 가장 흥미로운 부분 중 하나이기도 하다는 점을 처음으로 지적하는 사람이 될 것입니다. 이것은 마치 광석에서 귀금속을 추출하는 것처럼 원시 데이터가 이 단계에서 가치가 있기 때문입니다.
이전에 몇 가지 도구에 대해 언급했으며 각각에 대해 호환되는 프로토타이핑 소프트웨어가 있습니다. 여기에서 믹스 앤 매치하여 특정 환경에서 작동하는 것과 가장 편안하게 느끼는 것을 확인할 수 있습니다. 이 단계는 데이터의 최종 추론을 위한 단계가 아님을 기억하십시오. 대신 무엇이 작동하고 무엇이 작동하지 않는지 확인하려는 지점입니다.
다음 단계는 프로젝트의 최종 목표에 따라 달라질 수 있습니다. 예를 들어 팀이나 선배와의 회의가 될 수 있습니다. 이러한 경우 데이터를 시각적 표현으로 변환하고 결과를 보고해야 합니다. 그런 다음 이러한 내용을 프레젠테이션에 입력해야 합니다.
반면에 동료들이 미래에 사용할 수 있는 보고서라면 프로토타입을 만든 후 주요 업무는 보고서를 자동화하고 회사의 모든 사람이 액세스할 수 있도록 하는 것이어야 합니다. 마지막으로 아마도 가장 흥미롭게도 서비스나 제품으로 전환될 머신 러닝이나 분석을 담당하고 있다면 구현을 파악하는 것이 업무가 될 것입니다. 이 시점에서 개발자도 도움을 줄 것입니다.
읽기: 인도의 데이터 과학자 급여
따라서 지금까지 코딩에서 배운 내용을 요약하면 첫 번째 몇 단계에는 데이터 정리 및 서식 지정, 프로토타이핑이 포함됩니다. 후속 단계에는 데이터 시각화 생성, 프로젝트 자동화, 제품 또는 서비스로 사용할 모델 구현 등이 포함될 수 있습니다.
기타 기타 활동이 이 섹션에 포함될 수 있지만 때때로 발생하며 정상적인 프로세스의 일부가 아닙니다. 여기에는 버그 수정, 새 패키지 및 라이브러리에 대한 자습서, 이전에 작성된 스크립트 유지 관리가 포함됩니다. 데이터 과학자가 되면 항상 해야 할 일이 있습니다.
그룹과의 회의, 프레젠테이션, 대화 및 브레인스토밍
코딩은 시간의 약 70%를 차지하기 때문에 30%의 잔액이 남아 있습니다. 나머지는 전체 시간의 15%를 사람들을 만나는 데 사용합니다. 이들은 공식 회의, 일대일 세션, 프레젠테이션, 정수기를 통한 토론 또는 그룹 채팅과 같은 다양한 형태를 취할 수 있습니다.
팀 전체에 데이터 과학자가 한 명뿐인 경우가 많고 귀하가 하는 일을 정확히 알지 못하기 때문에 팀 구성원과 연락하는 것이 매우 중요합니다. 그것들을 가지고 가셔야 합니다. 그러나 그렇게 하면 그들과 더 많은 협력을 구할 수 있기 때문에 너무 까다롭게 보이지 않도록 합시다. 빅 데이터 프로젝트에서 더 많은 지원을 받을 수 있으므로 더 큰 영향을 미칠 수 있습니다.
따라서 데이터 과학자로서 자연스럽게 내성적일지라도 동료들과 관계를 발전시키는 것이 중요합니다. 그러나 여기서 주의가 필요합니다. 특히 대기업에서는 하루 종일 회의를 하는 습관이 있습니다. 이것은 앉아서 이야기하고 실제 코딩을 할 시간이 없는 것을 포함합니다. 하루가 끝나면 도와줄 사람이 아무도 없어 일이 쌓이게 될 것입니다. 따라서 동료 직원과 계속 연락하되 역효과가 날 정도로 과도하게 사용하지 마십시오.
이 문제를 관리하는 방법은 조직의 발전 가능성에 매우 중요할 수 있습니다. 우선, 대략적인 작업을 위해 회의에서 근무 시간의 15% 이상을 사용해서는 안 된다는 점을 기억하십시오. 이 벤치마크를 염두에 두고 처음에는 팀원 및 관리자와 유대감을 형성하십시오. 그런 다음, 그들과 함께 앉아서 업무에 필요한 사항을 설명하여 업무에 필수적인 회의에만 참석할 수 있도록 하십시오.
생각하는 시간
이것은 어떤 사람들에게는 터무니없게 보일 수 있지만 하루의 15% 이상을 생각하는 데 보내는 것이 절대적으로 중요합니다. 데이터 과학은 어린아이의 장난이 아니며 많은 힘든 작업을 수반합니다. 따라서 하루를 생각하고 계획하지 않으면 진행이 거의 불가능합니다. 최고의 통계 모델을 찾아야 하고, 데이터를 올바르게 해석해야 하고, 결과를 보고할 단어가 필요하고, 이 모든 것을 위해 혼자 생각할 시간이 필요합니다.
생각하는 동안 생각을 정리할 수 없으면 낙서 또는 스케치로 이동하십시오. 화이트보드를 가까이 두십시오. 또는 일반 용지를 사용하십시오. 그러나 데이터 과학자는 온라인 마인드 매핑 도구인 Miro와 같은 첨단 도구를 항상 사용할 수 있습니다.
코딩은 작업의 주요 부분이지만 스케치 및 사고와 결합할 수 있다면 놀라운 일이 될 수 있습니다. 한 발 물러서서 생각하면 더 큰 그림을 볼 수 있는데, 이는 종종 코딩의 작은 부분에서 길을 잃습니다. 가동 중지 시간처럼 보이지만 생산성을 높이는 데 가장 중요한 시간인 경우가 많습니다.
기타 활동 및 결론
하루를 떠나기 전에 모든 이메일에 답장할 시간을 내야 합니다. 당일에 답변하는 것이 예의이며 그렇게 해야 합니다. 낮에는 바쁠 것으로 예상되므로 하루를 마감하는 시간에 시간을 내십시오. 연속성과 효율성을 유지하기 위해 방금 완료한 날을 검토하고 다음 날을 계획하십시오.
요약하자면, 데이터 과학자의 작업 시간 중 70%는 코딩에 소요됩니다. 나머지 15%는 회의와 생각에 사용되며 하루의 끝은 다양한 활동에 사용됩니다. 많은 사람들이 열망하는 보람 있는 직업입니다.
급변하는 기술 발전의 선두에 서기 위해 데이터 과학을 배우는 데 관심이 있다면 upGrad & IIIT-B의 데이터 과학 Executive PG 프로그램을 확인하고 미래를 위한 기술을 향상시키십시오.