วันหนึ่งในชีวิตของ Data Scientist: พวกเขาทำอะไร?

เผยแพร่แล้ว: 2021-07-21

หนึ่งในคำถามที่พบบ่อยที่สุดคือการอธิบาย " วันหนึ่งในชีวิตของนักวิทยาศาสตร์ข้อมูล" ในที่นี้ เราได้พยายามให้คำอธิบายแบบเบาๆ ว่าหน้าตาเป็นอย่างไรในการตัดสินใจอย่างมีข้อมูลว่าการเลือกอาชีพนี้เหมาะสมกับคุณหรือไม่

ในตอนแรกให้เรามีความชัดเจนมาก แทบจะเป็นไปไม่ได้เลยที่จะระบุลักษณะ ของนักวิทยาศาสตร์ข้อมูลเพียงวันเดียว เนื่องจากงานมีความหลากหลายและอาชีพที่ซับซ้อน วันธรรมดาจึงขึ้นอยู่กับปัจจัยหลายประการ ปัจจัยหลักประการหนึ่งคือประเภทของโครงการข้อมูลที่คุณกำลังทำงานอยู่ ซึ่งสามารถเปลี่ยนแปลงได้ทุกเดือนหรือทุกไตรมาส ข้อพิจารณาประการที่สองมีความเป็นระบบมากกว่าและขึ้นอยู่กับประเภทองค์กรที่คุณทำงาน

ถ้าโครงสร้างมีลำดับชั้น ประสบการณ์จะต่างกัน ถ้าเป็นแบบทีมก็จะต่างกัน พารามิเตอร์ที่สามที่มีอิทธิพลต่อวันปกติคือบทบาทของคุณในทีม ไม่ว่าคุณจะเป็นรุ่นพี่หรือรุ่นน้อง หรือนักวิทยาศาสตร์ข้อมูลคนเดียวในทีม หรือการพิจารณาบทบาทอื่นๆ ดังกล่าวจะส่งผลต่อวันทำงานปกติของคุณ

แต่เมื่อคุณใช้ค่าเฉลี่ยทั้งหมด วันธรรมดาสำหรับนักวิทยาศาสตร์ข้อมูลอาจมีลักษณะดังนี้ มีสามหน้าที่หลักที่นักวิทยาศาสตร์ข้อมูลทำสำเร็จในหนึ่งวัน ไม่น่าแปลกใจที่เวลาส่วนใหญ่เข้าสู่การเข้ารหัส เวลาที่สมดุลจะไปในการประชุมและการคิด ทั้งสองอย่างคร่าว ๆ อย่างเท่า ๆ กัน

ในที่นี้ การคิดหมายถึงการไตร่ตรองส่วนตัว และเราสามารถรวมการคิดเป็นกลุ่มในเวลาประชุม สิ่งสำคัญคือต้องจำไว้ว่าไม่มีโครงการใดที่คุณสามารถทำได้ในวันเดียว ดังนั้น ในวันส่วนใหญ่ งานของคุณจะเกี่ยวข้องกับหนึ่งในสามงานที่เกี่ยวข้องกับการอภิปราย ความคิด หรืองานในโครงการที่มีอยู่ซึ่งคุณหยุดไปเมื่อวันก่อน ให้เราพูดถึงรายละเอียดเพิ่มเติมเล็กน้อย

สารบัญ

การเข้ารหัส

ในฐานะนักวิทยาศาสตร์ข้อมูล คุณสามารถคาดว่าจะใช้เวลาประมาณ 70% ของเวลาทั้งหมด มันสามารถเกินกว่านั้น ไม่น่าแปลกใจเลยที่งานหลักของนักวิทยาศาสตร์ข้อมูลคือการเขียนโค้ด เช่นเดียวกับนักวิทยาศาสตร์คนอื่นๆ นักวิทยาศาสตร์ด้านข้อมูลก็มีเครื่องมือและภาษาต่างๆ

สิ่งที่คุ้นเคยมากกว่า ได้แก่ Python, SQL และ Bash ด้วยเหตุนี้ การเขียนโค้ดจึงเป็นสิ่งสำคัญที่สุดในบรรดาทักษะทั้งหมดที่คุณสามารถเรียนรู้ได้หากต้องการเป็นนักวิทยาศาสตร์ข้อมูล สถิติและการคิดเชิงธุรกิจช่วยปัดเป่าทักษะสำคัญอื่นๆ ออกไป แต่กลับลดความสำคัญลงในการเขียนโค้ด เรียนรู้เพิ่มเติมเกี่ยวกับเครื่องมือนักวิทยาศาสตร์ข้อมูลที่มีให้บริการ

อย่างไรก็ตาม การเขียนโค้ดเป็นคำที่กว้างใหญ่ และเราจำเป็นต้องพยายามเรียนรู้เกี่ยวกับงานทั่วไปบางอย่างที่เกี่ยวข้องกับการเขียนโค้ด บางส่วนของพวกเขาได้รับสั้น ๆ ในประโยคต่อไปนี้ การล้างข้อมูลและการจัดรูปแบบข้อมูล อาจเป็นงานที่ลำบากและใช้เวลานานที่สุดในการเขียนโค้ด

อาจฟังดูขัดกับสัญชาตญาณเมื่อเราอธิบายให้คุณฟังแล้ว แต่ก็ยังมีอยู่ กระบวนการนี้เกี่ยวข้องกับการนำข้อมูลมาในรูปแบบที่จดจำได้ ซึ่งคุณสามารถเขียนโค้ดเพิ่มเติมในขั้นตอนต่อไปของโครงการ แม้ว่าสิ่งนี้สามารถอธิบายได้ในบรรทัดเดียว แต่การบรรลุเป้าหมายนั้นเป็นกระบวนการที่ยากที่สุดวิธีหนึ่ง

เมื่อเราเสร็จสิ้นการล้างข้อมูลและการจัดรูปแบบแล้ว งานต่อไปมักจะเกี่ยวข้องกับการ สร้างต้นแบบ คุณสร้างต้นแบบเพื่อตรวจสอบข้อมูลเทียบกับวิธีการวิเคราะห์ต่างๆ และวิธีการเรียนรู้ของเครื่อง

วิธีนี้ช่วยให้คุณเลือกวิธีที่เหมาะสมที่สุด ขั้นตอนนี้มักจะถือว่าท้าทายโดยนักวิทยาศาสตร์ด้านข้อมูลหลายคน แต่พวกเขาจะเป็นคนแรกที่ชี้ให้เห็นว่าขั้นตอนนี้เป็นส่วนที่น่าตื่นเต้นที่สุดชิ้นหนึ่งของลำดับทั้งหมด นั่นเป็นเพราะว่าข้อมูลดิบมีค่าในขั้นตอนนี้ เหมือนกับการสกัดโลหะมีค่าจากแร่

เราพูดถึงเครื่องมือบางอย่างก่อนหน้านี้ และมีซอฟต์แวร์สร้างต้นแบบที่เข้ากันได้สำหรับแต่ละรายการ คุณสามารถมิกซ์แอนด์แมทช์ได้ที่นี่ และดูว่าสิ่งใดใช้ได้ผลในสภาพแวดล้อมเฉพาะ และสิ่งใดที่คุณรู้สึกสบายใจที่สุด โปรดจำไว้ว่าขั้นตอนนี้ไม่ได้มีไว้สำหรับการอนุมานข้อมูลขั้นสุดท้าย นี่คือจุดที่คุณต้องการตรวจสอบว่าสิ่งใดใช้ได้ผลและไม่ได้ผล

ขั้นตอนต่อไปนี้อาจแตกต่างกันไปขึ้นอยู่กับเป้าหมายสุดท้ายของโครงการ ตัวอย่างเช่น อาจเป็นการพบปะกับทีมหรือรุ่นพี่ ในกรณีดังกล่าว คุณจะต้องเปลี่ยนข้อมูลของคุณให้เป็นภาพจำลองและรายงานสิ่งที่ค้นพบ สิ่งเหล่านี้จะต้องเข้าสู่การนำเสนอของคุณ

ในทางกลับกัน หากเป็นรายงานที่เพื่อนร่วมงานของคุณอาจนำไปใช้ในอนาคต งานหลักของคุณหลังจากสร้างต้นแบบควรเป็นวิธีการอัตโนมัติและทำให้ทุกคนในบริษัทสามารถเข้าถึงได้ สุดท้าย และอาจน่าตื่นเต้นที่สุด หากคุณรับผิดชอบด้านแมชชีนเลิร์นนิงหรือการวิเคราะห์ที่จะเปลี่ยนเป็นบริการหรือผลิตภัณฑ์ งานของคุณคือคิดการนำไปใช้งาน ณ จุดนี้นักพัฒนาจะช่วยเหลือคุณด้วย

อ่าน: เงินเดือนนักวิทยาศาสตร์ข้อมูลในอินเดีย

ดังนั้น เพื่อสรุปสิ่งที่เราได้เรียนรู้จนถึงตอนนี้ในการเขียนโค้ด ขั้นตอนแรกสองขั้นตอนเกี่ยวข้องกับการล้างข้อมูลและการจัดรูปแบบ ตามด้วยการสร้างต้นแบบ ขั้นตอนที่ตามมาอาจรวมถึงการสร้างภาพข้อมูล การทำให้โครงการเป็นแบบอัตโนมัติ การนำแบบจำลองของคุณไปใช้เป็นผลิตภัณฑ์หรือบริการ เป็นต้น

กิจกรรมเบ็ดเตล็ดอื่น ๆ อาจรวมอยู่ในส่วนนี้ แต่กิจกรรมเหล่านั้นจะค่อย ๆ เกิดขึ้นเป็นครั้งคราวและไม่ได้เป็นส่วนหนึ่งของกระบวนการปกติ พวกเขาเกี่ยวข้องกับการแก้ไขข้อบกพร่อง บทช่วยสอนเกี่ยวกับแพ็คเกจและไลบรารีใหม่ และการบำรุงรักษาสคริปต์ที่เขียนไว้ก่อนหน้านี้ มีบางสิ่งที่ต้องทำเสมอเมื่อคุณเป็นนักวิทยาศาสตร์ข้อมูล

การประชุม การนำเสนอ การพูดคุย และการระดมความคิดกับกลุ่ม

เนื่องจากการเข้ารหัสใช้เวลาประมาณ 70% จึงมียอดคงเหลือ 30% ในความสมดุล 15% ของเวลาทั้งหมดถูกใช้ไปพบปะผู้คน สิ่งเหล่านี้อาจมีรูปแบบที่แตกต่างกัน เช่น การประชุมอย่างเป็นทางการ การประชุมแบบตัวต่อตัว การนำเสนอ การอภิปรายเกี่ยวกับเครื่องทำน้ำเย็น หรือแม้แต่การแชทเป็นกลุ่ม

การติดต่อกับสมาชิกในทีมของคุณมีความสำคัญอย่างยิ่ง เนื่องจากมักจะมีนักวิทยาศาสตร์ข้อมูลเพียงคนเดียวในทีมทั้งหมด และพวกเขาไม่ได้ตระหนักถึงสิ่งที่คุณทำอย่างแน่นอน คุณต้องพาพวกเขาไปด้วย แต่อย่าทำให้เราดูจุกจิกเกินไปเพราะการทำเช่นนี้จะทำให้คุณสามารถขอความร่วมมือกับพวกเขาได้มากขึ้น คุณสามารถรับความช่วยเหลือเพิ่มเติมจากพวกเขาในโครงการข้อมูลขนาดใหญ่ของคุณ ดังนั้นจึงมีผลกระทบมากขึ้น

ดังนั้นจึงเป็นสิ่งสำคัญที่คุณจะต้องพัฒนาสายสัมพันธ์กับเพื่อนร่วมงานของคุณ แม้ว่าคุณจะเป็นคนเก็บตัวโดยธรรมชาติในฐานะนักวิทยาศาสตร์ด้านข้อมูลก็ตาม แต่คำเตือนเป็นสิ่งจำเป็นที่นี่ โดยเฉพาะในบริษัทขนาดใหญ่มักมีการประชุมตลอดทั้งวัน สิ่งนี้เกี่ยวข้องกับการนั่งและพูดคุยและไม่มีเวลาเขียนโค้ดจริง ในท้ายที่สุด คุณจะพบว่างานของคุณกองทับกันโดยไม่มีใครสนับสนุนคุณ ดังนั้น ให้ติดต่อกับเพื่อนร่วมงานของคุณ แต่อย่าหักโหมจนกลายเป็นการต่อต้าน

วิธีที่คุณจัดการปัญหานี้อาจมีความสำคัญต่อโอกาสในการก้าวหน้าในองค์กรของคุณ ก่อนอื่น จำไว้ว่าคุณไม่ควรใช้เวลาทำงานเกิน 15% ในการประชุมเพื่อประมาณการ เมื่อคำนึงถึงเกณฑ์มาตรฐานนี้ ให้เริ่มพัฒนาสายสัมพันธ์กับเพื่อนร่วมทีมและผู้จัดการของคุณ หลังจากนั้น นั่งลงกับพวกเขาและอธิบายให้พวกเขาฟังว่างานของคุณเกี่ยวข้องกับอะไร เพื่อที่คุณจะต้องเข้าร่วมการประชุมที่สำคัญต่องานของคุณเท่านั้น

เวลาคิด

สิ่งนี้อาจดูไร้สาระสำหรับบางคน แต่จำเป็นอย่างยิ่งที่จะใช้เวลาคิดอย่างน้อย 15% ของวัน วิทยาศาสตร์ข้อมูลไม่ใช่เรื่องเล่นๆ ของเด็กและต้องใช้ความพยายามอย่างมาก ดังนั้น หากคุณไม่คิดและวางแผนวันของคุณ แทบจะเป็นไปไม่ได้เลยที่จะดำเนินการต่อไป คุณต้องหาตัวแบบทางสถิติที่ดีที่สุด คุณต้องตีความข้อมูลให้ถูกต้อง คุณต้องใช้คำศัพท์ในการรายงานผลการวิจัย และสำหรับทั้งหมดนี้ คุณต้องใช้เวลาคิดตามลำพัง

ในระหว่างการคิด หากคุณพบว่าตัวเองไม่สามารถจัดระเบียบความคิดได้ ให้ย้ายไปวาดรูปหรือสเก็ตช์ภาพ วางไวท์บอร์ดไว้ใกล้ตัวคุณ หรือใช้กระดาษธรรมดาเก่าๆ แต่ในฐานะนักวิทยาศาสตร์ข้อมูล คุณสามารถใช้เครื่องมือที่มีเทคโนโลยีสูง เช่น Miro ซึ่งเป็นเครื่องมือสร้างแผนที่ความคิดออนไลน์ได้เสมอ

การเขียนโค้ดเป็นส่วนสำคัญของงานของคุณ แต่สามารถทำสิ่งมหัศจรรย์ได้เมื่อคุณสามารถรวมเข้ากับการร่างภาพและการคิดได้ การกลับมาคิดใหม่ทำให้คุณเห็นภาพที่ใหญ่ขึ้น ซึ่งมักจะหายไปจากส่วนเล็กๆ น้อยๆ ของการเขียนโค้ด แม้ว่าจะดูเหมือนช่วงหยุดทำงาน แต่ก็มักจะเป็นเวลาที่สำคัญที่สุดในการเพิ่มผลผลิต

กิจกรรมเบ็ดเตล็ดและบทสรุป

ก่อนออกเดินทางต้องหาเวลาไปตอบอีเมล์ทุกฉบับก่อน เป็นการสุภาพเท่านั้นที่จะตอบกลับในวันเดียวกันและคุณควรทำเช่นนั้น ในระหว่างวัน คาดว่าคุณจะมีงานยุ่ง ดังนั้นจงหาเวลาในช่วงท้ายของวัน ทบทวนวันที่คุณเพิ่งทำเสร็จและวางแผนสำหรับวันถัดไปเพื่อให้เกิดความต่อเนื่องและประสิทธิภาพ

โดยสรุป 70% ของเวลาทำงานสำหรับนักวิทยาศาสตร์ข้อมูลเข้าสู่การเข้ารหัส ยอดคงเหลือ 15% แต่ละครั้งจะเข้าสู่การประชุมและการคิด โดยจะเก็บช่วงสิ้นสุดของวันไว้สำหรับกิจกรรมต่างๆ เป็นอาชีพที่คุ้มค่าที่หลายคนใฝ่ฝัน

หากคุณอยากรู้เกี่ยวกับการเรียนรู้วิทยาศาสตร์ข้อมูลเพื่อก้าวไปสู่ความก้าวหน้าทางเทคโนโลยีอย่างรวดเร็ว ลองดู Executive PG Program ของ upGrad & IIIT-B ในด้าน Data Science และเพิ่มทักษะให้กับตัวเองเพื่ออนาคต

เตรียมความพร้อมสู่อาชีพแห่งอนาคต

PG DIPLOMA จาก IIIT-B, การเรียนในห้องเรียนมากกว่า 100 ชั่วโมง, การเรียนออนไลน์มากกว่า 400 ชั่วโมง & การสนับสนุนด้านอาชีพ 360 องศา
เรียนรู้เพิ่มเติม