Sehari dalam Kehidupan Ilmuwan Data: Apa yang mereka lakukan?
Diterbitkan: 2021-07-21Salah satu pertanyaan yang paling sering diajukan adalah untuk menggambarkan “ suatu hari dalam kehidupan seorang ilmuwan data”. Di sini kami telah mencoba memberikan deskripsi ringan tentang bagaimana tampaknya membuat keputusan berdasarkan informasi apakah pilihan karier ini tepat untuk Anda.
Di awal, mari kita perjelas. Hampir tidak mungkin untuk mengkarakterisasi hanya satu hari dalam kehidupan seorang ilmuwan data. Karena pekerjaannya sangat bervariasi dan profesinya begitu kompleks, hari-hari biasa akan bergantung pada banyak faktor. Salah satu faktor utama adalah jenis proyek data yang sedang Anda kerjakan, yang dapat berubah setiap bulan atau setiap tiga bulan. Pertimbangan kedua lebih sistemik dan tergantung pada jenis organisasi tempat Anda bekerja.
Kalau strukturnya hierarkis, pengalamannya akan berbeda, jika berbasis tim, akan berbeda. Parameter ketiga yang memengaruhi hari-hari biasa adalah peran Anda dalam tim. Apakah Anda seorang senior atau junior atau ilmuwan data tunggal dalam tim, atau pertimbangan peran lainnya memengaruhi hari kerja Anda.
Tetapi begitu Anda memahami semuanya, hari biasa bagi seorang ilmuwan data mungkin terlihat seperti berikut ini. Ada tiga fungsi utama yang dilakukan ilmuwan data dalam sehari. Tidak mengherankan, sebagian besar waktu masuk ke pengkodean. Keseimbangan waktu berjalan dalam pertemuan dan pemikiran, keduanya secara kasar dibagi rata.
Di sini, berpikir mengacu pada refleksi pribadi, dan kita dapat memasukkan pemikiran kelompok dalam waktu pertemuan. Penting untuk diingat bahwa tidak ada proyek di mana pun yang dapat Anda selesaikan dalam satu hari. Jadi, hampir setiap hari, pekerjaan Anda akan melibatkan salah satu dari ketiganya tentang melanjutkan diskusi, pemikiran, atau mengerjakan proyek yang ada dari tempat Anda berhenti pada hari sebelumnya. Mari kita bahas beberapa di antaranya dengan sedikit lebih detail.
Daftar isi
pengkodean
Sebagai ilmuwan data, Anda dapat mengharapkannya untuk menghabiskan sekitar 70% dari waktu Anda. Bahkan bisa melebihi itu. Itu tidak mengherankan mengingat pekerjaan utama seorang ilmuwan data adalah membuat kode. Sama seperti ilmuwan lainnya, seorang ilmuwan data juga memiliki berbagai alat dan bahasa yang mereka miliki.
Beberapa yang lebih familiar adalah Python, SQL, dan Bash. Untuk alasan ini, pengkodean adalah yang paling penting dari semua keterampilan yang dapat Anda pelajari jika Anda ingin menjadi ilmuwan data. Statistik dan Pemikiran Bisnis melengkapi keterampilan utama lainnya, tetapi mereka mengurangi pentingnya pengkodean. Pelajari lebih lanjut tentang alat ilmuwan data yang tersedia.
Namun, pengkodean adalah kata yang luas, dan kita harus berusaha mempelajari beberapa tugas khas yang masuk ke pengkodean. Beberapa di antaranya secara singkat diberikan dalam kalimat berikut. Pembersihan dan pemformatan data mungkin merupakan pekerjaan yang paling melelahkan dan memakan waktu dalam pengkodean.
Ini bisa terdengar kontra-intuitif setelah kami menjelaskannya kepada Anda, tetapi masih berlaku. Proses ini melibatkan membawa data ke dalam format yang dapat dikenali yang dapat Anda kodekan lebih lanjut di tahap proyek berikutnya. Meskipun hal ini dapat dijelaskan dalam satu baris, mencapainya adalah salah satu proses yang paling sulit.
Setelah kami menyelesaikan pembersihan dan pemformatan data, tugas berikutnya biasanya melibatkan pembuatan prototipe. Anda melakukan prototyping untuk memeriksa data terhadap berbagai metode analitik dan metode pembelajaran mesin.
Ini membantu Anda memilih metode mana yang paling cocok. Tahap ini sering dianggap menantang oleh banyak ilmuwan data, tetapi mereka akan menjadi yang pertama menunjukkan bahwa ini juga merupakan salah satu bagian paling menarik dari keseluruhan rangkaian. Itu karena data mentah menjadi berharga dengan langkah ini, seperti mengekstraksi logam mulia dari bijih.
Kami menyebutkan beberapa alat sebelumnya, dan ada perangkat lunak prototyping yang kompatibel untuk masing-masing alat. Anda dapat memadupadankan di sini dan melihat apa yang berhasil di lingkungan tertentu dan apa yang terasa paling nyaman bagi Anda. Ingat bahwa tahap ini bukan untuk kesimpulan akhir dari data. Sebaliknya, ini adalah titik di mana Anda ingin memeriksa apa yang berhasil dan apa yang tidak.
Langkah-langkah berikut dapat bervariasi tergantung pada tujuan akhir proyek. Misalnya, bisa untuk pertemuan dengan tim atau senior Anda. Dalam kasus seperti itu, Anda perlu mengubah data Anda menjadi representasi visual dan melaporkan temuannya. Hal-hal ini kemudian perlu masuk ke presentasi Anda.
Di sisi lain, jika ini adalah laporan yang mungkin berguna bagi kolega Anda di masa mendatang, maka pekerjaan utama Anda setelah membuat prototipe adalah bagaimana mengotomatiskannya dan membuatnya dapat diakses oleh semua orang di perusahaan. Terakhir, dan mungkin yang paling menarik, jika Anda bertanggung jawab atas pembelajaran mesin atau analisis yang akan diubah menjadi layanan atau produk, maka tugas Anda adalah mencari tahu implementasinya. Pada titik ini, pengembang juga akan membantu Anda.
Baca: Gaji Data Scientist di India
Oleh karena itu, untuk meringkas apa yang telah kita pelajari sejauh ini dalam pengkodean, beberapa langkah pertama melibatkan pembersihan & pemformatan data, diikuti dengan pembuatan prototipe. Langkah selanjutnya mungkin termasuk membuat visualisasi data, mengotomatiskan proyek, menerapkan model Anda untuk digunakan sebagai produk atau layanan, untuk beberapa nama.
Kegiatan lain-lain dapat dimasukkan dalam bagian ini, tetapi kegiatan tersebut muncul dari waktu ke waktu dan bukan merupakan bagian dari proses normal. Mereka melibatkan perbaikan bug, tutorial tentang paket & perpustakaan baru, dan pemeliharaan skrip yang ditulis sebelumnya. Selalu ada sesuatu yang harus dilakukan ketika Anda seorang ilmuwan data.
Pertemuan, Presentasi, Talking dan Brainstorming dengan Grup
Karena pengkodean memakan waktu sekitar 70%, ada sisa 30% yang tersisa. Dalam keseimbangan, 15% dari total waktu dihabiskan untuk bertemu dengan orang-orang. Ini dapat mengambil bentuk yang berbeda seperti pertemuan formal, sesi satu-satu, presentasi, diskusi tentang pendingin air atau bahkan obrolan grup.
Menghubungi anggota tim Anda sangat penting karena seringkali hanya ada satu ilmuwan data di seluruh tim, dan mereka tidak sepenuhnya mengetahui apa yang Anda lakukan. Anda harus membawa mereka bersama Anda. Tetapi janganlah kita membuatnya tampak terlalu rewel karena melakukan ini memungkinkan Anda untuk mencari kerja sama yang lebih besar dengan mereka. Anda bisa mendapatkan lebih banyak bantuan dari mereka dalam proyek data besar Anda dan karenanya memiliki dampak yang lebih besar.
Oleh karena itu, penting bagi Anda untuk mengembangkan hubungan baik dengan rekan kerja Anda, bahkan jika Anda mungkin secara alami tertutup sebagai ilmuwan data. Tapi kata hati-hati diperlukan di sini. Terutama di perusahaan besar, ada kebiasaan mengadakan rapat sepanjang hari. Ini melibatkan duduk dan berbicara dan tidak memiliki waktu untuk melakukan pengkodean yang sebenarnya. Pada akhirnya, Anda akan menemukan pekerjaan Anda menumpuk tanpa ada seorang pun di sana untuk mendukung Anda. Oleh karena itu, tetap berhubungan dengan rekan kerja Anda tetapi jangan berlebihan sampai menjadi kontraproduktif.
Cara Anda mengelola masalah ini dapat menjadi sangat penting bagi peluang kemajuan Anda dalam organisasi. Pertama-tama, ingatlah bahwa Anda tidak seharusnya menghabiskan lebih dari 15% jam kerja Anda dalam rapat, untuk mengambil perkiraan. Dengan mengingat tolok ukur ini, awalnya kembangkan ikatan dengan rekan tim dan manajer Anda. Setelah itu, duduklah bersama mereka dan jelaskan kepada mereka apa yang dimaksud dengan pekerjaan Anda sehingga Anda hanya perlu hadir dalam rapat yang penting untuk pekerjaan Anda.
Waktu Berpikir
Ini mungkin tampak tidak masuk akal bagi sebagian orang, tetapi sangat penting untuk menghabiskan setidaknya 15% dari hari untuk berpikir. Ilmu data bukanlah permainan anak-anak dan melibatkan banyak kerja keras. Karena itu, jika Anda tidak memikirkan dan merencanakan hari Anda, hampir tidak mungkin untuk melanjutkan. Anda perlu menemukan model statistik terbaik, Anda perlu menafsirkan data dengan benar, Anda perlu kata-kata untuk melaporkan temuan, dan untuk semua ini, Anda perlu waktu untuk berpikir sendiri.
Selama berpikir, jika Anda menemukan diri Anda tidak dapat mengatur pikiran Anda, pindah ke mencoret-coret atau membuat sketsa. Simpan papan tulis di dekat Anda. Atau gunakan kertas bekas biasa. Tetapi sebagai ilmuwan data, Anda selalu dapat menggunakan alat berteknologi tinggi seperti Miro, yang merupakan alat pemetaan pikiran online.
Pengkodean adalah bagian utama dari pekerjaan Anda, tetapi dapat melakukan keajaiban ketika Anda dapat menggabungkannya dengan membuat sketsa dan berpikir. Melangkah mundur untuk berpikir memungkinkan Anda melihat gambaran yang lebih besar, yang sering hilang dalam hal-hal kecil pengkodean. Meskipun terlihat seperti waktu henti, sering kali ini merupakan waktu yang paling kritis untuk meningkatkan produktivitas.
Aneka Kegiatan dan Kesimpulan
Sebelum berangkat hari itu, seseorang harus meluangkan waktu untuk menjawab semua email. Hanya sopan untuk merespons pada hari yang sama dan Anda harus melakukannya. Pada siang hari, Anda diperkirakan akan sibuk, jadi luangkan waktu di penghujung hari. Tinjau hari yang baru saja Anda selesaikan dan rencanakan hari berikutnya untuk menjaga kontinuitas dan efisiensi.
Untuk meringkas, 70% dari waktu kerja untuk ilmuwan data masuk ke pengkodean. Saldo 15% masing-masing digunakan untuk rapat dan berpikir, dengan akhir hari disimpan untuk berbagai kegiatan. Ini adalah karir yang bermanfaat yang dicita-citakan banyak orang.
Jika Anda ingin tahu tentang belajar ilmu data untuk menjadi yang terdepan dalam kemajuan teknologi yang bergerak cepat, lihat Program PG Eksekutif upGrad & IIIT-B dalam Ilmu Data dan tingkatkan diri Anda untuk masa depan.