พิสูจน์ตัวเลข: การใช้ข้อมูลขนาดใหญ่เพื่อขับเคลื่อนผลลัพธ์
เผยแพร่แล้ว: 2022-07-22เมื่อถึงจุดหนึ่งในอาชีพของคุณในฐานะผู้จัดการผลิตภัณฑ์ คุณอาจประสบปัญหาขนาดใหญ่ที่มีการกำหนดน้อยกว่า เกี่ยวข้องกับสาเหตุและผลกระทบที่กว้างขึ้น และมีมากกว่าหนึ่งวิธีแก้ไข เมื่อคุณพบว่าตัวเองกำลังทำงานกับชุดข้อมูลที่ซับซ้อน—เมื่อคุณเริ่มคิดเกี่ยวกับตัวเลขในหลักล้านแทนที่จะเป็นหลักพัน—คุณต้องการเครื่องมือที่เหมาะสมเพื่อให้คุณสามารถขยายขนาดได้ในอัตราที่เท่ากัน
นี่คือจุดที่การจัดการผลิตภัณฑ์ที่ขับเคลื่อนด้วยข้อมูลสามารถสร้างมูลค่าทางธุรกิจมหาศาลได้ ในตัวอย่างต่อไปนี้ ซึ่งดึงมาจากกรณีต่างๆ ในอาชีพการงานของฉันเอง การใช้การวิเคราะห์ข้อมูลกับปัญหาที่ดูเหมือนยากจะแก้ไขได้ ทำให้เกิดโซลูชันที่สร้างผลตอบแทนมหาศาลให้กับนายจ้างของฉัน ตั้งแต่ล้านดอลลาร์ไปจนถึงหลายร้อยล้าน
การได้มาซึ่งทักษะด้านวิทยาศาสตร์ข้อมูลสามารถช่วยสร้างเส้นทางต่อไปของการเติบโตในอาชีพการจัดการผลิตภัณฑ์ของคุณ คุณจะแก้ปัญหาได้เร็วกว่าเพื่อนร่วมงาน เปลี่ยนข้อมูลเชิงลึกตามหลักฐานเป็นผลตอบแทนจริง และสร้างคุณูปการมหาศาลต่อความสำเร็จขององค์กรของคุณ
ใช้ประโยชน์จากข้อมูลขนาดใหญ่
การใช้วิทยาศาสตร์ข้อมูลในการจัดการผลิตภัณฑ์และการวิเคราะห์ผลิตภัณฑ์ไม่ใช่แนวคิดใหม่ มีอะไรใหม่เป็นจำนวนมหาศาลของข้อมูลที่ธุรกิจเข้าถึงได้ ไม่ว่าจะผ่านทางแพลตฟอร์ม ซอฟต์แวร์รวบรวมข้อมูล หรือตัวผลิตภัณฑ์เอง และในปี 2020 Seagate Technology รายงานว่า 68% ของข้อมูลที่รวบรวมโดยบริษัทต่างๆ ไม่ได้ใช้ประโยชน์ เอกสารไวท์เปเปอร์ของ IBM ปี 2014 เปรียบเทียบการสูญเสียข้อมูลนี้กับ "โรงงานที่มีวัตถุดิบจำนวนมากที่ไม่ได้ใช้งานและเกลื่อนไปตามจุดต่างๆ ตลอดสายการประกอบ"
ผู้จัดการผลิตภัณฑ์ที่มีทักษะด้านวิทยาศาสตร์ข้อมูลสามารถควบคุมข้อมูลนี้เพื่อรับข้อมูลเชิงลึกเกี่ยวกับตัวชี้วัดที่สำคัญ เช่น การเปิดใช้งาน การเข้าถึง การเก็บรักษา การมีส่วนร่วม และการสร้างรายได้ เมตริกเหล่านี้สามารถปรับให้เข้ากับประเภทผลิตภัณฑ์ได้หลากหลาย เช่น อีคอมเมิร์ซ เนื้อหา API ผลิตภัณฑ์ SaaS และแอปบนอุปกรณ์เคลื่อนที่
กล่าวโดยย่อ วิทยาศาสตร์ข้อมูลไม่ค่อยเกี่ยวกับข้อมูลที่คุณรวบรวม และเพิ่มเติมเกี่ยวกับวิธีการและเวลาที่คุณใช้ข้อมูล โดยเฉพาะอย่างยิ่งเมื่อคุณทำงานกับตัวเลขใหม่และลำดับที่สูงกว่า
ขุดลงไปในข้อมูลเพื่อค้นหาสาเหตุที่แท้จริง
เมื่อหลายปีก่อน ฉันทำงานให้กับผู้ให้บริการเทคโนโลยีการเดินทางซึ่งมีลูกค้ามากกว่า 50,000 รายใน 180 ประเทศ พนักงาน 3,700 คน และรายได้ประจำปี 2.5 พันล้านดอลลาร์ ที่บริษัทขนาดนี้ คุณกำลังจัดการทีมขนาดใหญ่และข้อมูลจำนวนมหาศาล
เมื่อฉันเริ่มทำงานที่นั่น ฉันพบปัญหาต่อไปนี้: แม้จะมีแผนงานที่ทันสมัยและงานในมือทั้งหมด แต่คะแนน NPS ก็ลดลงและการเลิกราของลูกค้าก็เพิ่มขึ้นในระยะเวลาสองปี ค่าใช้จ่ายที่เกี่ยวข้องกับการสนับสนุนลูกค้าเพิ่มขึ้นอย่างมากและแผนกสนับสนุนมีการดับเพลิงอย่างต่อเนื่อง ในช่วงสองปีที่ผ่านมา การสนับสนุนการโทรเพิ่มเป็นสี่เท่า
ในช่วงสามเดือนแรกของฉัน ฉันได้ศึกษาวิธีการทำงานของธุรกิจ ตั้งแต่การเจรจาด้านอุปทานไปจนถึงการแก้ปัญหาเรื่องร้องเรียน ฉันได้สัมภาษณ์รองประธานฝ่ายผลิตภัณฑ์และทีมของเธอ ติดต่อกับรองประธานฝ่ายขายและทีมเทคโนโลยี และพูดคุยกับฝ่ายสนับสนุนลูกค้าอย่างกว้างขวาง ความพยายามเหล่านี้ให้ข้อมูลเชิงลึกที่เป็นประโยชน์ และทำให้ทีมของฉันสามารถพัฒนาสมมติฐานได้หลายข้อ แต่ไม่ได้ให้ข้อมูลที่ยากแก่การสำรองหรือสร้างเหตุผลที่จะปฏิเสธ คำอธิบายที่เป็นไปได้สำหรับความไม่พอใจของลูกค้ารวมถึงการขาดคุณสมบัติ เช่น ความสามารถในการแก้ไขคำสั่งซื้อหลังจากที่วางคำสั่งซื้อ ความต้องการผลิตภัณฑ์เสริม และความช่วยเหลือด้านเทคนิคและ/หรือข้อมูลผลิตภัณฑ์ไม่เพียงพอ แต่ถึงแม้เราจะตัดสินใจได้เพียงแนวทางเดียว การเกลี้ยกล่อมให้แผนกต่างๆ ดำเนินการตามนั้น ก็จำเป็นต้องมีบางสิ่งที่แน่วแน่มากกว่าที่จะเป็นไปได้
ที่บริษัทเล็กๆ ฉันอาจเริ่มต้นด้วยการสัมภาษณ์ลูกค้า แต่ด้วยฐานผู้ใช้ปลายทางหลายแสนราย แนวทางนี้ไม่เป็นประโยชน์และไม่สามารถทำได้ แม้ว่าสิ่งนี้จะทำให้ฉันมีความคิดเห็นมากมาย—บางอย่างก็ใช้ได้—ฉันจำเป็นต้องรู้ว่าข้อมูลที่ฉันทำงานด้วยแสดงถึงแนวโน้มที่ใหญ่ขึ้น ด้วยการสนับสนุนจากทีมข่าวกรองธุรกิจ ฉันดึงข้อมูลทั้งหมดที่มีจากคอลเซ็นเตอร์และแผนกสนับสนุนลูกค้า
ประวัติการช่วยเหลือจากหกเดือนก่อนมาถึงฉันในสี่คอลัมน์ แต่ละคอลัมน์มี 130,000 แถว แต่ละแถวแสดงถึงคำขอการสนับสนุนลูกค้า และแต่ละคอลัมน์จะมีป้ายกำกับพื้นที่ปัญหาของลูกค้าขณะที่ดำเนินการผ่านกระบวนการดูแล แต่ละคอลัมน์มีป้ายกำกับที่แตกต่างกันระหว่าง 11 ถึง 471 รายการ
การใช้ตัวกรองและการจัดเรียงชุดข้อมูลขนาดใหญ่ไม่ได้ให้ผลลัพธ์ที่แน่ชัด ป้ายกำกับปัญหาแต่ละรายการไม่เพียงพอในการจับภาพที่ใหญ่ขึ้น ลูกค้าอาจโทรมาเพื่อรีเซ็ตรหัสผ่านในขั้นต้น และในขณะที่การโทรนั้นจะถูกบันทึกเช่นนี้ ปัญหารากที่แตกต่างกันอาจปรากฏชัดหลังจากปัญหาทั้งสี่ถูกพิจารณาว่าเป็นสตริง ใน 130,000 แถวที่มีสตริงที่เป็นไปได้นับล้าน การมองหารูปแบบโดยการตรวจสอบแต่ละแถวนั้นไม่ใช่ตัวเลือก เห็นได้ชัดว่าการระบุปัญหาในระดับนี้ไม่ได้เกี่ยวกับการให้ข้อมูลเชิงลึกทางธุรกิจและเทียบได้กับการแก้ปัญหาทางคณิตศาสตร์มากกว่า
เพื่อแยกสตริงที่เกิดขึ้นบ่อยที่สุด ฉันใช้การสุ่มตัวอย่างความน่าจะเป็นแบบสัดส่วนกับขนาด (PPS) วิธีนี้กำหนดความน่าจะเป็นในการเลือกสำหรับแต่ละองค์ประกอบให้เป็นสัดส่วนกับการวัดขนาด แม้ว่าคณิตศาสตร์จะซับซ้อน แต่ในทางปฏิบัติ สิ่งที่เราทำนั้นเรียบง่าย: เราสุ่มตัวอย่างกรณีต่างๆ ตามความถี่ของแต่ละป้ายกำกับในแต่ละคอลัมน์ รูปแบบของการสุ่มตัวอย่างหลายขั้นตอน วิธีนี้ช่วยให้เราสามารถระบุปัญหาต่างๆ ที่วาดภาพได้ชัดเจนยิ่งขึ้นว่าเหตุใดลูกค้าจึงโทรหาศูนย์สนับสนุน อันดับแรก โมเดลของเราระบุป้ายกำกับที่พบบ่อยที่สุดจากคอลัมน์แรก จากนั้นภายในกลุ่มนั้น ป้ายกำกับที่พบบ่อยที่สุดจากคอลัมน์ที่สอง และอื่นๆ
หลังจากใช้การสุ่มตัวอย่าง PPS เราแยกสาเหตุหลัก 2% ซึ่งคิดเป็นประมาณ 25% ของกรณีทั้งหมด สิ่งนี้ทำให้เราสามารถใช้อัลกอริธึมความน่าจะเป็นสะสม ซึ่งเผยให้เห็นว่ามากกว่า 50% ของกรณีเกิดจาก 10% ของสาเหตุที่แท้จริง
ข้อสรุปนี้ยืนยันหนึ่งในสมมติฐานของเรา: ลูกค้าติดต่อศูนย์บริการเนื่องจากไม่มีวิธีเปลี่ยนข้อมูลคำสั่งซื้อเมื่อมีการสั่งซื้อ ด้วยการแก้ไขปัญหาเพียงปัญหาเดียว ลูกค้าสามารถประหยัดค่าใช้จ่ายในการสนับสนุนได้ 7 ล้านดอลลาร์ และกู้คืนรายได้ 200 ล้านดอลลาร์ที่เกิดจากการเลิกราของลูกค้า
ทำการวิเคราะห์แบบเรียลไทม์
ความรู้เกี่ยวกับแมชชีนเลิร์นนิงมีประโยชน์อย่างยิ่งในการแก้ปัญหาการวิเคราะห์ข้อมูลที่บริษัทท่องเที่ยวอื่นที่มีขนาดใกล้เคียงกัน บริษัททำหน้าที่เป็นผู้ประสานงานระหว่างโรงแรมและตัวแทนการท่องเที่ยวทั่วโลกผ่านทางเว็บไซต์และ API เนื่องจากการแพร่กระจายของ metasearch engine เช่น Trivago, Kayak และ Skyscanner การรับส่งข้อมูล API เพิ่มขึ้นสามลำดับความสำคัญ ก่อนการแพร่กระจาย metasearch อัตราส่วนการมองต่อหนังสือ (การค้นหา API ทั้งหมดต่อการจอง API ทั้งหมด) คือ 30:1; หลังจากการค้นหาเมตาเริ่มต้น ลูกค้าบางรายจะมีอัตราส่วนถึง 30,000:1 ในช่วงชั่วโมงเร่งด่วน บริษัทต้องรองรับคำขอ API ได้มากถึง 15,000 คำขอต่อวินาทีโดยไม่ลดความเร็วในการประมวลผล ค่าใช้จ่ายเซิร์ฟเวอร์ที่เกี่ยวข้องกับ API เพิ่มขึ้นตามลำดับ แต่การเข้าชมที่เพิ่มขึ้นจากบริการเหล่านี้ไม่ได้ส่งผลให้ยอดขายเพิ่มขึ้น รายได้ยังคงไม่เปลี่ยนแปลง สร้างความสูญเสียทางการเงินมหาศาลให้กับบริษัท
บริษัทต้องการแผนในการลดต้นทุนเซิร์ฟเวอร์ที่เกิดจากการรับส่งข้อมูลที่เพิ่มขึ้น ในขณะที่ยังคงรักษาประสบการณ์ของลูกค้าไว้ เมื่อบริษัทพยายามปิดกั้นทราฟฟิกของลูกค้าบางรายในอดีต ผลลัพธ์คือ PR ติดลบ ดังนั้นการบล็อกเครื่องมือเหล่านี้จึงไม่ใช่ทางเลือก ทีมของฉันหันไปใช้ข้อมูลเพื่อค้นหาวิธีแก้ปัญหา
เราวิเคราะห์คำขอ API ประมาณ 300 ล้านรายการตามชุดพารามิเตอร์: เวลาของคำขอ ปลายทาง วันที่เช็คอิน/เช็คเอาท์ รายชื่อโรงแรม จำนวนผู้เข้าพัก และประเภทห้อง จากข้อมูล เราพิจารณาว่ารูปแบบบางอย่างเกี่ยวข้องกับปริมาณการค้นหาเมตาที่เพิ่มขึ้น: ช่วงเวลาของวัน จำนวนคำขอต่อหน่วยเวลา การค้นหาตามตัวอักษรในจุดหมายปลายทาง รายการที่เรียงลำดับสำหรับโรงแรม หน้าต่างการค้นหาเฉพาะ (วันที่เช็คอิน/เช็คเอาท์) และ การกำหนดค่าแขก
เราใช้แนวทางการเรียนรู้ของเครื่องภายใต้การดูแล และสร้างอัลกอริทึมที่คล้ายกับการถดถอยโลจิสติก: โดยคำนวณความน่าจะเป็นสำหรับแต่ละคำขอตามแท็กที่ส่งโดยลูกค้า รวมถึงการประทับเวลาเดลต้า การประทับเวลา ปลายทาง โรงแรม วันที่เช็คอิน/เช็คเอาท์ จำนวนผู้เข้าพัก รวมทั้งแท็กของคำขอก่อนหน้า อัลกอริธึมจะระบุความน่าจะเป็นที่คำขอของเซิร์ฟเวอร์ API ถูกสร้างขึ้นโดยมนุษย์หรือโดยกลไกค้นหาเมตา ทั้งนี้ขึ้นอยู่กับพารามิเตอร์ที่กำหนด อัลกอริทึมจะทำงานแบบเรียลไทม์เมื่อไคลเอ็นต์เข้าถึง API หากกำหนดความเป็นไปได้สูงเพียงพอที่คำขอนั้นขับเคลื่อนโดยมนุษย์ คำขอจะถูกส่งไปยังเซิร์ฟเวอร์ความเร็วสูง หากดูเหมือนว่าเป็นการค้นหาเมตา คำขอจะถูกเปลี่ยนเส้นทางไปยังเซิร์ฟเวอร์แคชที่มีราคาไม่แพงในการดำเนินการ การใช้การเรียนรู้ภายใต้การดูแลทำให้เราสามารถสอนแบบจำลองได้ นำไปสู่ความแม่นยำที่มากขึ้นในระหว่างการพัฒนา
โมเดลนี้ให้ความยืดหยุ่นเนื่องจากความน่าจะเป็นสามารถปรับได้ต่อลูกค้าหนึ่งรายตามกฎทางธุรกิจที่เฉพาะเจาะจงมากกว่าที่เราใช้ก่อนหน้านี้ (เช่น การจองที่คาดหวังต่อวันหรือระดับลูกค้า) สำหรับลูกค้าเฉพาะราย คำขออาจถูกส่งไปยังจุดใดก็ได้ที่สูงกว่าความน่าจะเป็น 50% ในขณะที่สำหรับลูกค้าที่มีคุณค่ามากขึ้น เราอาจต้องการความมั่นใจมากขึ้น โดยส่งคำขอเมื่อพวกเขาผ่านเกณฑ์ความน่าจะเป็น 70%
หลังจากใช้อัลกอริธึมการจำแนกประเภทแล้ว บริษัทได้เปลี่ยนเส้นทางมากถึง 70% ของคำขอภายในกรอบเวลาที่กำหนดไปยังสแต็กที่ถูกกว่า และช่วยประหยัดค่าใช้จ่ายด้านโครงสร้างพื้นฐานได้ประมาณ 5 ล้านถึง 7 ล้านดอลลาร์ต่อปี ในขณะเดียวกัน บริษัทก็สร้างความพึงพอใจให้กับฐานลูกค้าโดยไม่ปฏิเสธการรับส่งข้อมูล มันรักษาอัตราส่วนการจองในขณะที่ปกป้องรายได้
ใช้เครื่องมือที่เหมาะสมสำหรับงาน
กรณีศึกษาเหล่านี้แสดงให้เห็นถึงคุณค่าของการใช้วิทยาศาสตร์ข้อมูลเพื่อแก้ปัญหาผลิตภัณฑ์ที่ซับซ้อน แต่การเดินทางด้านวิทยาศาสตร์ข้อมูลของคุณควรเริ่มต้นที่ไหน เป็นไปได้ว่าคุณมีความเข้าใจพื้นฐานในด้านความรู้ในวงกว้างอยู่แล้ว วิทยาศาสตร์ข้อมูลเป็นกิจกรรมสหวิทยาการ มันครอบคลุมการคิดเชิงเทคนิคและเชิงแนวคิดอย่างลึกซึ้ง เป็นการแต่งงานของคนจำนวนมากและความคิดที่ยิ่งใหญ่ ในการเริ่มต้น คุณจะต้องพัฒนาทักษะของคุณใน:
การเขียนโปรแกรม ภาษาคิวรีที่มีโครงสร้างหรือ SQL เป็นภาษาโปรแกรมมาตรฐานสำหรับการจัดการฐานข้อมูล Python เป็นภาษามาตรฐานสำหรับการวิเคราะห์ทางสถิติ ในขณะที่ทั้งสองมีฟังก์ชันที่ทับซ้อนกัน ในความหมายพื้นฐานแล้ว SQL ถูกใช้เพื่อดึงและจัดรูปแบบข้อมูล ในขณะที่ Python ใช้เพื่อเรียกใช้การวิเคราะห์เพื่อค้นหาว่าข้อมูลสามารถบอกอะไรคุณได้ แม้ว่า Excel จะไม่มีประสิทธิภาพเท่ากับ SQL และ Python แต่ก็สามารถช่วยให้คุณบรรลุเป้าหมายเดียวกันได้หลายอย่าง คุณมักจะถูกเรียกให้ใช้บ่อยๆ
การวิจัยการดำเนินงาน. เมื่อคุณได้ผลลัพธ์แล้วจะเป็นอย่างไร? ข้อมูลทั้งหมดในโลกนี้ไม่มีประโยชน์หากคุณไม่รู้ว่าจะทำอย่างไรกับมัน การวิจัยการดำเนินงานเป็นสาขาวิชาคณิตศาสตร์ที่เน้นการใช้วิธีการวิเคราะห์กับกลยุทธ์ทางธุรกิจ การรู้วิธีใช้การวิจัยการดำเนินงานจะช่วยให้คุณตัดสินใจทางธุรกิจได้ดีโดยมีข้อมูลสนับสนุน
การเรียนรู้ของเครื่อง ด้วย AI ที่เพิ่มขึ้น ความก้าวหน้าในการเรียนรู้ของเครื่องได้สร้างความเป็นไปได้ใหม่ๆ สำหรับการวิเคราะห์เชิงคาดการณ์ การใช้การวิเคราะห์เชิงคาดการณ์ของธุรกิจเพิ่มขึ้นจาก 23% ในปี 2018 เป็น 59% ในปี 2020 และคาดว่าตลาดจะมีการเติบโตแบบทบต้น 24.5% ต่อปีจนถึงปี 2026 ถึงเวลาแล้วที่ผู้จัดการผลิตภัณฑ์จะต้องเรียนรู้ว่าเทคโนโลยีนี้ทำอะไรได้บ้าง
การแสดงข้อมูล การเข้าใจการวิเคราะห์ของคุณไม่เพียงพอ คุณต้องการเครื่องมือเช่น Tableau, Microsoft Power BI และ Qlik Sense เพื่อถ่ายทอดผลลัพธ์ในรูปแบบที่ง่ายสำหรับผู้มีส่วนได้ส่วนเสียที่ไม่ใช่ด้านเทคนิคที่จะเข้าใจ
จะดีกว่าถ้าได้ทักษะเหล่านี้ด้วยตัวเอง แต่อย่างน้อย คุณควรมีความคุ้นเคยที่จำเป็นในการจ้างผู้เชี่ยวชาญและมอบหมายงาน ผู้จัดการผลิตภัณฑ์ที่ดีควรทราบประเภทของการวิเคราะห์ที่เป็นไปได้และคำถามที่สามารถช่วยตอบได้ พวกเขาควรมีความเข้าใจในการสื่อสารคำถามกับนักวิทยาศาสตร์ข้อมูลและวิธีดำเนินการวิเคราะห์ และสามารถเปลี่ยนผลลัพธ์เป็นโซลูชันทางธุรกิจได้
ใช้อำนาจในการขับเคลื่อนผลตอบแทน
แบบสำรวจ 2022 Data and AI Leadership Executive ของ NewVantage Partners เปิดเผยว่ากว่า 90% ขององค์กรที่เข้าร่วมกำลังลงทุนในโครงการริเริ่มด้าน AI และข้อมูล รายได้ที่เกิดจากบิ๊กดาต้าและการวิเคราะห์ธุรกิจเพิ่มขึ้นกว่าเท่าตัวตั้งแต่ปี 2015 การวิเคราะห์ข้อมูลซึ่งครั้งหนึ่งเคยเป็นทักษะเฉพาะทางเป็นสิ่งสำคัญในการให้คำตอบที่ถูกต้องแก่บริษัททุกที่
ผู้จัดการผลิตภัณฑ์ได้รับการว่าจ้างให้ผลักดันผลตอบแทน กำหนดกลยุทธ์ และดึงเอาผลงานที่ดีที่สุดจากเพื่อนร่วมงาน ความถูกต้อง การเอาใจใส่ และทักษะด้านอารมณ์อื่นๆ มีประโยชน์ในเรื่องนี้ แต่สิ่งเหล่านี้เป็นเพียงครึ่งหนึ่งของสมการเท่านั้น ในการเป็นผู้นำในองค์กรของคุณ ให้นำข้อเท็จจริงมาที่โต๊ะ ไม่ใช่ความคิดเห็น เครื่องมือในการพัฒนาข้อมูลเชิงลึกที่อิงตามหลักฐานไม่เคยมีประสิทธิภาพเท่านี้มาก่อน และผลตอบแทนที่เป็นไปได้ก็ไม่เคยยิ่งใหญ่เท่านี้มาก่อน