الإثبات بالأرقام: استخدام البيانات الضخمة لتحقيق النتائج

نشرت: 2022-07-22

في مرحلة معينة من حياتك المهنية كمدير منتج ، قد تواجه مشكلات واسعة النطاق تكون أقل تحديدًا ، وتتضمن أسبابًا أوسع ومجالات تأثير ، ولديك أكثر من حل واحد. عندما تجد نفسك تعمل مع مجموعات البيانات المعقدة - عندما تبدأ في التفكير في الأرقام بالملايين بدلاً من الآلاف - فأنت بحاجة إلى الأدوات المناسبة لتمكينك من التوسع بنفس المعدل.

هذا هو المكان الذي يمكن أن تحقق فيه إدارة المنتجات المستندة إلى البيانات قيمة تجارية هائلة. في الأمثلة التالية ، المستمدة من حالات في حياتي المهنية ، أدى تطبيق تحليلات البيانات على مشكلات تبدو مستعصية إلى حلولا جلبت عوائد ضخمة لأصحاب العمل - تتراوح من ملايين الدولارات إلى مئات الملايين.

يمكن أن يساعد اكتساب مهارات علوم البيانات في تشكيل المسار التالي للنمو في حياتك المهنية في إدارة المنتجات. ستحل المشكلات بشكل أسرع من زملائك ، وتحول الرؤى المستندة إلى الأدلة إلى عوائد صعبة ، وتقدم مساهمات ضخمة في نجاح مؤسستك.

الاستفادة من البيانات واسعة النطاق

إن تطبيق علم البيانات في إدارة المنتجات وتحليلات المنتج ليس مفهومًا جديدًا. الجديد هو الكم الهائل من البيانات التي يمكن للشركات الوصول إليها ، سواء من خلال منصاتها أو برامج جمع البيانات أو المنتجات نفسها. ومع ذلك ، في عام 2020 ، ذكرت Seagate Technology أن 68٪ من البيانات التي تجمعها الشركات لا يتم استغلالها بالديون. قارن مستند تقني لشركة IBM عام 2014 نفايات البيانات هذه بـ "مصنع توجد فيه كمية (كميات) كبيرة من المواد الخام غير مستخدمة ومتناثرة في نقاط مختلفة على طول خط التجميع".

يمكن لمديري المنتجات الذين يتمتعون بمهارات علوم البيانات الاستفادة من هذه البيانات لاكتساب رؤى حول المقاييس الرئيسية مثل التنشيط والوصول والاحتفاظ والمشاركة وتحقيق الدخل. يمكن توجيه هذه المقاييس نحو مجموعة من أنواع المنتجات ، مثل التجارة الإلكترونية والمحتوى وواجهات برمجة التطبيقات ومنتجات SaaS وتطبيقات الأجهزة المحمولة.

باختصار ، لا يتعلق علم البيانات بالبيانات التي تجمعها بقدر ما يتعلق بكيفية ووقت استخدامها ، خاصةً عندما تعمل بأرقام جديدة وذات ترتيب أعلى.

حفر في البيانات للعثور على الأسباب الجذرية

منذ عدة سنوات ، عملت في مزود تكنولوجيا السفر مع أكثر من 50000 عميل نشط في 180 دولة ، و 3700 موظف ، وعائدات سنوية تبلغ 2.5 مليار دولار. في شركة بهذا الحجم ، أنت تدير فرقًا كبيرة وكميات هائلة من المعلومات.

عندما بدأت العمل هناك ، واجهت المشكلة التالية: على الرغم من وجود خرائط طريق محدثة وتراكم كامل ، فقد انخفضت درجة NPS وزاد اضطراب العملاء على مدار عامين. نمت التكاليف المرتبطة بدعم العملاء بشكل كبير وكانت أقسام الدعم تعمل على مكافحة الحرائق باستمرار ؛ خلال هذين العامين ، تضاعفت مكالمات الدعم أربع مرات.

في الأشهر الثلاثة الأولى لي ، درست كيفية عمل الشركة ، من مفاوضات التوريد إلى حل الشكوى. لقد أجريت مقابلات مع نائب رئيس المنتج وفريقها ، وتواصلت مع نواب الرئيس من فرق المبيعات والتكنولوجيا ، وتحدثت على نطاق واسع مع قسم دعم العملاء. أسفرت هذه الجهود عن رؤى مفيدة وسمحت لفريقي بتطوير عدة فرضيات - لكنها لم تقدم بيانات صلبة لدعمها أو إنشاء أسس لرفضها. تضمنت التفسيرات المحتملة لعدم رضا العملاء الافتقار إلى الميزات ، مثل القدرة على تحرير الطلبات بعد وضعها ؛ الحاجة إلى المنتجات الإضافية ؛ وعدم كفاية المساعدة الفنية و / أو معلومات المنتج. ولكن حتى لو تمكنا من اتخاذ قرار بشأن مسار عمل واحد ، فإن إقناع الأقسام المختلفة بالموافقة عليه سيتطلب شيئًا أقوى من الاحتمال.

في شركة أصغر ، ربما أبدأ بإجراء مقابلات مع العملاء. ولكن مع وجود قاعدة المستخدمين النهائيين في مئات الآلاف ، لم يكن هذا النهج مفيدًا ولا ممكنًا. بينما كان من الممكن أن يمنحني بحرًا من الآراء - بعضها صحيح - كنت بحاجة إلى معرفة أن المعلومات التي كنت أعمل بها تمثل اتجاهًا أكبر. بدلاً من ذلك ، وبدعم من فريق ذكاء الأعمال ، قمت بسحب جميع البيانات المتاحة من مركز الاتصال وإدارات دعم العملاء.

جاءت حالات الدعم من الأشهر الستة الماضية في أربعة أعمدة ، كل منها يحتوي على 130.000 صف. يمثل كل صف طلب دعم العملاء ، وتم تمييز كل عمود بمنطقة مشكلة العميل أثناء تقدمهم خلال عملية الرعاية. كان لكل عمود ما بين 11 و 471 تسمية مختلفة.

رسم توضيحي بعنوان "بيانات دعم العملاء". يمثل الرسم التوضيحي 130.000 صف تم فيه توثيق البيانات ، مع أربعة أعمدة من مناطق المشكلة ، والتي تم تحديدها كمنطقة المشكلة الأولى ، ومنطقة المشكلة الثانية ، ومنطقة المشكلة الثالثة ، ومنطقة المشكلة الرابعة. تم تدوين عدد تسميات منطقة المشكلة في كل عمود على أنها 11 تسمية و 58 تسمية و 344 تسمية و 471 تسمية على التوالي. — بيانات دعم العملاء ، وتضم 130.000 حالة فردية ، لكل منها أربعة مجالات مشكلة.

لم يؤد تطبيق المرشحات وفرز مجموعة البيانات الضخمة إلى نتائج حاسمة. كانت تسميات المشكلات الفردية غير كافية في التقاط الصورة الأكبر. قد يتصل العميل في البداية لإعادة تعيين كلمة المرور الخاصة به ، وبينما يتم تسجيل هذه المكالمة على هذا النحو ، قد تظهر مشكلة جذر مختلفة بعد اعتبار جميع المشكلات الأربع كسلسلة. في 130.000 صف بملايين السلاسل الممكنة ، لم يكن البحث عن أنماط من خلال مراجعة كل صف على حدة خيارًا. أصبح من الواضح أن تحديد المشكلة على هذا المقياس لا يتعلق بتوفير رؤية تجارية وأكثر قابلية للمقارنة لحل مشكلة الرياضيات.

من أجل عزل السلاسل الأكثر تكرارا ، استخدمت أخذ العينات الاحتمالية المتناسبة مع الحجم (PPS). تحدد هذه الطريقة احتمالية الاختيار لكل عنصر ليكون متناسبًا مع قياس حجمه. بينما كانت الرياضيات معقدة ، من الناحية العملية ، كان ما فعلناه بسيطًا: أخذنا عينات من الحالات بناءً على تكرار كل تسمية في كل عمود. شكل من أشكال أخذ العينات متعدد المراحل ، سمحت لنا هذه الطريقة بتحديد سلاسل المشاكل التي رسمت صورة أكثر وضوحًا عن سبب اتصال العملاء بمركز الدعم. أولاً ، حدد نموذجنا التسمية الأكثر شيوعًا من العمود الأول ، ثم ضمن تلك المجموعة ، التسمية الأكثر شيوعًا من العمود الثاني ، وهكذا.

رسم توضيحي بعنوان "بيانات دعم العملاء بعد أخذ عينات PPS." يمثل الرسم التوضيحي 130.000 صف تم فيه توثيق البيانات ، مع أربعة أعمدة من مناطق المشكلة ، والتي تم تحديدها كمنطقة المشكلة الأولى ، ومنطقة المشكلة الثانية ، ومنطقة المشكلة الثالثة ، ومنطقة المشكلة الرابعة. تم تدوين عدد تسميات منطقة المشكلة في كل عمود على أنها 11 تسمية و 58 تسمية و 344 تسمية و 471 تسمية على التوالي. بالإضافة إلى ذلك ، تتم إضافة المربعات المميزة لتمثيل تحديد التسميات الشائعة الحدوث داخل كل منطقة مشكلة. — بيانات مركز دعم العملاء بعد تطبيق أخذ عينات PPS ، مع تحديد سلاسل التسمية الأكثر شيوعًا.

بعد تطبيق أخذ عينات PPS ، قمنا بعزل 2٪ من الأسباب الجذرية ، والتي تمثل ما يقرب من 25٪ من إجمالي الحالات. سمح لنا ذلك بتطبيق خوارزمية الاحتمالية التراكمية ، والتي كشفت أن أكثر من 50٪ من الحالات نشأت من 10٪ من الأسباب الجذرية.

أكد هذا الاستنتاج إحدى فرضياتنا: كان العملاء يتصلون بمركز الاتصال لأنه لم يكن لديهم طريقة لتغيير بيانات الطلب بمجرد تقديم الطلب. من خلال إصلاح مشكلة واحدة ، يمكن للعميل توفير 7 ملايين دولار في تكاليف الدعم واسترداد 200 مليون دولار من الإيرادات المنسوبة إلى تضخم العملاء.

إجراء التحليل في الوقت الفعلي

كانت معرفة التعلم الآلي مفيدة بشكل خاص في حل تحدي تحليل البيانات في شركة سفر أخرى ذات حجم مماثل. عملت الشركة كحلقة وصل بين الفنادق ووكالات السفر حول العالم عبر موقع الويب وواجهات برمجة التطبيقات. نظرًا لانتشار محركات البحث metasearch ، مثل Trivago و Kayak و Skyscanner ، نمت حركة مرور واجهة برمجة التطبيقات بثلاث مرات من حيث الحجم. قبل انتشار metasearch ، كانت نسبة البحث إلى الكتاب (إجمالي عمليات البحث في API إلى إجمالي حجوزات API) 30: 1 ؛ بعد بدء عمليات البحث الوصفية ، سيصل بعض العملاء إلى نسبة 30،000: 1. خلال ساعات الذروة ، كان على الشركة استيعاب ما يصل إلى 15000 طلب واجهة برمجة تطبيقات في الثانية دون التضحية بسرعة المعالجة. زادت تكاليف الخادم المرتبطة بواجهة برمجة التطبيقات وفقًا لذلك. لكن زيادة حركة المرور من هذه الخدمات لم تؤد إلى ارتفاع في المبيعات ؛ ظلت الإيرادات ثابتة ، مما تسبب في خسارة مالية هائلة للشركة.

احتاجت الشركة إلى خطة لتقليل تكاليف الخادم الناتجة عن زيادة حركة المرور ، مع الحفاظ على تجربة العملاء. عندما حاولت الشركة منع حركة المرور لعملاء محددين في الماضي ، كانت النتيجة علاقات عامة سلبية. لذلك لم يكن حظر هذه المحركات خيارًا. لجأ فريقي إلى البيانات لإيجاد حل.

قمنا بتحليل ما يقرب من 300 مليون طلب واجهة برمجة تطبيقات عبر سلسلة من المعلمات: وقت الطلب ، والوجهة ، وتواريخ تسجيل الوصول / المغادرة ، وقائمة الفنادق ، وعدد الضيوف ، ونوع الغرفة. من البيانات ، قررنا أن أنماطًا معينة كانت مرتبطة بالارتفاعات الحادة في حركة مرور البيانات الوصفية: الوقت من اليوم ، وعدد الطلبات لكل وحدة زمنية ، وعمليات البحث الأبجدية في الوجهات ، والقوائم المطلوبة للفنادق ، ونافذة البحث المحددة (مواعيد تسجيل الوصول / المغادرة) ، و تكوين الضيف.

طبقنا نهج التعلم الآلي الخاضع للإشراف وأنشأنا خوارزمية مشابهة للانحدار اللوجستي: لقد حسبنا احتمالًا لكل طلب بناءً على العلامات التي أرسلها العميل ، بما في ذلك طابع دلتا الزمني ، والطابع الزمني ، والوجهة ، والفندق (الفنادق) ، مواعيد تسجيل الوصول / المغادرة وعدد الضيوف بالإضافة إلى بطاقات الطلبات السابقة. اعتمادًا على المعلمات المحددة ، ستحدد الخوارزمية احتمالية إنشاء طلب خادم واجهة برمجة التطبيقات بواسطة إنسان أو بواسطة محرك بحث ميت. ستعمل الخوارزمية في الوقت الفعلي عندما يصل العميل إلى واجهة برمجة التطبيقات. إذا حددت احتمالية عالية بما يكفي أن يكون الطلب مدفوعًا بشريًا ، فسيتم إرسال الطلب إلى الخادم عالي السرعة. إذا بدا أنه بحث ميت ، فسيتم تحويل الطلب إلى خادم التخزين المؤقت الذي كان تشغيله أقل تكلفة. سمح لنا استخدام التعلم الخاضع للإشراف بتدريس النموذج ، مما أدى إلى مزيد من الدقة خلال مسار التطوير.

قدم هذا النموذج المرونة لأنه يمكن تكييف الاحتمالية لكل عميل بناءً على قواعد عمل أكثر تحديدًا من تلك التي استخدمناها سابقًا (على سبيل المثال ، الحجوزات المتوقعة في اليوم أو فئة العميل). بالنسبة لعميل معين ، يمكن توجيه الطلبات إلى أي نقطة أعلى من احتمالية 50٪ ، بينما بالنسبة للعملاء الأكثر قيمة ، قد نطلب مزيدًا من اليقين ، وتوجيههم عند تجاوزهم عتبة احتمال 70٪.

رسم توضيحي بعنوان "فرز العملاء عبر خوارزمية التعلم الآلي". هذا الرسم التوضيحي عبارة عن مخطط انسيابي يوضح المسارات المحتملة التي يتم من خلالها فرز الطلبات بناءً على نقطة الأصل. بداية المخطط الانسيابي لها أصلان محتملان ، "مستخدمو الإنترنت" و "عمليات البحث Metasearch". كلاهما يؤدي إلى "XML ، خادم API". يؤدي هذا إلى "البحث الطبيعي؟" إذا كانت النتيجة "نعم" ، فإن الخطوة التالية هي "خادم عالي السرعة". إذا كانت النتيجة "لا" ، فإن الخطوة التالية هي "خادم التخزين المؤقت". بعد ذلك ، يتم إرجاع كلاهما إلى "XML ، خادم API". — المسار الذي تم من خلاله فرز الطلبات إلى الخادم عالي السرعة أو خادم التخزين المؤقت ، اعتمادًا على نقطة الأصل.

بعد تنفيذ خوارزمية التصنيف ، حولت الشركة ما يصل إلى 70٪ من الطلبات ضمن إطار زمني معين إلى المجموعة الأرخص ثمناً ووفرت ما يقدر بنحو 5 ملايين دولار إلى 7 ملايين دولار سنويًا في تكاليف البنية التحتية. في الوقت نفسه ، قامت الشركة بإرضاء قاعدة العملاء من خلال عدم رفض حركة المرور. لقد حافظت على نسبة الحجز مع الحفاظ على الإيرادات.

استخدم الأدوات المناسبة للوظيفة

توضح دراسات الحالة هذه قيمة استخدام علم البيانات لحل مشكلات المنتجات المعقدة. ولكن من أين يجب أن تبدأ رحلتك في علم البيانات؟ هناك احتمالات ، لديك بالفعل فهم أساسي لمجالات المعرفة الواسعة. علم البيانات هو نشاط متعدد التخصصات. إنه يشمل التفكير التقني والمفاهيمي بعمق. إنه زواج الأعداد الكبيرة والأفكار الكبيرة. للبدء ، ستحتاج إلى تطوير مهاراتك في:

برمجة. لغة الاستعلام الهيكلية ، أو SQL ، هي لغة البرمجة القياسية لإدارة قواعد البيانات. Python هي اللغة القياسية للتحليل الإحصائي. بينما يحتوي الاثنان على وظائف متداخلة ، بالمعنى الأساسي للغاية ، يتم استخدام SQL لاسترداد البيانات وتنسيقها ، بينما يتم استخدام Python لتشغيل التحليلات لمعرفة ما يمكن أن تخبرك به البيانات. على الرغم من أن Excel ليس بنفس قوة SQL و Python ، إلا أنه يمكن أن يساعدك في تحقيق العديد من نفس الأهداف ؛ من المحتمل أن تتم مطالبتك باستخدامه كثيرًا.

بحوث العمليات. بمجرد حصولك على نتائجك ، ماذا بعد ذلك؟ لا فائدة من جميع المعلومات الموجودة في العالم إذا كنت لا تعرف ماذا تفعل بها. أبحاث العمليات هي مجال من مجالات الرياضيات مكرس لتطبيق الأساليب التحليلية على إستراتيجية العمل. ستساعدك معرفة كيفية استخدام أبحاث العمليات على اتخاذ قرارات عمل سليمة مدعومة بالبيانات.

التعلم الالي. مع تنامي الذكاء الاصطناعي ، خلقت التطورات في التعلم الآلي إمكانيات جديدة للتحليلات التنبؤية. ارتفع استخدام الأعمال للتحليلات التنبؤية من 23٪ في 2018 إلى 59٪ في 2020 ، ومن المتوقع أن يشهد السوق نموًا سنويًا مركبًا بنسبة 24.5٪ حتى عام 2026. حان الوقت الآن لمديري المنتجات لمعرفة ما هو ممكن مع التكنولوجيا.

عرض مرئي للمعلومات. لا يكفي أن تفهم تحليلاتك ؛ أنت بحاجة إلى أدوات مثل Tableau و Microsoft Power BI و Qlik Sense لنقل النتائج بتنسيق يسهل على أصحاب المصلحة غير التقنيين فهمه.

من الأفضل أن تكتسب هذه المهارات بنفسك ، ولكن على الأقل يجب أن تكون لديك الألفة اللازمة لتوظيف الخبراء وتفويض المهام. يجب أن يعرف مدير المنتج الجيد أنواع التحليلات الممكنة والأسئلة التي يمكنه المساعدة في الإجابة عليها. يجب أن يكون لديهم فهم لكيفية توصيل الأسئلة لعلماء البيانات وكيفية إجراء التحليلات ، وأن يكونوا قادرين على تحويل النتائج إلى حلول أعمال.

استخدم القوة لدفع العوائد

كشفت دراسة NewVantage Partners التنفيذية لقيادة البيانات والذكاء الاصطناعي لعام 2022 أن أكثر من 90٪ من المؤسسات المشاركة تستثمر في مبادرات الذكاء الاصطناعي والبيانات. تضاعفت الإيرادات المتأتية من البيانات الضخمة وتحليلات الأعمال منذ عام 2015. تحليل البيانات ، الذي كان في يوم من الأيام مهارة متخصصة ، أصبح الآن ضروريًا لتوفير الإجابات الصحيحة للشركات في كل مكان.

يتم تعيين مدير منتج لتحقيق العوائد وتحديد الإستراتيجية واستخلاص أفضل عمل من الزملاء. الأصالة والتعاطف والمهارات اللينة الأخرى مفيدة في هذا الصدد ، لكنها نصف المعادلة فقط. لكي تكون قائدًا داخل مؤسستك ، اطرح الحقائق على الطاولة وليس الآراء. لم تكن أدوات تطوير الرؤى المستندة إلى الأدلة أقوى من أي وقت مضى ، ولم تكن العوائد المحتملة أكبر من أي وقت مضى.