Dovada în cifre: utilizarea datelor mari pentru a genera rezultate

Publicat: 2022-07-22

La un anumit moment al carierei tale ca manager de produs, s-ar putea să te confrunți cu probleme la scară largă care sunt mai puțin definite, implică cauze și zone de impact mai largi și au mai multe soluții. Când vă treziți să lucrați cu seturi de date complexe – când începeți să vă gândiți la cifre de milioane în loc de mii – aveți nevoie de instrumentele potrivite pentru a vă permite să extindeți în același ritm.

Aici managementul produselor bazat pe date poate aduce o valoare extraordinară pentru afaceri. În următoarele exemple, extrase din cazuri din propria mea carieră, aplicarea analizei datelor la probleme aparent insolubile a produs soluții care au adus profituri uriașe pentru angajatorii mei — de la milioane de dolari la sute de milioane.

Dobândirea abilităților de știință a datelor poate ajuta la crearea următoarei căi de creștere în cariera dvs. de management de produs. Veți rezolva problemele mai repede decât colegii dvs., veți transforma informații bazate pe dovezi în profituri dure și veți aduce contribuții uriașe la succesul organizației dvs.

Utilizați date la scară largă

Aplicarea științei datelor în managementul și analiza produselor nu este un concept nou. Ceea ce este nou este cantitatea uluitoare de date la care companiile au acces, fie prin platformele lor, prin software-ul de colectare a datelor sau prin produsele în sine. Și totuși, în 2020, Seagate Technology a raportat că 68% din datele culese de companii nu au efect de levier. O carte albă IBM din 2014 a comparat această risipă de date cu „o fabrică în care cantități mari de materii prime se află neutilizate și împrăștiate în diferite puncte de-a lungul liniei de asamblare”.

Managerii de produs cu abilități de știință a datelor pot valorifica aceste date pentru a obține informații despre valori cheie, cum ar fi activarea, acoperirea, păstrarea, implicarea și generarea de bani. Aceste valori pot fi orientate către o gamă largă de tipuri de produse, cum ar fi comerțul electronic, conținut, API-uri, produse SaaS și aplicații mobile.

Pe scurt, știința datelor se referă mai puțin la datele pe care le adunați și mai mult despre cum și când le utilizați, mai ales atunci când lucrați cu numere noi și de ordin superior.

Sapă în date pentru a găsi cauzele fundamentale

În urmă cu câțiva ani, am lucrat la un furnizor de tehnologie de călătorie cu peste 50.000 de clienți activi în 180 de țări, 3.700 de angajați și venituri anuale de 2,5 miliarde USD. La o corporație de această dimensiune, gestionați echipe mari și cantități masive de informații.

Când am început să lucrez acolo, mi s-a întâmpinat următoarea problemă: În ciuda faptului că aveam foi de parcurs actualizate și întârzierile complete, scorul NPS a scăzut, iar rata clienților a crescut în doi ani. Costurile asociate cu asistența clienților au crescut semnificativ, iar departamentele de asistență se stingeau în mod constant; în acei doi ani, apelurile de asistență s-au dublat de patru ori.

În primele trei luni, am studiat modul în care funcționează afacerea, de la negocierea aprovizionării până la soluționarea reclamațiilor. Am realizat interviuri cu vicepreședintele de produs și echipa ei, am luat legătura cu VP din echipele de vânzări și tehnologie și am vorbit pe larg cu departamentul de asistență pentru clienți. Aceste eforturi au oferit informații utile și au permis echipei mele să dezvolte mai multe ipoteze, dar nu au furnizat date concrete care să le susțină sau să stabilească motive pentru a le respinge. Posibilele explicații pentru nemulțumirea clienților au inclus lipsa de funcții, cum ar fi capacitatea de a edita comenzile după ce au fost plasate; nevoia de produse suplimentare; și asistență tehnică insuficientă și/sau informații despre produs. Dar chiar dacă am putea decide asupra unui singur curs de acțiune, pentru a convinge diferitele departamente să meargă cu ea ar necesita ceva mai ferm decât o posibilitate.

La o companie mai mică, aș fi putut începe prin a efectua interviuri cu clienții. Dar cu o bază de utilizatori finali de sute de mii, această abordare nu a fost nici utilă, nici fezabilă. Deși mi-ar fi dat o mare de opinii – unele valide – trebuia să știu că informațiile cu care lucram reprezentau o tendință mai mare. În schimb, cu sprijinul echipei de business intelligence, am extras toate datele disponibile din call center și departamentele de asistență pentru clienți.

Cazurile de asistență din ultimele șase luni mi-au venit în patru coloane, fiecare cu 130.000 de rânduri. Fiecare rând a reprezentat o solicitare de asistență pentru clienți și fiecare coloană a fost etichetată cu zona cu probleme a clientului, pe măsură ce acesta a progresat prin procesul de îngrijire. Fiecare coloană avea între 11 și 471 de etichete diferite.

O ilustrație intitulată „Date de asistență pentru clienți”. Ilustrația reprezintă 130.000 de rânduri în care au fost documentate datele, cu patru coloane de zone cu probleme, identificate ca prima zonă cu probleme, a doua zonă cu probleme, a treia zonă cu probleme și a patra zonă cu probleme. Numărul de etichete ale zonei cu probleme din fiecare coloană este notat ca 11 etichete, 58 etichete, 344 etichete și, respectiv, 471 etichete. — Date de asistență pentru clienți, cuprinzând 130.000 de cazuri individuale, fiecare cu patru zone cu probleme.

Aplicarea filtrelor și sortarea setului masiv de date nu au dat rezultate concludente. Etichetele individuale ale problemelor au fost inadecvate pentru a surprinde imaginea de ansamblu. Un client ar putea suna inițial pentru a-și reseta parola și, în timp ce acel apel ar fi înregistrat ca atare, o problemă de rădăcină diferită poate deveni evidentă după ce toate cele patru probleme au fost considerate ca un șir. În 130.000 de rânduri cu milioane de șiruri posibile, căutarea modelelor prin revizuirea fiecărui rând individual nu era o opțiune. A devenit clar că identificarea problemei la această scară era mai puțin despre furnizarea de informații despre afaceri și mai comparabilă cu rezolvarea unei probleme de matematică.

Pentru a izola șirurile care apar cel mai frecvent, am folosit eșantionarea probabilitate proporțională cu dimensiunea (PPS). Această metodă stabilește probabilitatea de selecție pentru fiecare element să fie proporțională cu măsura mărimii acestuia. În timp ce matematica a fost complexă, în termeni practici, ceea ce am făcut a fost simplu: am eșantionat cazuri pe baza frecvenței fiecărei etichete din fiecare coloană. O formă de eșantionare în mai multe etape, această metodă ne-a permis să identificăm șiruri de probleme care au prezentat o imagine mai vie a motivului pentru care clienții apelau centrul de asistență. Mai întâi, modelul nostru a identificat cea mai comună etichetă din prima coloană, apoi, în cadrul acelui grup, cea mai comună etichetă din a doua coloană și așa mai departe.

O ilustrație intitulată „Date de asistență pentru clienți după eșantionarea PPS”. Ilustrația reprezintă 130.000 de rânduri în care au fost documentate datele, cu patru coloane de zone cu probleme, identificate ca prima zonă cu probleme, a doua zonă cu probleme, a treia zonă cu probleme și a patra zonă cu probleme. Numărul de etichete ale zonei cu probleme din fiecare coloană este notat ca 11 etichete, 58 etichete, 344 etichete și, respectiv, 471 etichete. În plus, sunt adăugate casete evidențiate pentru a reprezenta identificarea etichetelor frecvente în fiecare zonă cu probleme. — Datele centrului de asistență pentru clienți după aplicarea eșantionării PPS, cu cele mai frecvente șiruri de etichete identificate.

După aplicarea eșantionării PPS, am izolat 2% din cauzele fundamentale, care au reprezentat aproximativ 25% din totalul cazurilor. Acest lucru ne-a permis să aplicăm un algoritm de probabilitate cumulativă, care a relevat că mai mult de 50% din cazuri provin din 10% din cauzele fundamentale.

Această concluzie a confirmat una dintre ipotezele noastre: clienții contactau centrul de apel pentru că nu aveau o modalitate de a modifica datele comenzii odată ce o comandă a fost plasată. Prin remedierea unei singure probleme, clientul ar putea economisi 7 milioane USD în costuri de asistență și poate recupera 200 milioane USD în venituri atribuite retragerii clienților.

Efectuați analize în timp real

Cunoștințele despre învățarea automată au fost deosebit de utile în rezolvarea unei provocări de analiză a datelor la o altă companie de turism de dimensiune similară. Compania a servit ca o legătură între hoteluri și agențiile de turism din întreaga lume prin intermediul unui site web și API-uri. Datorită proliferării metamotoarelor de căutare, cum ar fi Trivago, Kayak și Skyscanner, traficul API a crescut cu trei ordine de mărime. Înainte de proliferarea metacăutărilor, raportul look-to-book (total căutări API la totalul rezervări API) era de 30:1; după ce au început metacăutările, unii clienți ar ajunge la un raport de 30.000:1. În timpul orelor de vârf, compania a trebuit să accepte până la 15.000 de solicitări API pe secundă, fără a sacrifica viteza de procesare. Costurile serverului asociate cu API-ul au crescut în consecință. Dar traficul crescut din aceste servicii nu a avut ca rezultat o creștere a vânzărilor; veniturile au rămas constante, creând o pierdere financiară masivă pentru companie.

Compania avea nevoie de un plan pentru a reduce costurile cu serverele cauzate de creșterea traficului, menținând în același timp experiența clienților. Când compania a încercat să blocheze traficul pentru clienți selectați în trecut, rezultatul a fost PR negativ. Prin urmare, blocarea acestor motoare nu era o opțiune. Echipa mea a apelat la date pentru a găsi o soluție.

Am analizat aproximativ 300 de milioane de solicitări API printr-o serie de parametri: ora solicitării, destinația, datele de check-in/out, lista de hoteluri, numărul de oaspeți și tipul camerei. Din date, am stabilit că anumite modele au fost asociate cu creșterea traficului de metacăutare: ora din zi, numărul de solicitări pe unitate de timp, căutări alfabetice în destinații, liste ordonate pentru hoteluri, fereastră de căutare specifică (date de check-in/out) și configurația oaspeților.

Am aplicat o abordare de învățare automată supravegheată și am creat un algoritm care este similar cu regresia logistică: a calculat o probabilitate pentru fiecare solicitare pe baza etichetelor trimise de client, inclusiv ștampila temporală delta, marca temporală, destinația, hotelul (hotelurile), datele de check-in/out și numărul de oaspeți, precum și etichetele solicitărilor anterioare. În funcție de parametrii dați, algoritmul ar identifica probabilitatea ca o solicitare de server API să fie generată de un om sau de un metamotor. Algoritmul ar rula în timp real pe măsură ce un client ar accesa API-ul. Dacă determina o probabilitate suficient de mare ca cererea să fie condusă de oameni, cererea ar fi trimisă la serverul de mare viteză. Dacă părea a fi o metacăutare, cererea ar fi redirecționată către un server de cache care era mai puțin costisitor de operat. Utilizarea învățării supravegheate ne-a permis să predăm modelul, ceea ce duce la o mai mare acuratețe pe parcursul dezvoltării.

Acest model a oferit flexibilitate, deoarece probabilitatea putea fi adaptată pe client pe baza unor reguli de afaceri mai specifice decât cele pe care le-am folosit anterior (de exemplu, rezervările așteptate pe zi sau nivelul de client). Pentru un anumit client, cererile ar putea fi direcționate în orice punct peste 50% probabilitate, în timp ce pentru clienții mai valoroși, am putea cere mai multă certitudine, direcționându-le atunci când au depășit un prag de 70% probabilitate.

O ilustrație intitulată „Sortarea clienților printr-un algoritm de învățare automată”. Această ilustrație este o diagramă care arată căile posibile după care solicitările sunt sortate în funcție de punctul lor de origine. Începutul diagramei de flux are două origini posibile, „Utilizatori de internet” și „Metacăutări”. Ambele duc la „XML, API Server”. Acest lucru duce la „Căutare naturală?” Dacă rezultatul este „Da”, următorul pas este „Server de mare viteză”. Dacă rezultatul este „Nu”, următorul pas este „Serverul de cache”. După aceasta, ambele sunt conduse înapoi la „XML, API Server”. — Calea prin care cererile au fost sortate fie către serverul de mare viteză, fie către serverul de cache, în funcție de punctul lor de origine.

După implementarea algoritmului de clasificare, compania a redirecționat până la 70% dintre solicitări într-un anumit interval de timp către stiva mai ieftină și a economisit între 5 și 7 milioane USD pe an în costuri de infrastructură. În același timp, compania a satisfăcut baza de clienți prin nerespingerea traficului. A păstrat rata de rezervări, salvând în același timp veniturile.

Utilizați instrumentele potrivite pentru job

Aceste studii de caz demonstrează valoarea utilizării științei datelor pentru a rezolva probleme complexe ale produselor. Dar de unde ar trebui să înceapă călătoria ta în domeniul științei datelor? Este posibil să aveți deja o înțelegere de bază a domeniilor largi de cunoștințe. Știința datelor este o activitate interdisciplinară; ea cuprinde gândirea profund tehnică și conceptuală. Este căsătoria numerelor mari și a ideilor mari. Pentru a începe, va trebui să-ți progresezi abilitățile în:

Programare. Limbajul de interogare structurat, sau SQL, este limbajul de programare standard pentru gestionarea bazelor de date. Python este limbajul standard pentru analiza statistică. În timp ce cele două au funcții care se suprapun, într-un sens foarte simplu, SQL este folosit pentru a prelua și formata date, în timp ce Python este folosit pentru a rula analizele pentru a afla ce vă pot spune datele. Excel, deși nu este la fel de puternic ca SQL și Python, vă poate ajuta să atingeți multe dintre aceleași obiective; probabil că vei fi chemat să-l folosești des.

Cercetare operațională. Odată ce ai rezultatele, atunci ce? Toate informațiile din lume nu sunt de nici un folos dacă nu știi ce să faci cu ea. Cercetarea operațională este un domeniu al matematicii dedicat aplicării metodelor analitice în strategia de afaceri. Știind cum să utilizați cercetarea operațională vă va ajuta să luați decizii de afaceri solide, susținute de date.

Învățare automată. Cu AI în creștere, progresele în învățarea automată au creat noi posibilități pentru analiza predictivă. Utilizarea în afaceri a analizei predictive a crescut de la 23% în 2018 la 59% în 2020, iar piața este de așteptat să înregistreze o creștere anuală compusă de 24,5% până în 2026. Acum este momentul ca managerii de produs să învețe ce este posibil cu această tehnologie.

Vizualizarea datelor. Nu este suficient să-ți înțelegi analizele; aveți nevoie de instrumente precum Tableau, Microsoft Power BI și Qlik Sense pentru a transmite rezultatele într-un format ușor de înțeles pentru părțile interesate non-tehnice.

Este de preferat să dobândiți singur aceste abilități, dar cel puțin ar trebui să aveți familiaritatea necesară pentru a angaja experți și a delega sarcini. Un bun manager de produs ar trebui să cunoască tipurile de analize posibile și întrebările la care pot răspunde. Aceștia ar trebui să înțeleagă cum să comunice întrebări oamenilor de știință de date și cum sunt efectuate analizele și să poată transforma rezultatele în soluții de afaceri.

Folosește puterea de a conduce înapoi

Sondajul executiv de conducere în 2022 al datelor și AI al NewVantage Partners dezvăluie că peste 90% dintre organizațiile participante investesc în inițiative de AI și date. Veniturile generate din big data și analizele de afaceri s-au mai mult decât dublat din 2015. Analiza datelor, cândva o abilitate de specialitate, este acum esențială pentru a oferi răspunsurile potrivite companiilor de pretutindeni.

Un manager de produs este angajat pentru a genera profituri, pentru a determina strategia și pentru a obține cea mai bună muncă de la colegi. Autenticitatea, empatia și alte abilități soft sunt utile în acest sens, dar sunt doar jumătate din ecuație. Pentru a fi un lider în cadrul organizației dvs., aduceți fapte pe masă, nu opinii. Instrumentele pentru a dezvolta perspective bazate pe dovezi nu au fost niciodată mai puternice, iar potențialele profituri nu au fost niciodată mai mari.