数字の証明:ビッグデータを使用して結果を促進する

公開: 2022-07-22

プロダクトマネージャーとしてのキャリアのある時点で、定義が不十分で、より広範な原因と影響領域を含み、複数の解決策がある大規模な問題に直面する可能性があります。 複雑なデータセットを使用していることに気付いたとき(数千ではなく数百万の数について考え始めたとき)、同じ速度でスケールアップできる適切なツールが必要です。

これは、データ駆動型の製品管理が途方もないビジネス価値を生み出すことができる場所です。 次の例では、私自身のキャリアの事例から引用し、一見手に負えない問題にデータ分析を適用することで、数百万ドルから数億ドルに及ぶ莫大な利益を雇用主にもたらすソリューションを生み出しました。

データサイエンスのスキルを習得することで、製品管理のキャリアにおける次の成長の道を切り開くことができます。 同僚よりも早く問題を解決し、証拠に基づく洞察をハードリターンに変え、組織の成功に多大な貢献をします。

大規模なデータを活用する

製品管理と製品分析にデータサイエンスを適用することは新しい概念ではありません。 新しいのは、プラットフォーム、データ収集ソフトウェア、または製品自体のいずれを介しても、企業がアクセスできる膨大な量のデータです。 それでも2020年に、シーゲイトテクノロジーは、企業が収集したデータの68%がレバレッジなしになると報告しました。 2014年のIBMホワイトペーパーでは、このデータの無駄を「大量の原材料が未使用で、組立ラインのさまざまな場所に散らばっている工場」と比較しています。

データサイエンスのスキルを持つプロダクトマネージャーは、このデータを利用して、アクティベーション、リーチ、保持、エンゲージメント、収益化などの主要な指標に関する洞察を得ることができます。 これらの指標は、eコマース、コンテンツ、API、SaaS製品、モバイルアプリなどのさまざまな製品タイプに合わせて調整できます。

つまり、データサイエンスとは、収集するデータではなく、データをいつどのように使用するかということです。特に、新しい高次の数値を扱う場合はそうです。

データを掘り下げて根本原因を見つける

数年前、私は180か国に50,000人以上のアクティブなクライアント、3,700人の従業員、25億ドルの年間収益を持つ旅行テクノロジープロバイダーで働いていました。 この規模の企業では、大規模なチームと大量の情報を管理しています。

そこで働き始めたとき、次の問題が発生しました。最新のロードマップと完全なバックログがあるにもかかわらず、NPSスコアが低下し、顧客離れが2年間で増加しました。 カスタマーサポートに関連するコストは大幅に増加し、サポート部門は絶えず消火活動を行っていました。 この2年間で、サポートコールは4倍になりました。

最初の3か月で、供給交渉から苦情解決まで、ビジネスがどのように機能するかを学びました。 製品担当副社長とそのチームにインタビューを行い、営業チームと技術チームのVPと連絡を取り、カスタマーサポート部門と幅広く話をしました。 これらの取り組みにより、有用な洞察が得られ、私のチームはいくつかの仮説を立てることができましたが、それらを裏付けたり、拒否する根拠を確立したりするための確かなデータは提供されませんでした。 顧客の不満の考えられる説明には、注文後に注文を編集する機能などの機能の欠如が含まれていました。 アドオン製品の必要性。 および不十分な技術支援および/または製品情報。 しかし、単一の行動方針を決定できたとしても、さまざまな部門にそれを実行するように説得するには、可能性よりも確固たる何かが必要になります。

小さな会社では、顧客へのインタビューを行うことから始めたかもしれません。 しかし、エンドユーザーベースが数十万人であるため、このアプローチは役に立たず、実行可能でもありませんでした。 それは私にたくさんの意見を与えたでしょうが、いくつかは有効ですが、私が扱っていた情報がより大きな傾向を表していることを知る必要がありました。 代わりに、ビジネスインテリジェンスチームのサポートを受けて、コールセンターとカスタマーサポート部門から入手可能なすべてのデータを取得しました。

過去6か月のサポートケースは、それぞれ130,000行の4列で私に届きました。 各行はカスタマーサポートリクエストを表しており、各列には、ケアプロセスの進行に伴う顧客の問題領域のラベルが付けられていました。 各列には11から471の異なるラベルがありました。

「カスタマーサポートデータ」というタイトルのイラスト。この図は、データが文書化された130,000行を表しており、4列の問題領域があり、1番目の問題領域、2番目の問題領域、3番目の問題領域、および4番目の問題領域として識別されます。各列の問題領域ラベルの数は、それぞれ11ラベル、58ラベル、344ラベル、および471ラベルとして示されています。
それぞれ4つの問題領域を持つ130,000の個別のケースで構成されるカスタマーサポートデータ。

フィルタを適用して大量のデータセットを並べ替えても、決定的な結果は得られませんでした。 個々の問題ラベルは、全体像を捉えるには不十分でした。 顧客は最初にパスワードをリセットするために電話をかける可能性があり、その電話はそのようにログに記録されますが、4つの問題すべてが文字列と見なされた後、別の根本的な問題が明らかになる可能性があります。 数百万の可能な文字列を含む130,000行では、各行を個別に確認してパターンを探すことはできませんでした。 この規模で問題を特定することは、ビジネスの洞察を提供することではなく、数学の問題を解決することに匹敵することが明らかになりました。

最も頻繁に発生する文字列を分離するために、サイズに比例する確率(PPS)サンプリングを使用しました。 このメソッドは、各要素の選択確率をそのサイズ測定値に比例するように設定します。 計算は複雑でしたが、実際には、私たちが行ったことは単純でした。各列の各ラベルの頻度に基づいてケースをサンプリングしました。 多段サンプリングの一形態であるこの方法により、顧客がサポートセンターに電話をかけた理由をより鮮明に描く一連の問題を特定することができました。 最初に、モデルは最初の列から最も一般的なラベルを識別し、次にそのグループ内で2番目の列から最も一般的なラベルを識別しました。

「PPSサンプリング後のカスタマーサポートデータ」というタイトルのイラスト。この図は、データが文書化された130,000行を表しており、4列の問題領域があり、1番目の問題領域、2番目の問題領域、3番目の問題領域、および4番目の問題領域として識別されます。各列の問題領域ラベルの数は、それぞれ11ラベル、58ラベル、344ラベル、および471ラベルとして示されています。さらに、強調表示されたボックスが追加され、各問題領域内で一般的に発生するラベルの識別を表します。
PPSサンプリングの適用後のカスタマーサポートセンターのデータ。最も頻繁に発生するラベル文字列が特定されています。

PPSサンプリングを適用した後、根本原因の2%を特定しました。これは、全ケースの約25%を占めています。 これにより、累積確率アルゴリズムを適用できるようになり、ケースの50%以上が根本原因の10%に起因することが明らかになりました。

この結論は、私たちの仮説の1つを裏付けました。顧客は、注文後に注文データを変更する方法がなかったため、コールセンターに連絡していました。 単一の問題を修正することで、クライアントはサポートコストを700万ドル節約し、顧客離れに起因する2億ドルの収益を回収することができます。

リアルタイムで分析を実行

機械学習の知識は、同様の規模の別の旅行会社でのデータ分析の課題を解決するのに特に役立ちました。 同社は、ウェブサイトとAPIを介して、世界中のホテルと旅行代理店の間の連絡役を務めました。 Trivago、Kayak、Skyscannerなどのメタ検索エンジンの急増により、APIトラフィックは3桁増加しました。 メタ検索が急増する前は、ルックとブックの比率(API検索の合計とAPI予約の合計)は30:1でした。 メタサーチが始まった後、一部のクライアントは30,000:1の比率に達するでしょう。 ピーク時には、処理速度を犠牲にすることなく、1秒あたり最大15,000のAPIリクエストに対応する必要がありました。 APIに関連するサーバーコストはそれに応じて増加しました。 しかし、これらのサービスからのトラフィックの増加は、売上の増加にはつながりませんでした。 収益は一定のままであり、会社に巨額の経済的損失をもたらしました。

同社は、顧客体験を維持しながら、トラフィックの急増によって引き起こされるサーバーコストを削減する計画を必要としていました。 過去に一部の顧客のトラフィックをブロックしようとしたところ、PRはマイナスになりました。 したがって、これらのエンジンをブロックすることは選択肢ではありませんでした。 私のチームは解決策を見つけるためにデータに目を向けました。

リクエストの時間、目的地、チェックイン/チェックアウトの日付、ホテルのリスト、ゲストの数、部屋のタイプなど、一連のパラメーターにわたって約3億のAPIリクエストを分析しました。 データから、特定のパターンがメタ検索トラフィックの急増に関連していることがわかりました。時刻、時間単位あたりのリクエスト数、目的地でのアルファベット順の検索、ホテルの順序付きリスト、特定の検索ウィンドウ(チェックイン/チェックアウト日)、ゲスト構成。

教師あり機械学習アプローチを適用し、ロジスティック回帰に似たアルゴリズムを作成しました。デルタタイムスタンプ、タイムスタンプ、目的地、ホテルなど、クライアントから送信されたタグに基づいて、各リクエストの確率を計算しました。チェックイン/チェックアウトの日付、ゲストの数、および以前のリクエストのタグ。 指定されたパラメーターに応じて、アルゴリズムは、APIサーバー要求が人間またはメタ検索エンジンによって生成された確率を識別します。 クライアントがAPIにアクセスすると、アルゴリズムはリアルタイムで実行されます。 リクエストが人間によるものである可能性が高いと判断された場合、リクエストは高速サーバーに送信されます。 それがメタ検索であるように思われる場合、要求は操作に費用がかからないキャッシングサーバーに転送されます。 教師あり学習を使用することで、モデルを教えることができ、開発の過程でより高い精度が得られました。

このモデルは柔軟性を提供しました。これは、以前に使用したものよりも具体的なビジネスルール(たとえば、1日あたりの予想予約数やクライアント層)に基づいて、クライアントごとに確率を適応させることができるためです。 特定のクライアントの場合、リクエストは50%を超える確率で送信できますが、より価値のあるクライアントの場合は、70%の確率のしきい値を超えたときに送信するため、より確実性が必要になる可能性があります。

「機械学習アルゴリズムを介したクライアントの並べ替え」というタイトルの図。この図は、リクエストが発信元に応じてソートされる可能性のあるパスを示すフローチャートです。フローチャートの冒頭には、「インターネットユーザー」と「メタ検索」の2つの起源が考えられます。どちらも「XML、APIサーバー」につながります。これは「自然検索?」につながります。結果が「はい」の場合、次のステップは「高速サーバー」です。結果が「いいえ」の場合、次のステップは「サーバーのキャッシュ」です。この後、両方とも「XML、APIサーバー」に戻されます。
リクエストの発信元に応じて、リクエストが高速サーバーまたはキャッシングサーバーのいずれかにソートされたパス。

分類アルゴリズムを実装した後、同社は特定の時間枠内でリクエストの最大70%をより安価なスタックに転送し、インフラストラクチャコストを年間500万ドルから700万ドル節約しました。 同時に、同社はトラフィックを拒否しないことで顧客基盤を満足させました。 収益を保護しながら、予約率を維持しました。

仕事に適したツールを使用する

これらのケーススタディは、データサイエンスを使用して複雑な製品の問題を解決することの価値を示しています。 しかし、データサイエンスの旅はどこから始めるべきでしょうか? おそらく、あなたはすでに幅広い知識分野の基本的な理解を持っています。 データサイエンスは学際的な活動です。 それは深く技術的および概念的な思考を含みます。 それは大きな数と大きなアイデアの結婚です。 開始するには、次のスキルを向上させる必要があります。

プログラミング。 構造化照会言語(SQL)は、データベースを管理するための標準的なプログラミング言語です。 Pythonは統計分析の標準言語です。 この2つには重複する機能がありますが、非常に基本的な意味では、SQLを使用してデータを取得およびフォーマットしますが、Pythonを使用して分析を実行し、データが何を示しているかを調べます。 Excelは、SQLやPythonほど強力ではありませんが、同じ目標の多くを達成するのに役立ちます。 頻繁に使用するように求められる可能性があります。

オペレーションズリサーチ。 結果が出たら、どうしますか? あなたがそれをどうするかわからなければ、世界中のすべての情報は役に立たない。 オペレーションズリサーチは、分析手法をビジネス戦略に適用することに専念する数学の分野です。 オペレーションズリサーチの使用方法を知ることは、データに裏打ちされた健全なビジネス上の意思決定を行うのに役立ちます。

機械学習。 AIの増加に伴い、機械学習の進歩により、予測分析の新しい可能性が生まれました。 予測分析のビジネス使用率は2018年の23%から2020年には59%に上昇し、市場は2026年まで年平均成長率24.5%になると予想されています。今こそ、製品マネージャーがこのテクノロジーで何ができるかを学ぶときです。

データの視覚化。 分析を理解するだけでは十分ではありません。 技術者以外の利害関係者が理解しやすい形式で結果を伝達するには、Tableau、Microsoft Power BI、QlikSenseなどのツールが必要です。

これらのスキルを自分で習得することが望ましいですが、少なくとも、専門家を雇い、タスクを委任するために必要な知識が必要です。 優れた製品マネージャーは、可能な分析の種類と、それらが答えるのに役立つ質問を知っている必要があります。 データサイエンティストに質問を伝える方法と分析の実行方法を理解し、結果をビジネスソリューションに変換できる必要があります。

リターンを推進する力を振るう

NewVantage Partnersの2022年のデータおよびAIリーダーシップエグゼクティブ調査によると、参加組織の90%以上がAIおよびデータイニシアチブに投資しています。 ビッグデータとビジネス分析から生み出される収益は、2015年以来2倍以上になっています。かつては専門的なスキルであったデータ分析は、今ではあらゆる場所の企業に正しい答えを提供するために不可欠です。

プロダクトマネージャーは、返品を促進し、戦略を決定し、同僚から最高の仕事を引き出すために雇われます。 信憑性、共感、およびその他のソフトスキルは、この点で役立ちますが、それらは方程式の半分にすぎません。 組織内のリーダーになるには、意見ではなく事実をテーブルに持ち込みます。 エビデンスに基づく洞察を開発するためのツールはかつてないほど強力であり、潜在的な利益はかつてないほど大きくなっています。