データ分析

自社ブランドが選ばれる確率とは~検索データが示す消費者プレファレンス~

  • はてなブックマーク
  • follow us in feedly

多くのマーケターは、消費者がどのくらいの確率で自社ブランドを選んでくれるか知りたいと思うだろう。そして、サービス提供側であれば、利用頻度の高い顧客や低い顧客がどのように市場にちらばっているのかも、気になるところではないだろうか。

図1は、ヤフー検索のデータをもとに、2つのECサイトA・Bの年間利用頻度が、どのくらいの確率で発生するかを予測分析したものである。ECサイトAであれば、年に4回利用するユーザーが7%弱の確率で存在し、年に20回利用するユーザー数が2%弱の確率で存在することがわかる。

図1 ECサイトの利用頻度毎の確率分布

また、サイトAについては、年に1回しか利用しないユーザーは5%弱しか存在しないことになるので、大半のユーザーは複数回利用することがわかる。

ここで、別の例を見てみる。図2はヤフー検索を元に、航空サイトの利用頻度の分布を比べたものである。

図2 航空サイトの利用頻度毎の確率分布

図1と比較すると、曲線の描き方が大きく違う事がわかる。図2では、利用頻度が年1回を最高にして急なカーブを描いている。つまり、航空会社Cの場合、年1回利用するユーザーが確率的に一番多く、約2%存在している。そして利用回数が増えるごとにその確率は減少することがわかる。

一般的に、ECサイトと比べると、航空会社のサイトは頻繁に利用されるというわけではない。年に数回旅行を行く人もいるだろうが、サイトユーザー全体でみると、実際には年に1回の利用がほとんどとなっている。

単純なことかもしれないが、データを分析する際、このように最初にデータ全体の分布を見ることはとても大事である。理由として、まずどの範囲にどれだけの数のデータがあるのかを把握する事で、課題や対策が見えやすくなるからである(筆者は学生時代、情報工学科の教授によく言われていたものだ)。

ただ、これらのチャートは膨大な量の検索データを単に集計したというものではない。ある「確率的数理モデル」を利用して描いたもので、実はたった2つの変数から計算した結果にすぎないのだ。その確率的数理モデルは「NBDモデル」と呼ばれる。

最初に提示したECサイトと航空会社のサイトの利用に関するチャートは、『確率思考の戦略論 USJでも実証された数学マーケティングの力(森岡毅 ・今西聖貴著) 』(*1)に倣い、NBD分析を行った結果である。

NBDモデルは、消費者が選択する商品の確率に購買回数も加味した売り上げ予測をするモデルで、ブランドの選択確率を考える際などに利用される確率的数理モデルである。

ユーザーのブランド選択確率を予測することは、マーケティングの重要な課題のひとつだが、単純な購買確率だけでなく購買回数まで考慮することは、現実的な購買行動を考える上で大変意味のあることだといえる。

NBDモデルの数式は文末に紹介するが、2つの変数にだけ触れておこう。変数の1つはプレファレンス、つまり相対的好意度である。これは、消費者が他のブランドに比べてそのブランドをどれだけ気に入っているかを示すもので、競合他社を含めた市場全体において、自社ブランドが選ばれる平均確率と考えればよい。もう一方は分布の形状を表す変数である。この2つの変数のうち、コントロールできるのはプレファレンスのみである。企業努力によって、競合他社よりも選択される確率を上げることができるという意味で、企業努力によってプレファレンスを向上させることは可能である。そして、このプレファレンスの大きさにより分布の形状も決まる。

また、プレファレンスは市場シェアを考える上で重要である。同業種内で同様のサービスや商品を比較する場合、プレファレンスの大きさの差が、互いの市場シェアの差に近いといえるからだ。市場シェアが「購買回数毎に選択される確率が集積されたものだ」と考えれば、プレファレンスこそ、その総体だからである。

本稿ではプレファレンスの計算は検索データから行ったので、検索データから市場シェアを試算できたともいえる。しかし、データから市場シェアを知ったところで、その先にシェアを伸ばす方法が見えなくては意味がない。市場シェアを伸ばす、つまりプレファレンスを増やすためには、どうすればよいのだろうか。

前述の『確率思考の戦略論 USJでも実証された数学マーケティングの力』によれば、プレファレンスの増やし方は二つある。

  1. 商品・サービスの利用者を増やす水平拡大
  2. 商品・サービスの利用頻度を増やす垂直拡大

前者のほうが成功する確率が高いと、述べられている。 理由としては、前者はマーケットが大きいのに加え、水平拡大すれば自然と垂直拡大も同時に実現できるからである(プレファレンスを増やせば分布の形状も山なりに近づく)(*2)。

しかし、筆者は垂直拡大も重要であると考えている。なぜなら事業者の規模・進捗(しんちょく)によっては垂直拡大が必要なフェーズもあるからだ。そこで、この水平拡大と垂直拡大について、どのように進めていけばいいかについて言及したい。

実は、このような数式モデルによる計算は、プレファレンスと分布の形状を求めるというだけであれば、検索データではなくても、NIELSEN NETVIEW(*3)や市場調査のデータの数値などを利用すれば可能である。しかし、計算はできても、その後どのように水平拡大と垂直拡大のための施策を進めていけばよいのかはわかりづらい。その点において検索データは、検索という行動によってユーザーのニーズや特性がわかるので、計算後のデータを見れば何をすれば良いかわかる可能性が高いというメリットがある。

たとえば、水平拡大を狙うのであれば、利用回数が1回以上のユーザーと比較して利用回数が0回のユーザーが検索するクエリの特徴を見つけ出すことで、サービス未利用者に共通する興味・関心が確定できる。それによって、新しいプロダクトのデザインを考案したり、プロモーションの際に有効なクリエーティブを立案したりできる。

また、垂直拡大のためには、利用回数が高頻度のユーザーと比較して低頻度のユーザーが検索するクエリの特徴にフォーカスし、それらに関連するコンテンツをサイトやメルマガなどで展開すれば、既存ユーザーの利用を促進するためのコンテンツマーケティング戦略に役立てることができる。

このように、ユーザーの検索クエリを比較する事で水平拡大、垂直拡大どちらにしても、戦略を練る上でのヒントを得る事ができる。

検索データというと、自社サイトへ集客するための利用などが想起されがちだが、より大きな視点に立った市場シェアの分析にも利用できるということが、少しおわかりいただけたのではないだろうか。

※以下、『確率思考の戦略論 USJでも実証された数学マーケティングの力』を参考にNBDモデル計算式を記載しておくので、参照いただきたい。

NBDの数式

ここでrは購入回数、M(プレファレンス)は商品の総購入回数を人口で割ったもの、Kは分布の形状を決めるパラメータ。

たとえば、Mを固定してKを動かすと図3のように形は変化する。つまり、購買回数の分布はこのMとKの数字だけで決まるというモデルになっている。もちろん、このモデルを適用するには仮定がいくつかあるが、ここでは説明を省略させていただく。

図3 NBDモデルによるパラメータ毎の確率分布

また本稿で扱った図1・図2に関しては、ブランド選択を「サイト流入」と置き換えている。(Mはサイト流入数/検索ユーザー数としてMから最適なKを決定している。サイト流入数が0回の確率とMを数式モデルに代入しKを求めている。サイト流入数、検索ユーザー数は、ともに2016年度のデータを利用した)

注釈:
(*1)『確率思考の戦略論 USJでも実証された数学マーケティングの力(森岡毅 ・今西聖貴著)』(外部サイト)
(*2)NBDモデル(負の二項分布モデル)。計算式については記事最後の部分を参照
(*3)ニールセンのインターネット視聴率データ

プロフィール

田中 祐介(タナカ ユウスケ)

2009年、ヤフー株式会社に新卒入社。2013年からレコメンデーションサービスに特化し、ECサービス・キュレーションサービスでモデル開発・システム開発・サービス運用と幅広い業務を担当。2014年から、リサーチアナリシス部にて広告のデータ分析を担当。

  • はてなブックマーク
  • follow us in feedly

Insight for Dの
ページにいいねしよう!

「いいね!」してInsight for Dの最新情報をチェック

Q. Yahoo! JAPANのデータソリューションは何がスゴイんですか? 答えはこちら

Q. Yahoo! JAPANのデータソリューションは何がスゴイんですか? 答えはこちら

Insight for Dの公式Facebookページ、Twitterでも最新情報や取材の様子を発信中。