データ分析

価値の高いデータとはなにか

  • はてなブックマーク
  • follow us in feedly

ビッグデータという言葉が広く浸透し、広告・マーケティングの領域においても、DMPやデータエクスチェンジなど、ビッグデータを利用したデータビジネスが注目されています。ただ残念なことに、どのデータをどのように活用すべきか、明確な方向性が決定していない企業も多数存在します。そこで、どのような点に注目してデータ活用を行えば成果を上げられるのか、道筋となる考え方をまとめました。

多種多様のデータ

そもそも“データ”とは、あるユーザーが活用することを前提として集められている複数の事象や数値などの“まとまり”を表します。たとえば、性別、年齢、居住地域などの属性それぞれがデータですし、属性データをまとめてデータと呼ぶこともあります。また、図1にあるように、ある基準でまとめられたデータのいくつかをすべてまとめて“データ”表すこともできます。一言でデータといっても、活用する人によってそのまとめ方はさまざまです。

図1 データの種類
前述の内容を表した図

データの価値はどこで見る?

では、実際にビジネスに役立つデータを収集するためには、どうすればよいのでしょう? 数あるデータの中から自社にとって価値があると考えられるデータに着目する場合、その価値とは、何を見ればわかるのでしょうか。

データの価値をわかりやすく示す例として、ターゲティング広告を取り上げます。ターゲティング広告には複数の種類があり、一度ウェブサイトを訪問したことのあるユーザーに広告を表示するリターゲティングや、属性(性別、年齢、地域など)によって絞り込みを行うターゲティングといった方法があります。

図2は、YDNの複数の広告掲載方式における平均入札価格を比較したものです(*1)。「サイトリターゲティング広告」の入札価格は、「性別ターゲティング」「年齢ターゲティング」といった属性によるターゲティングに比べて、高いことがわかります。これは、より多くの広告主が「サイトリターゲティング広告」に入札し、価格が上がっていることに起因しています。つまり、広告主にとってみれば、過去に広告主のウェブサイトに訪問したユーザーのデータは、獲得効率の観点から、属性に関するデータよりも「価値」が高いと考えているという事実を示しているのです。このように収集したデータを比較して、その違い(差)を分析すると、データの価値を実感できます。

図2 ターゲティング広告の平均入札価格の比較
前述の内容を表したグラフ

Yahoo! JAPAN調べ(2015年12月)
※Yahoo!ディスプレイアドネットワーク(YDN)のターゲティング商品の平均入札価格を基に作図

データの「説明力」を活用する

ただ、データの価値は、活用する人によって変わってきます。そこで、Yahoo!ショッピングに出店している“パソコンのパーツ販売店”と“化粧品の販売店”におけるデータの価値を比較した例を見てみましょう。それぞれの事業者の顧客獲得単価をKPIとして、8種類のデータ(年齢・性別・居住地域・パソコンとスマートフォンの検索ログ・パソコン検索のみのログ・スマートフォン検索のみのログ・過去のサイト訪問回数、利用データ全体)を説明変数として重回帰分析(*2)を行いました。

図3は、利用データ全体のKPIへの貢献度を100%とした場合に、その他7種類のデータがKPIに対してどれだけ影響をもっているかを示しています。このKPIへの影響度合いこそが、解析における“説明精度”です。

サイト訪問と検索ログ(パソコン+スマートフォン)の説明精度に注目してみると、化粧品販売店では、値がほとんど変わらないのに対し、パソコン販売店では説明精度に差が見られます。また、スマートフォンの検索データは、化粧品販売店にとって、より説明精度が高いことがわかります。

図3 事業者ごとの各種データによる説明精度
前述の内容を表した図

Yahoo! JAPAN調べ(2015年12月~2016年1月)

このように、種類が同じデータといっても、必ずしも説明精度が似ているということではありません。活用する人によって、データの価値は異なります。なぜならば、それぞれのゴールを達成するために必要なデータの種類が人によって違うからです。つまり、自社にとってのゴールとなるKPIに対する影響度がどれだけあるかという、データの説明力に着目し、そこからどのようなアクションを起こせるかを考えていくことが肝要なのです。

データはマーケターの視野を広げ、経験値を超えたところで新たな購買層を発掘したり、企画のアイデアをもたらしてくれたりする可能性があります。ぜひ、分析によって価値の高いデータを見極めて、戦略的に活用してください。

注釈:
(*1)特定のユーザー層を限定して広告を配信するYDN(Yahoo!ディスプレイアドネットワーク)においては、課金額は固定価格ではなくオークション形式によって決まるため、広告主は入札価格を設定する
(*2)回帰分析とは、2変量(目的変数と説明変数)の間の関係性をひとつの数式で仮定したもので、説明変数が複数あるものを重回帰分析という

著者プロフィール

田中 祐介(タナカ ユウスケ)

2009年、ヤフー株式会社に新卒入社。2013年からレコメンデーションサービスに特化し、ECサービス・キュレーションサービスでモデル開発・システム開発・サービス運用と幅広い業務を担当。2014年から、リサーチアナリシス部にて広告のデータ分析を担当。

  • はてなブックマーク
  • follow us in feedly

Insight for Dの
ページにいいねしよう!

「いいね!」してInsight for Dの最新情報をチェック

Yahoo! JAPANのデータソリューションについて

Yahoo! JAPANのデータソリューションについて

Insight for Dの公式Facebookページ、Twitterでも最新情報や取材の様子を発信中。