デジタルマーケティング入門

断捨離したほうが、データ分析はうまくいく? 押さえておきたい3つの落とし穴

  • はてなブックマーク
  • follow us in feedly

“データは多ければ多いほどいい”は本当か?

日常生活では「片づけ術」や、モノを持たない「ミニマムな暮らし方」が好まれているが、なぜか企業のデータとなると、この話は逆になる。これからの時代、データは価値を創造するお金だ、オイル(燃料)だと称賛され、少しでも多く集めること、増やすことに熱心になる企業が多い。

また、自社だけでデータが足りなければ、外部のデータホルダーにお金を払ってまでデータを集める。しかし、そのようにしてせっせと集めたデータが、自社の目的に見事にはまり、期待していたようなお金を生んでいるかというと、そうではない企業がほとんどではないだろうか。

事実、ベリタステクノロジーズが2016年5月に発表した調査結果(*1)では、「企業の保有データのうち、85%のデータはビジネス上の価値がない、もしくは価値があるかさえも分からない」(*2)という結果が出ている。

多くの企業ではデータを集めた後、データマイニング(大量のデータから価値ある情報を見つけ出すこと)を行い、膨大なデータでつくられた鉱山のなかに宝がないかを懸命に探している。しかし実際は、鉱山というより、いつの間にか汚部屋化してしまった「ゴミの山」から、使えるデータが残ってないか悪戦苦闘するという状態が近いのかもしれない。

また、データを集める上で見逃せないのは、それに伴って生じるコストやリスクだ。一昔前より安価になったとはいえ、データが多いほど、保管するための費用や、高度な処理・分析ができる人材を雇うための人件費、分析ツールの利用料もかさんでくる。加えて、企業の扱うデータは個人情報がほとんどだ。それらの情報が万一漏出した場合、企業には多大な損失が生じる。

これらを踏まえると、データも日常生活のモノのように「断捨離」が必要だ。過剰なデータを断捨離することによって、データが生み出す成果を向上させる、つまり「生産性」を飛躍的に高めることも可能になる。では、どうすればデータの断捨離ができるのか? 3つの事例をもとに、具体的な断捨離の基準やポイントを紹介していこう。

データ断捨離のポイント(1) なんとなく蓄えているデータは捨てる

いつか読むだろうと思い、本棚に眠ったままの本はないだろうか。それは、データでも同じだ。このデータはいつかどこかで役立つだろうと思い、取得したままの状態になっていることがよくある。

消費財メーカー・A社では、過去にイベントやキャンペーンを開催した際に、参加者へアンケートを採り、多くの質問項目に回答してもらっていた。そこで取得したデータをどう活用しているか聞いてみたところ、明快なアイデアはなかった。

さらに、設問数に上限があったため、「できる限り聞いておかないともったいない」という理由で上限まで回答項目を用意していたということだった。

たくさんのデータが取得できるからと、多くのデータを取得することを目的にしてはいけない。まずデータをどう活用するか具体的な道筋を考え、価値のある活用方法が見つかれば、そのデータを取得するための設問を準備する。そうでないならばムリに聞く必要はない。これは、取得した後のデータでも当てはまることだ。

過去1年間利用されていないデータで、価値のある活用方法が見いだせないのであれば、手元に残さず思い切って「捨てる」べきだ。

データ断捨離のポイント(2) 賞味期限の切れたデータは捨てる

データは腐りこそしないが、生もののように賞味期限があると考えた方がよい。これだけテクノロジーや生活者心理、購買行動の変化が激しい現代では、ほんの数年前の情報でもまったく役に立たなくなることが多いからだ。

メディア企業・B社では、10年前から自社で主催しているイベントで取得したデータを元に、性別や年代別、エリア別にどのようなテーマに興味関心があるかを分析していた。しかし、過去にさかのぼるほど、現在の興味関心とはかけ離れてしまうことは明らかだ。

この場合は、直近2~3年以内のデータを分析対象とし、それ以前のものは参考にしない方が良い。せっかく過去に取得したデータだからと、何かしら示唆を導き出したい気持ちも分かるが、それに基づき誤った意思決定をしてしまっては意味がない。いま手元にあるデータが賞味期限切れになっていないかを見極め、それを過ぎたものは捨てるべきだ。

賞味期限はデータの種類や活用目的によって異なるが、たとえば「商品の購入履歴」の場合、購入サイクルの平均期間の何倍をもさかのぼった時点でのデータは活用できる余地が少なく、捨てて良いと判断できるだろう。

データ断捨離のポイント(3) 汚れているデータは捨てる

“汚れたデータ”とは、入手方法などに問題があり、事実とは異なるバイアスがかかってしまっているデータのことだ。クローゼットに収納している一部の衣類に付着したカビが、そのまま放置しておくと他の衣類にまで広がってしまうように、データも汚れたものをそのままにしておくと他の要素が被害を受けてしまう。

耐久財メーカー・C社では、毎年必ず消費者定点調査を実施している。しかし、年度による調査対象者のばらつきや質問項目の不備があるために、そこで得られるデータは実態とは異なるゆがんだデータになっていた。

この調査データのみで示唆を出そうとすると、当然誤った結論が導き出されてしまうが、厄介なことに、新商品開発をする際のサポートデータの一部としてこのデータが引用されたことにより、誤った意思決定がされてしまったのだ。

このような汚れたデータの断捨離は、データのスリム化以上の効果を発揮する。前述の(1)や(2)の条件に当てはまらないデータで、よく分析に使っているものであっても、そもそも“汚れていないか”をいま一度確認し、被害が広がる前にさっさと捨てるのが賢明だ。

データ断捨離の3つのポイント
データ断捨離3つのポイント。「なんとなく蓄えていないか」「賞味期限が過ぎていないか」「汚れていないか」に注意したい

データの断捨離は、生産性の向上につながる

企業にとってデータは、人材と並び貴重な経営資源であり、競争力の源泉になることにもはや疑念の余地はない。だからこそ、“データは多ければ多いほどいい”というような「量」の競争を脱しなければならない。

人事面において、働き方の改革による生産性向上が強く意識されているように、データもいかに効率的に価値を創出するかといった「質」を強く意識することが重要だ。

  • はてなブックマーク
  • follow us in feedly

この記事が気に入ったらいいねしよう!

「いいね」してInsight for Dの最新情報をチェック

Insight for Dの公式Facebookページ、Twitterでも最新情報や取材の様子を発信中。