デジタルマーケティング入門

SASに学ぶデータ分析[前編]──相関関係・因果関係の正しい見分け方とは

  • はてなブックマーク
  • follow us in feedly

グラフや数値をながめ、過去の経験や勘から“なんとなく”問題だと思われるポイントを推測することで、分析したつもりになった経験はないだろうか?「分析力」は、得られたデータから何かしらの傾向を見いだし、次の施策立案に役立てるためにもマーケターに求められる重要なスキルのひとつだが、分析に必要な統計学の基礎知識を持ち合わせていないマーケターは少なくない。今回はデータ分析を正しく行うための基礎について、アナリティクスのリーディングカンパニー、SAS Institute Japan株式会社の辻 仁史氏に話を聞いた。

そのKPI、本当に追いかける意味ありますか?

あなたがいま追いかけている数字は、マーケティングプロセスにおいてどのような意味を持ち、増減がどこにどんな影響を与え、KPIの達成につながると考えられるのか。あるいは、あなたがKPIを達成することによって、売り上げの増加にどれほど寄与できたといえるのか――。

すぐに答えられない人は、「木を見て森を見ず」になっていないか注意する必要がある。たとえば、マーケティング予算100万円をかけて、KPIとして設定している「ウェブサイトの訪問者数10,000人超え」を達成したとしてもそれが間接的にでも売り上げに影響を与えていなければ、施策の多くは成功したとはいえず、そもそもKPIが間違っていた可能性が高い。

では、マーケターが真に売り上げに貢献する指標を見つけ出すにはどうすればよいのだろうか?

データを分類して因果関係を見抜く

本当に意味のあるKPIを設定するためには、POSデータやアクセス解析データをはじめとした各種データのなかから、売り上げの増加に直結する指標を見つけ出す必要がある。その際、「データから見いだすべきなのは相関関係ではなく因果関係だ」と、SAS Institute Japan株式会社(*1) ソリューションコンサルティング本部 IoTソリューショングループ シニアマネージャーの辻 仁史氏は話す。

その理由を解説する前に、一般的に混同されやすい相関関係と因果関係の定義を簡単におさらいしておこう。

  • 相関関係…2つの指標が密接にかかわり合い、「xが変化すればyも変化する」関係のことを指す。相関関係には時間軸がないので、「yが変化すればxも変化する」関係も同時に成り立つ。
  • 因果関係…2つの指標のうち、どちらが「原因」で、どちらが「結果」なのかが明らかな関係のことを指す。そのため、因果関係の場合はxとyを入れ替えることはできない。

相関関係と因果関係の違い
相関関係は前後を入れ替えても成立するのに対し、因果関係は原因と結果の関係が明確であり、入れ替えができない。

たとえば、「客数が伸びると売り上げも伸びる」という事象は相関関係と因果関係のどちらだろうか?

答えは「相関関係」である。なぜなら、「売り上げが伸びると客数も伸びる」の関係も一般的に成り立つからだ。

では、「売上金額が高く、顧客コンタクト数も多い」というデータが出たとしよう。これはどちらだろうか?

これは因果関係である。なぜなら、「コンタクト数を増やしたら売り上げが伸びた」という事象は成り立つが、一般的に「売り上げが伸びたらコンタクト数が増えた」という事象が成り立つとはいえないからである。

「正確に相関関係と因果関係を見分けるには、データの要素をあらかじめ『受動(顧客がすること)』と『能動(企業がすること)』に分類しておくことが大切です。客数や売り上げは顧客の行動によって生まれる数字ですが、顧客コンタクト数は企業の行動によって生まれる数字です。このような観点でデータをあらかじめ整理していくことで、相関や因果を見分けやすくすることができます」(辻氏)

なお、相関関係のあるデータでは外れ値(統計においてほかの値よりも突出して大きい、ないし小さい値)を見つけ、その原因を追究するきっかけを見つけることが重要だ。前出の客数と売り上げの相関関係の場合、客数が多いにも関わらず売り上げが少ない、またその逆のデータを観察して次の施策に結びつける。

対して因果関係の場合、その因果の強さに着目する。前出した顧客コンタクト数の因果関係の場合、顧客コンタクト数以外の要因(値引き、インプレッション数など)のどれが強く売り上げに影響したか、どんな要因が売り上げに影響するかなどの構造を確認する必要がある。

データは「5W2H」の観点で整理する

ここからは、正しく因果関係を導き出すためにデータをどのような観点で整理していくべきか、もう少し踏み込んで説明しよう。辻氏は「受動と能動」の観点のほかに、「5W2H」の観点でデータを整理することを勧める。

データの整理に役立つ5W2H
データを「Who」「When」「Where」「What」「Why」「How」「How much」の7つに分類すると整理ができる

5W2Hとは、「Who(誰が)」「When(いつ)」「Where(どこで)」「What(何を)」「Why(なぜ)」「How(どうやって)」「How much(どれだけ)」に関する項目のことだ。これら7つの項目で整理することで、たとえば自社の売り上げが減った原因が商品に依存するものなのか、客単価に依存するものなのか、それとも特定の店舗に依存しているものなのか、と分類して比較できるようになるという。

「ただし、データを集めて分類する際には『取れるデータがすべてではない』ということを念頭に置いておきましょう。手元にあるデータが5W2Hを満たしているとは限りませんから、足りないデータは“取る”か“つくる”という発想を持っておくことが大切です」(辻氏)

ここまではデータを分析するための基礎である「因果関係を導き出すために必要な考え方」について解説した。後編では、SAS独自の分析フレームワーク「アナリティクスライフサイクル」を用いながら、分析のPDCAサイクルを正しく回す仕組みを構築する手法について紹介する。

この記事の後編を読む

注釈:
(*1)SAS Institute Japan株式会社(外部サイト)

プロフィール

SAS Institute Japan株式会社 ソリューションコンサルティング本部 IoTソリューショングループ シニアマネージャー 辻 仁史氏

2001年に入社。コンサルティング本部に配属され、モデル開発や分析組織の立ち上げに関わるコンサルティング業務に従事。現在はIoT分野全般におけるSASアナリティクス製品を統括。

  • はてなブックマーク
  • follow us in feedly

この記事が気に入ったらいいねしよう!

「いいね」してInsight for Dの最新情報をチェック

Insight for Dの公式Facebookページ、Twitterでも最新情報や取材の様子を発信中。