データ分析

【西内啓の眼差し】――意思決定のためのデータリテラシー

  • はてなブックマーク
  • follow us in feedly

この記事の前編を読む

ビジネスの問題を解決する際には、過去の事例や理屈に沿ったアプローチをとれば完璧だ――そう考えていては、いつまでたっても正しい「意思決定」は行われない。それどころか、答えの出ない堂々巡りが待ち受けているだけである。では、どうすればよいのか。株式会社データビークル代表取締役、『統計学が最強の学問である』(ダイヤモンド社)の著者である西内啓氏に、2回にわたって解説いただく本シリーズ。後編では、「ビジネス」「データ活用」という視点から、データを「意思決定」に活かす考え方について掘り下げる。

エビデンスと「正確さ」

前編では企業がなぜデータを意思決定に活用しなければいけないのか、という理由を説明した。次の課題は、どのように考えればデータをうまく意思決定に生かすことになるのか、という点である。

多くの企業はせっかく大量のデータを保有しながら、円グラフで満足度を集計したり、折れ線グラフで製品の売れ行きをモニタリングしたりといった活動しかしていない。あるいはいきなり高度な人工知能(AI)・機械学習技術を取り入れようとした結果、「中身がブラックボックスなのでAIの言うことを信じていいかわからない」といった悩みを私たちに相談されることもある。

ここで、医学の分野で確立された「エビデンスに基づく」という考え方がビジネスにおいても役に立つ。エビデンスとは「可能な限り正確に因果関係を推論する」ためのものであり、その「正確さ」には強弱がある。つまり、次の図に示すように、調査データの分析結果よりもランダム化比較実験(A/Bテスト)の方が強いエビデンスで、もっと強いエビデンスは大量の実証研究成果を系統的に収集してレビューし、メタアナリシスを行った結果である。また、調査データの分析結果よりも弱いものの、事例の報告や権威の意見といったものも一種のエビデンスである。

エビデンスのピラミッド
DiCenso A, Bayley L, Haynes RB. 2009. Accessing pre-appraised evidence:
fine-tuning the 5S model into a 6S model.Evidence-Based Nursing, 12(4),99-101.より引用改編作成(*1)

「感覚」や「理屈」、「事例」の限界

ではなぜエビデンスの正確さには、このような強弱が存在しているのだろうか?

たとえば、自社の経営会議で「従業員の生産性を向上させるためには、彼らの業績と連動した金銭的インセンティブを設定すべきである」という案が出されたとする。すると、「確かにボーナスを出せば社員はみんな頑張るような気がする」と述べる人もいれば、「学生時代に金銭的なボーナスによって内発的なモチベーションが失われると心理学で勉強した」と主張する人もいるかもしれない。

このような「感覚」や「理屈」だけで議論していても話は堂々巡りである。エビデンスに基づくとは、すなわち「論より証拠」と考えるということだ。1人でも、1社でもいいから実際に、「金銭的インセンティブで生産性が向上した」という事例を示した方が信頼できると考えるのである。

しかし、事例だけで議論することには限界がある。たとえば、ある人が「昔、アルバイト先で成果に応じたボーナスを提示されて、スタッフ全員がすごく頑張った」という事例に言及したとする。それはただの感覚や理屈よりも信頼すべきエビデンスだ。一方で、別の人が「前職で金銭的インセンティブを提示されたが、自発的な頑張りに値段がつけられるようで、むしろやる気が失われた」という事例を提示してきた場合はどう考えればよいのだろうか。「人それぞれだから慎重に議論しよう」というのでは、結局のところ「感覚と理屈の堂々巡り」に戻ってしまう。

調査によるデータ分析が第一歩

そこで必要になるのが、調査データの分析という考え方である。前述の事例から、「金銭的インセンティブを提示されて生産性の高まった人が(少なくとも1人)いる」ことや、「金銭的インセンティブを提示されて生産性の下がった人が(少なくとも1人)いる」ことはわかる。しかし調査を行えば、これを「どれくらいいるのか」「どちらが多いのか」といった数で議論できるようになるのだ。

仮に、同じ業界に属す競合企業を全てリストアップしたとする。金銭的インセンティブを設定している会社とそうでない会社に分けた上で、従業員1人あたりのパフォーマンス(営業利益など)を比べた場合、平均的にはどちらの方が、どれだけ生産性が高くなるだろうか? もしインセンティブを設定している企業の方がハイパフォーマンスであった場合、それは事例の感覚値よりも信頼すべきエビデンスとなる。

このように「何らかビジネスの中で求めるべき結果(今回で言えば従業員の生産性)に対してその原因となり得るもの(今回で言えば金銭的インセンティブの有無)で分けて比較する」というのが、多くのビジネスパーソンが行うべきデータ分析の第一歩である。しかし、ただ見える化しただけでは、その課題や機会の大きさしかわからない。その課題や機会の大きさに対して「何が違いを生み出しているか」をデータから明らかにできれば、ビジネスをより望ましい方向へ変えていけるアイデアとなるわけである。

「偶然」と「偏り」を克服する多変量解析

ただしこのような比較において、注意すべき視点は2つある。

1つめは、グループ間の違いは「偶然生じるような程度のものではないか?」という視点だ。仮に、グループ内の3社のうち1社が金銭的インセンティブを設定しており、残り2社は設定していなかったとする。これら3社の間で「パフォーマンスの指標が全く同じ値になる」ということは考えられず、多少はバラつきがあってもおかしくないはずだ。そのうち「たまたま一番パフォーマンスが高い会社が金銭的インセンティブを設定していました」というだけでは、今後自社もそれに倣うべきという根拠として薄弱である。

これはいわば、コインを3回投げて2回表が出ただけで「このコインは表が出やすい」と判断するようなものだ。

しかし、これが金銭的インセンティブの有無別に数十社ずつ、あるいは数百社ずつを調査した上で、明らかに金銭的インセンティブを設定している側のパフォーマンスが圧倒的に高いとなればどうだろうか? このような状況が「たまたまだ」と主張するのはムリがあることは直感的にわかるだろう。統計学ではこのような「直感」をより精緻にするために、「これほどの差がたまたまのバラつきのみによって生じる確率はどれほどか?」と計算する。こうした考え方を専門用語では統計的仮説検定と呼ぶ。

そして2つめは、このグループ間に「金銭的インセンティブを設定しているかどうか」という以外の偏りが存在していないか、という視点だ。

これを専門用語では「交絡(こうらく)要因」、つまり“交わり絡まった要因”と呼ぶ。仮に数十以上の競合企業がグループ分けされ、統計的仮説検定の考え方をもってしても、あからさまに金銭的インセンティブを設定している企業のパフォーマンスが高いと判断されたとしよう。だが、もしかすると金銭的インセンティブを設定している企業は、外資系の企業が多いかもしれない。あるいは比較的創業からの年数が短い企業が多いかもしれない。

そうすると、仮に「固定給自体が高く、働き方がフレキシブルな外資系の競合企業は、もともと生産性の高い人材を集められる傾向にある」といった仕組みが背後に存在していた場合に話はややこしく「絡まって」くる。つまり、外資系の競合企業は金銭的インセンティブと関係なく生産性が高いということである。しかし、単に金銭的インセンティブの有無で従業員の生産性を比較していた場合、見かけ上「金銭的インセンティブを設定している企業の生産性が高い」という分析結果が得られるわけである。

交絡のイメージ

統計学における「多変量解析」と呼ばれる手法は、このような問題に対しても使うことができる。つまり、考えられる限り交絡となりそうな要因を同時に扱って、外資系かどうかとか創業からの年数といった他の条件をそろえた上で、任意の要因(今回であれば金銭的インセンティブの有無)がどれほどの影響を与えうるかを明らかにするのである。われわれがData Diverというツール(*2)で行っているのもまさにこうしたアプローチだ。

ただしこれでも完璧ではない。われわれはこの世に存在する全ての交絡要因を知ることはできないし、故にそれらを全て多変量解析を用いて「条件をそろえる」ことなど不可能だ。だからこの時点でも確実な因果関係が実証されたことにはならない。よって、考え得る限りの交絡要因を用いた分析結果に対しても、何かの本で読みかじった知識を振りかざして「相関と因果は別物だから慎重に議論しよう」と主張する者がしばしば現れる。

議論でなく仮説の検証で判断する

調査データに対して多変量解析を行った上で、何かしら無視しがたい原因と結果の関連性が示唆されたのであれば、やるべきことは「慎重な議論」ではない。ランダム化を伴うA/Bテストによる仮説の検証である。なぜだろうか?

たとえば、ひずみのないコインを1000枚投げるということを何回やっても、裏と表はだいだい同じだけの回数で出るだろう。これと同様に、われわれが把握してようがしていまいが、1000人の従業員をランダムに半々に分けたとすれば、一方にやたら男性が多いとか、やたら若者が多いとか、優秀な人が多いとかいうことは基本的に起こりえない。つまり、われわれが現在知り得ないものも含めて、ありとあらゆる交絡要因が、ランダムに分けられたグループ間で「だいたいそろう」わけである。

また、仮にこの状況で一方のグループには成果と無関係に同じ額のボーナスを一律支給し、他方にはボーナスが業績と連動するように支給されたらどうなるだろうか。他の条件はだいたい同じだがボーナスの支払われ方だけが異なる両グループの間に、もし偶然では起こりえないレベルでパフォーマンスの差が生じていたとすれば、それは「金銭的インセンティブが原因で、パフォーマンスという結果が左右された」と考えられるわけである。

ランダム化比較実験

そして、このような実証研究について、さまざまな状況で行われたあらゆる分析結果を片っ端から収集し、「分析結果に対する分析」を行うことがメタアナリシスだと前編でも述べた。ここまでの分析が行われれば、個別の事情はさておき「基本的に、行った方がいいことなのかどうか」という人類の常識が整理されるわけである。

素早く因果関係を実証する力こそが「企業競争力」

実は金銭的インセンティブの是非については、既にメタアナリシスの結果が存在しており、過去に行われた45の論文に含まれる64の研究から、平均して27%ほどパフォーマンスを上昇させると示されている。一方で、贈り物をしたり、休暇を与えたりするなど非金銭的なインセンティブでは13%ほどしかパフォーマンスの上昇が見られなかったそうである(*3)。そのため、「基本的には金銭的インセンティブを与えた方がいい」と考えた方がいい。

空虚な論を戦わせるより、メタアナリシスで「人類の常識」を探した方が早い。それでもわからないことがあれば社内外のデータから「求める結果に影響を与えうる原因の候補」を探せばよい。統計学はそのための大きな助けになるだろう。そして原因の候補が見つかれば、すぐにランダム化を伴うA/Bテストに進めばよい。

このようにビジネスに関わる新たな因果関係を、どれだけ素早く探索し実証できるかが、企業の競争力に大きく関わってくるのである。

前編を読む | 後編を読む

  • はてなブックマーク
  • follow us in feedly

Insight for Dの
ページにいいねしよう!

「いいね!」してInsight for Dの最新情報をチェック

Yahoo! JAPANのデータソリューションについて

Yahoo! JAPANのデータソリューションについて

Insight for Dの公式Facebookページ、Twitterでも最新情報や取材の様子を発信中。