データ分析

東大 森川教授に聞く「社会を変えるデジタル」[前編]――データをどう集めるか

記事内容の要約

  • IoTの進展によって、モノや人のリアルな動き、変化をデジタルで収集した「リアルデータ」が取得できるようになった
  • データの潜在的な価値を引き出すためには、収集する前に活用方法の仮説を立てる
  • データ活用の可能性について近視眼的にならず、仮説検証を重視することが成果につながる
  • はてなブックマーク
  • follow us in feedly

デジタルデバイスに囲まれた日常生活においては、個人の会員情報、検索履歴、購買履歴など、日々膨大なデータが収集され、さまざまな形でビジネスに活用されている。これらのデータは、オンラインでの入力やクリックによって生成された、いわば「バーチャルデータ」というべきものだ。一方で、IoTの進展によって、それまでオフラインの世界にしかなかったリアルなモノの変化や人の動きなどもデータ化して収集できるようになってきた。これらは現実(リアル)の事物に即したデータということで、「リアルデータ」と呼ぶことができる。

このリアルデータ活用の可能性に着目しているのが、東京大学大学院工学系研究科電気系工学専攻 教授の森川博之氏だ。リアルデータは、従来のバーチャルデータとどのように異なり、今後どのように活用されていくのか。森川氏に話を聞いた。

現実を反映する「リアルデータ」

森川氏はIoT(Internet of Things)の領域で長年研究を重ねてきた研究者だ。IoTという言葉が生まれる前、ユビキタスコンピューティング(*1)などが注目された10年以上前から同分野の研究を続けている。

「われわれの研究で特徴的なのは、『リアル』から取得できるデータを対象としていることです。今までインターネットにつながっていなかったものがつながることで、どんな可能性が生まれるのかを探る研究を行っています」(森川氏)


東京大学大学院工学系研究科電気系工学専攻 教授 森川博之氏

具体的に同氏の研究室は、大きく2つの領域でリアルデータを研究している。1つは、人やモノの動き、変化などを検出・感知するセンサーから、「どのようにしてデータ収集できるか」という領域。もう1つは、「集めたデータをどのように活用するか」という領域である。

前者はセンサーネットワークといわれる分野で、“データ収集の方法論”が中心の研究だ。そして後者は、たとえば風力発電機の稼働データをどのように分析したら故障を予知できるか、といったデータ活用法を研究している。

今後、IoTが進展し、あらゆる産業のリアルデータが取得できるようになったとして、どのように活用できるのか。それを考えるためには、前提としてリアルデータの特徴を知ることが大切だと森川氏は話す。

「特徴は大きく2つあります。まず、リアルデータのほとんどが、時系列データ(ストリームデータ)(*2)だということ。時系列に沿ってデータ量が増加していくので、時系列を保持したままデータを管理するためには、従来のバーチャルデータとは異なる手法が必要です。そして、もう1つ重要なのが、リアルデータは取得しづらいことも多いということ。たとえば、風力発電に使うタービンが壊れる予兆を知りたくても、タービンは頻繁に壊れないので過去の故障データがとりづらい。つまり、収集できるデータ量が少ないため、どうしたらタービンが壊れるのか、予測が難しいのです」(森川氏)

一方で、バーチャルデータにはそのような制約はない。たとえばGoogleのAlphaGo(*3)は、コンピューター同士で対戦を繰り返すことによって必要なデータを無尽蔵に生成できる。データ量からすれば、リアルデータはまだビッグデータと呼ぶレベルには達していない。しかし人間のリアルな生活にひもづいたデータだけに、有効に活用できれば人間の生活を大きく変革する可能性がある。

仮説がなければ、収集したデータは宝の持ち腐れになる

リアルデータを収集・活用するには、実世界の機器にセンサーなどを設置する必要がある。それは当然コストをともなうので、あらかじめ、データを活用して何ができるのか「仮説」を持っておかなければならない。

「現状、まだまだリアルデータの活用事例は多くありません。ただ、バーチャルデータの事例は豊富なので、それを参考にしつつ『このデータを収集したら、こんなことができるのではないか』という仮説を立てることが重要です。仮説がないままむやみにデータ収集すると、せっかく集めたデータをうまく活用できず埋もれさせてしまい、コストばかりがかかってしまいます」(森川氏)

森川氏がバーチャルデータの活用事例として話してくれたのは、米大手スーパーマーケットチェーンの「Target」のケースだ。


Targetのウェブサイト。Targetは消費者の購買分析に定評があるという。

「6年ほど前、ニューヨークタイムズ紙が『Targetは顧客の購買履歴を分析して、妊娠初期の女性を検知することに成功した』と報じました。これはおそらく、『顧客の買い物には一定の傾向がある』という仮説のもとに購買データを収集し、そしてその途中で、『もしかしたら購入した商品を分析すれば妊娠初期の女性を見つけることができるのでは』という新たな仮説が生まれたことで、実現したのだと思います。仮説を持っていなければ、購買データから妊婦を特定する取り組みなどできません。収集したデータをうまく活用するには、頭を柔軟にし、何に使えるかを常に考えて仮説を立てることが大切です」(森川氏)

成果を意識しすぎないことが成功の秘訣

仮説を持つことは重要だ。しかし、最初から「このデータはこのように活用する」と決めつけてしまうと、貴重な活用の機会を奪ってしまうことにもなる。特にリアルデータの活用事例には、思いもよらない形で成果へとつながる可能性があるからだ。リアルデータの活用で成果を生み出すために必要なのは、仮説設計の段階では成果を意識しすぎないことだと森川氏は念を押す。

「成功事例が少ない世界では、始める前から、『どれだけの売り上げが立つ』とは明言できません。仮説を立てる段階で成果をどのように出せるかまで事細かに考えていては、いくら待っても実行フェーズに進まない。『何かの役に立つかもしれない』といったレベルでもいいので、仮説を立てたら、まずは施策を走らせることが重要なのです」(森川氏)

リアルデータの活用は実践している事例が少なく、成功パターンを見つけ出すことも容易ではない。しかし、可能性は無数に存在する。その可能性を見つけるためにも、さまざまな仮説を立て、データを拾い上げていくことが重要なのだ。

では、デジタル化が進んでいくことで、今後産業はどのように変化していくのか。後編では、森川氏にその部分に関して掘り下げて話を聞く。

この記事の後編を読む

注釈:
(*1)人が生活するあらゆる場所にコンピューターがあり、いつでも使える環境のこと。
(*2)時間の経過に沿って一定の間隔で記録されたデータのこと。天候データやプラント稼動データなどが一例。事象が発生したタイミングで取得されるデータ(SNSの投稿データなど)は時系列データには含まれない。
(*3)イギリスのディープマインド社が開発した囲碁AI。2017年には世界のトップ棋士である中国の柯潔に3戦3勝した。

プロフィール

東京大学大学院工学系研究科電気系工学専攻 教授 工学博士  森川 博之氏

1987年東京大学工学部卒。モノのインターネット/M2M/ビッグデータ、センサネットワーク、無線通信システム、情報社会デザインなどの研究開発に従事。OECDデジタル経済政策委員会副議長、新世代M2Mコンソーシアム会長、総務省情報通信審議会委員。国土交通省国立研究開発法人審議会委員など。

  • はてなブックマーク
  • follow us in feedly

Insight for Dの
ページにいいねしよう!

「いいね!」してInsight for Dの最新情報をチェック

Q. Yahoo! JAPANのデータソリューションは何がスゴイんですか? 答えはこちら

Q. Yahoo! JAPANのデータソリューションは何がスゴイんですか? 答えはこちら

Insight for Dの公式Facebookページ、Twitterでも最新情報や取材の様子を発信中。