だから、このデータからいえることは、無い。(2017年のECMJコラムです)
データ活用の本質はデータではなくて、「何があったか」にあります。昔、よく講演で話していたエピソードです。
*このデータからいえることは、無い―――というのが答え
もう4年以上前のことになります。東京のとあるショッピングモールを運営している会社さんに呼ばれました。ECのショッピングモールではなくて、実店舗が入るショッピングモールの方ですね。
担当の方がいいました。「石田さんはデータのプロだとお聞きしています」。まぁそこまででもないすけどね。「リサーチ会社に頼んで作ってもらったデータがあるので見て、考察をもらえませんか」。ほぅほぅ私でお力になれるならば。
リサーチ会社に作ってもらったというデータ。「ショッピングモール来場者の男女比」「ショッピングモール来場者の購読している新聞」みたいなデータが15コくらい並んでいました。たぶん入口でカチカチ数字を取ったり、アンケートをお願いしたりしたのだと思います。そのリサーチに1,000万円近くかけた、といっていた気がします。
私がつらつらデータを見ていると、担当の方が「一応、データを見ながら我々が考えたことはこちらです」と気づきのメモを見せてくれました。データの特徴を記してくれているようです。2、3分だと思いますが、データを見ての私の考察です。このデータからいえることは、無い―――というのが答えでした。
*単に数字の羅列をみているだけではわからないこと
なぜかというと、データには必ずその裏側「要因」「原因」があります。
たとえば「ショッピングモール来場者の男女比」が男性80対女性20だとします。そこで「うちのモールは男性の方が多いから、来月のイベントは男性向けにした方が良さそうだね」と考えるのは早計です。
男性80対女性20のデータが出たら、「なぜこの集計期間はこの男女比になったのか?」を考えなくてはいけません。もしかしたらこの日に男性向けのイベントがあったのかもしれません。男性向けファッションブランドのオープン直後だったのかもしれません。これは単にデータという数字の羅列をみているだけではわからないことです。
同じように「来場者の購読している新聞」として讀賣新聞の比率が多かったとします。「だから、うちは朝日新聞に広告をもっと出した方がいいね」と考えるのは早計です。もしかしたらその週に讀賣新聞に広告を出していたのかもしれない。だったら、讀賣新聞の購読者がショッピングモールに来る比率が高いわけだ、という話。やっぱり、これもデータをみているだけではわからないことなのです。
だから、このデータからいえることは、無い―――が答えです。担当の方、少し驚かれていましたが・・(すいません)
*「何があったか」を記しておくことが大切
データ活用は「原因と結果」の相関性を探す長い旅です。「結果=データ」だけなく「原因=何があったか」の情報がないと回らないものです。データはITシステムから昨日のものも1年前のものも抽出することができます。しかし「何があったか」は1年前まで遡ることができません。だから、「何があったか」をきちんと記しておくことが大切です。
付け加えるならば、データ分析とは「過去のデータと現在のデータの比較」です。その点でいっても、ある一時点だけの「比較のできない」データを見せてもらっても、やっぱり私としては「このデータからいえることは、無い」になってしまうのです。
【合わせて読みたい】
データ分析をアクション(施策)に繋げるための考え方。その1【no.1558】
データ利活用のポイント集 – 経済産業省