2013年7月5日金曜日

【解析いろは15】ログ以外のデータはどこから持ってくる?

ぼっちの解析者はどこから情報やデータを持ってくればよいのか、というのが今日のテーマです。

会社に所属していても、こういうデータがあれば、解析結果を補足できるのになぁ・・・ということはありませんか? でもうちの会社にそんなデータなんてないし、と諦めてませんか?
大丈夫です。普通持ってませんから。コンサルをしている会社ならどこでも豊富なデータを保持しているという訳ではありません。デモグラフィックなデータを出せるほど精密で母数の多い客観的なデータを自前で持っているところはごく一部の会社でしょう。

■インターネットからデータを探す
まずは検索して探す。ワードを変え、該当した記事が掲載されているサイトやブログの他の記事も見て掘り起こすことです。中には「そんなのを無料で公開してくれてありがとう!」というすごいデータもあります。調査会社が発行・公開しているホワイトペーパーの抜粋プレスリリースも役に立ちます。 探す作業や資料の読みこみに時間はかかりますが、勉強にもなります。
私が愛用(?)しているのは、ニールセン電通PR総務省の白書コーナー、ビデオリサーチインタラクティブ等。他にもウェブ系、ソーシャル系のコンサル、ニュースサイトのホワイトペーパーも参考になります。大きな会社だから大丈夫~と信用するのではなく、データの収集方法や母集団、提供元の情報を確認する必要があります。

■データを買う

この他、「買う」という手があります。白書として売ってるので必要に応じて購入します。●●白書系はめくってるだけでかなり面白いですよ~。

■あくまでも「補足」。“正しい”っぽいデータに逃げない。
但し、これらのデータでの裏付けはおおまかな傾向等を把握するためので、あくまでも「補足」であるということを忘れないでください。統計学的データとか客観データとか多数の平均とか、そういうものに判断の根拠を求める人はいないと思いますが、しかし、人というものは不安であれば「確かな数字」に根拠を見出したがるものなのです。それはメインであるデータ、例えばアクセスログ解析データを真に理解していない、といえるのではないでしょうか。

白書などの統計データの調査方法はもちろん統計学的手法に則り、相応の母数を集めて集計しているわけですが、しかしそれでも偏りや集計ミスも散見します。例えば家庭内PCからのアクセスが主である、など。あるジャンルを調査するのにデバイスが結構偏ってるような気がしますが、母集団を家庭内PCからのアクセスという風に限定してしまえばそういう集団の特性、ということは言えるのかなと思いますケド。
また、一般的に公開されるホワイトペーパー、概要は意図が含まれています。その結論を出すのに不都合なデータは、まあ普通は掲載されていませんよね。探しているこちら側もまず結論ありきではないでしょうか。それに見合った裏付けデータを探しているだけの話で。

■「統計リテラシー」
分析し説明をする側としては、数字・統計を上手にかつ正しく利用しなくてはいけない、と常に思います。だから私は前述の他社が提供・公開しているデータを報告書に掲載する場合は、補足として目立たないようにページの一番後ろにくっつけます。もちろん、どこそこからの転載と情報元もきちんと指定通り掲載します。

先日、NHKのクローズアップ現代で「数字のカラクリ・データの真実 ~統計学ブームのヒミツ~」という番組がやっていました。これ再放送かアーカイブでもいいので、ぜひ見ていただきたいです。
http://www.nhk.or.jp/gendai/kiroku/detail_3375.html

これを飲んだら98%が痩せた、95%に効果があった、という謳い文句の意味が分かります。まったくのウソではなくても「数字の信仰」を利用したマジックというべきものです。私は文系で数字とか計算は非常に苦手なのですが、「統計リテラシー」は数字の好き・嫌い問わずに多くの人が知るべきだと思いました。
また、すでにビッグデータ解析によって ウェブサイトへのアクセス状況の予測が高い精度で予測できる統計学の数式が編み出されていることにも驚嘆しました。
いいぞ、もっとやれ! え? それじゃあ解析の仕事なくなっちゃうじゃん?て思ったアナタ。解析は「それ」だけに限ったことではありませんし、解析ツールもどんどん進化しています。なくなる・効率化される作業は今後も増えていきます。その中で、何が自分にできるのか、解析担当としての真の職責はなんなのかを考えるべきじゃないでしょうか。あ、自分にぐっさり刺さりました。

さて、番組を見ていなかった人に質問です。「心筋梗塞の人の95%、犯罪者の95%が食べていたという食べ物を禁止すべきか。」この食べ物ってなんだと思います?

0 件のコメント:

コメントを投稿