※記事の最後に、Excelの統計関数をまとめたスプレッドシートへのリンクを用意しました。よろしければご利用ください。
デジタルマーケティングの浸透により、取り扱うデータの量だけでなく種類も膨大となってきています。それに伴い、データを視覚的に分かりやすく表現し正しく伝えるスキルも必要性が増してきました。
棒グラフや円グラフなどでシンプルに表現することが基本的なテクニックにはなりますが、解析結果として「伝えたいことが伝わるグラフ」には、他にどんな手法があるのでしょうか?
ダッシュボードツールには様々なグラフ機能があります。RやPythonでの解析やグラフ化も効果的です。でもまずは、グラフ化の意図に沿ってエクセルでできるところから学ぶのが身につきやすいのでは?という事で、分析に使えそうなグラフの種類を紹介します。
ちなみに、概念の理解自体が難しい多変量解析は、集計・分析時間もかかるし、イメージがつかないので他人の理解も得にくいという事で、今回は実務である程度使えそうなグラフに限ります。
1. 分布図からの近似曲線
※値や軸の種類にあまり意味はありません。
2種類のデータの相関関係を出して、この値(要因)が伸びれば、これ(成果)も伸びますね、みたいな事を伝えやすいグラフ。散布図のグラフを作って、近似曲線を書くだけなので結構ラクです。
ただ気を付けなくてはいけないのが、相関係数です(エクセルでも表示できるRとかRの2乗とか)。エクセルはどんなデータでも近似曲線としてグラフを書いてくれますが、この係数が低い場合は「相関性が薄い」事になるので注意。できれば0.7くらいは欲しいところ。
たまーに調査データを示してる本で、この値が低いのに「こういう傾向にある」とか言ってしまってる事もあるけど、それは嘘になるので必ず確認して下さい。
2. 分布図からのセグメンテーション
上と同じグラフでも、目的によってその後の分析内容も変わるという例。
この場合は、データの相関ではなくて、集合の傾向を見たもの。統計的に言うと、クラスター分析というものです。「この◯グループは広告流入が多い傾向なので、滞在時間とPVが上がるような改善施策を検討」とか、「このグループは滞在時間がどうであれPVが伸びないので、サイト内で悩んでる傾向にある」とか、そんなセグメントごとの対策につなげるものとして、マーケティングでは必須の考え方でしょうか。
クラスタリングの機械学習は、今後のマーケティングではより重要度が増すことでしょう。
3. ウォーターフォールチャート
これは統計的というより視覚的なグラフです。エクセルにおける「積み上げグラフ」でも構わないのですが、その内訳がビジネスプロセスだったりユーザーの行動遷移によるものであれば、ウォーターフォールチャートの方が視覚的に理解しやすいです。
図の例では、全体の流入に対してどこでユーザーが逃げているかを示しており、一番大きなところを目立たせておけば、一目瞭然ですね。
ちなみにこのグラフ図も「積み上げグラフ」で作っていてます。データ軸を2つ用意しておいて、その2つを積み上げます。その後、下の段のグラフだけを、「塗りつぶしなし」にすると出来上がり。最初はちょっと苦戦することもありますが、知ってしまえばすぐ作れます。
4. 移動平均と標準偏差を用いた棒・面グラフ
ウォーターフォールチャートをつくるテクニックの応用版として、移動平均と標準偏差(σ)から「正常値の範囲」を決めて異常値を探る、といったことができます。
統計的には正規分布が成り立つ場合、
- 平均 ± σの区間に68.27%
- 平均 ± 2σの区間に95.45%
- 平均± 3σの区間に 99.73%
のデータが含まれることになります。移動平均を求める区間設定や、モニタリング上の正常区間設定は決めの問題になりますが、移動平均と併せて、この区間外にデータが存在した場合は異常値ととらえ詳細を分析する、といった行動が可能です。
単純に期間内の平均だけを出してしまうと、それが何の影響なのか?正常な範囲かどうか?などが不明のまま終わるケースが多くなります。行動を促すためにも、統計の活用は普段から行っておきたいところです。
他にも統計的なグラフや表現手法はいくつかありますが、やはりグラフがベースだと分析ロジックが見えやすいので説得力があります。形式は何であれ、「何が言いたいか?」が「きちんとグラフで言えてるか?」を常に念頭におきながら、日々グラフを作ってみましょう。
ちなみにこの手の内容は、覚えてすぐ次の日にでも使ってみないと、絶対忘れてもう使わなくなるので、その辺に落ちてるオープンデータとかでもいいので、ちょっと遊んでみるのが良いかと思います。
Excel関数 – 統計関数一覧リンク
Excel関数の中でも、統計関数の説明や構文をスプレッドシートにまとめました。Excel 2010以降、統計関数は特により制度の高い関数へと変更になっていますのでご注意ください。
下記フォームにメールアドレスをご記入いただくと、スプレッドシートのURLへの遷移と記載したメールの送付をいたします。よろしければご利用ください。