平均値の種類や使い分け方法とExcel関数

※記事の最後に、Excelの統計関数をまとめたスプレッドシートへのリンクを用意しました。よろしければご利用ください。

統計解析で用いられる統計量のなかでも、最も頻繁に利用されるのは「平均」ではないでしょうか。しかし、平均と言っても様々な種類があり、用途に酔って使い分けなければいけません。ここでは、平均の種類や使い分けの方法、Excelでの算出方法について説明します。

平均値の種類と求め方

1. 算術平均(相加平均)

よく言われる「平均」は、「算術平均(相加平均)」です。n個のデータの総和をnで割ったものです。

算術平均

利用シーンとしては、一般的な整数データによる母集団がある場合。エクセルではAVERAGE関数を使います。

AVERAGE(数値 1, [数値 2], …) Officeヘルプ

算術平均は異常値の影響を受けやすいという特徴があります。算術平均が利用できるケースは、「正規分布」と呼ばれる左右対称の山のような分布の場合に適しています。

外れ値による影響を受ける場合、中央値や最頻値の利用が推奨されますが、ある程度正規分布に近いが異常値がいくつか見られる時は、データの上下端を省く関数を利用することもできます。

TRIMMEAN(配列, 割合) Officeヘルプ

割合には、省くパーセンテージを指定します。

AD

2. 幾何平均(相乗平均)

とある値の前年度比率が、前々年度は120%、前年度は80%、今年度は150%とした場合、普通に算術平均してしまうと

(1.2+0.8+1.5) / 3 = 1.17 平均117%

となってしまいますが、実際の成長実数値は

1 × 1.2 × 0.8 × 1.5 = 1.44

で、元の数値よりも144%改善されています。これから平均する時も、

0.44 ^ 1/ 3 = 0.13 = 平均113%

と、母数が総和でなく総積なので、n個で割らずに1/n乗する必要があります。これが、「幾何平均(相乗平均)」です。

微妙な差のようで、ここはしっかりと正しいデータを使いたいところ。これをエクセルで算出する際は、GEOMEAN関数を使います。

GEOMEAN(数値 1, [数値 2], …) Officeヘルプ

数値には、前年度比などのパーセンテージを指定します。

3. 調和平均

あまり使ったことがないのですが、「時速」などの数値を平均する際に使われるのが、「調和平均」です。

調和平均

仮に100kmの距離間を、行きは25km/h、帰りは50km/hで往復した場合、平均時速は

(1/25 +1/50) * 1/2 = 0.03 = 1/33.333…

という事で、平均時速は約33.3km/hとなります。実際にも

(100km ÷ 25km/h) + (100km ÷ 50km/h) = 6h
200km ÷ 6h = 33.333…km/h

という事で、正しい事がわかります。

これをエクセルで算出する関数が、HARMEAN関数になります。

HARMEAN(数値 1, [数値 2], …) Officeヘルプ

上記式のHが算出されます。

算術平均を取り扱う場合は、種類と併せて中央値・最頻値を併用する

ウェブ解析を学んでいく中で、「平均値は異常値の影響を受け易いので注意」という前述の話題が出ます。データの傾向を見るために算術平均を用いる場合は、「中央値」や「最頻値」を併用することで、偏り具合が見えてきます。

また、同じ算術平均値でも「ばらつき」の度合いによっては分布の傾向が変わります。平均の種類と併せて、その他の基本統計量も利用するようにしましょう。

Excel関数 – 統計関数一覧リンク

Excel関数の中でも、統計関数の説明や構文をスプレッドシートにまとめました。Excel 2010以降、統計関数は特により制度の高い関数へと変更になっていますのでご注意ください。

下記フォームにメールアドレスをご記入いただくと、スプレッドシートのURLへの遷移と記載したメールの送付をいたします。よろしければご利用ください。