概要
算術
平均(Arithmetic Mean)または相加
平均(Additive Mean)は、広義の
平均の中で最も一般的に用いられる指標です。この値は、数の集合やデータセットから得られるもので、個数と合計を保った状態で一つの値にまとめたものです。算術
平均は、
統計学のみならず、
数学、
物理学、
経済学、
社会学、
歴史学など、多くの学問分野で使用されています。例えば、国の総生産をその国の人口で割ることによって、
平均的な収入を推計する際にも利用されます。
定義と計算
特定の数の集合を考えるとします。この集合の要素を a1, a2, …, an とすると、算術
平均 m は以下の式で定義されます。
$$
m = \frac{1}{n} \sum_{k=1}^{n} a_k = \frac{a_1 + a_2 + \cdots + a_n}{n}
$$
この式は指し示すものは、全体の合計を個数で割った結果です。
統計学では、算術
平均は「
平均値」としてしばしば単に呼ばれます。データの
平均は、変量 x の
平均値を $ar{x}$ で表します。調査や研究において、全体の
母集団から取り出したデータの
平均を計算する際には、母
平均(Population Mean)と呼ばれることもあり、記号 μ で示されます。標本の
平均は標本
平均(Sample Mean)と呼ばれ、記号 m で区別されます。
確率分布においても、
確率変数の
平均(
期待値)が算術
平均に基づいて定義されます。例えば、離散変数の場合、その
期待値は以下のように表されます。
$$
E[X] = \sum_{i=1}^{\infty} x_i P(X = x_i)
$$
これにより、
確率変数が取りうる値の
平均を求めることが可能です。
特徴とその応用
算術
平均を用いる際の重要な注意点は、外れ値の影響を受けやすいということです。特に
歪度のある分布では、算術
平均がデータの中心を正確に表さないことがあります。たとえば、経済データでは、所得の算術
平均が人生の不平等を正確に表現しない場合があります。外れ値や極端なデータが存在する場合、中央値などのロバストな
統計量がより適切な代表値とされることが多いです。
算術平均と中央値の違い
算術
平均と中央値はしばしば混同されますが、必ずしも等しいとは限りません。例えば、データセットが {1, 2, 3, 4} の場合、算術
平均は 2.5、中央値も同じく 2.5 になります。しかし、データセット {1, 2, 4, 8, 16} の場合、算術
平均は 6.2 に対して中央値は 4 となります。この場合、算術
平均はデータの
偏りを強く反映していることが分かります。この性質は経済的な分析にも利用され、例えばアメリカでは収入の中央値が算術
平均を下回る現象が見られます。
特殊な状況
位相や周期的なデータを扱う場合、算術
平均を計算する際には注意が必要です。たとえば、
角度の値として 1° と 359° を考えると、その単純な算術
平均は 180° になってしまいますが、これは実際には意味がありません。ここで必要なのは、
角度を 360° の剰余として扱うことです。
その他の応用
算術
平均は、実数や複素数、ベクトルのように加法やスカラー倍が定義されている一般の代数系にも拡張されます。ここでの算術
平均は、数字の
重心の位置を表すことが可能で、これはデータの範囲や集約を理解するのに役立ちます。
まとめ
算術
平均は、多様な分野で用いられる重要な概念です。その計算方法は単純ですが、使用する場面によっては外れ値の影響を適切に考慮する必要があります。このように、算術
平均は単なる数値の集計にとどまらず、適切に使用することでさまざまな分析手法の基盤となります。