算術平均

概要



算術平均(Arithmetic Mean)または相加平均(Additive Mean)は、広義の平均の中で最も一般的に用いられる指標です。この値は、数の集合やデータセットから得られるもので、個数と合計を保った状態で一つの値にまとめたものです。算術平均は、統計学のみならず、数学物理学経済学社会学歴史学など、多くの学問分野で使用されています。例えば、国の総生産をその国の人口で割ることによって、平均的な収入を推計する際にも利用されます。

定義と計算



特定の数の集合を考えるとします。この集合の要素を a1, a2, …, an とすると、算術平均 m は以下の式で定義されます。

$$
m = \frac{1}{n} \sum_{k=1}^{n} a_k = \frac{a_1 + a_2 + \cdots + a_n}{n}
$$

この式は指し示すものは、全体の合計を個数で割った結果です。

統計学における平均



統計学では、算術平均は「平均値」としてしばしば単に呼ばれます。データの平均は、変量 x の平均値を $ar{x}$ で表します。調査や研究において、全体の母集団から取り出したデータの平均を計算する際には、母平均(Population Mean)と呼ばれることもあり、記号 μ で示されます。標本の平均は標本平均(Sample Mean)と呼ばれ、記号 m で区別されます。

確率分布における平均



確率分布においても、確率変数平均期待値)が算術平均に基づいて定義されます。例えば、離散変数の場合、その期待値は以下のように表されます。

$$
E[X] = \sum_{i=1}^{\infty} x_i P(X = x_i)
$$

これにより、確率変数が取りうる値の平均を求めることが可能です。

特徴とその応用



算術平均を用いる際の重要な注意点は、外れ値の影響を受けやすいということです。特に歪度のある分布では、算術平均がデータの中心を正確に表さないことがあります。たとえば、経済データでは、所得の算術平均が人生の不平等を正確に表現しない場合があります。外れ値や極端なデータが存在する場合、中央値などのロバストな統計量がより適切な代表値とされることが多いです。

算術平均と中央値の違い



算術平均と中央値はしばしば混同されますが、必ずしも等しいとは限りません。例えば、データセットが {1, 2, 3, 4} の場合、算術平均は 2.5、中央値も同じく 2.5 になります。しかし、データセット {1, 2, 4, 8, 16} の場合、算術平均は 6.2 に対して中央値は 4 となります。この場合、算術平均はデータの偏りを強く反映していることが分かります。この性質は経済的な分析にも利用され、例えばアメリカでは収入の中央値が算術平均を下回る現象が見られます。

特殊な状況



位相や周期的なデータを扱う場合、算術平均を計算する際には注意が必要です。たとえば、角度の値として 1° と 359° を考えると、その単純な算術平均は 180° になってしまいますが、これは実際には意味がありません。ここで必要なのは、角度を 360° の剰余として扱うことです。

その他の応用



算術平均は、実数や複素数、ベクトルのように加法やスカラー倍が定義されている一般の代数系にも拡張されます。ここでの算術平均は、数字の重心の位置を表すことが可能で、これはデータの範囲や集約を理解するのに役立ちます。

まとめ



算術平均は、多様な分野で用いられる重要な概念です。その計算方法は単純ですが、使用する場面によっては外れ値の影響を適切に考慮する必要があります。このように、算術平均は単なる数値の集計にとどまらず、適切に使用することでさまざまな分析手法の基盤となります。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。