ミンコフスキー距離

概要

ミンコフスキー距離は、数学、特に線形空間において、二つの点間の「隔たり」を測るための尺度として広く用いられる概念です。この距離は、我々が日常的に馴染んでいる直線距離であるユークリッド距離や、都市のブロックを移動する際に考えるようなマンハッタン距離など、様々な距離の定義を包括する一般化された形式を提供します。名称は、20世紀初頭に活躍したドイツの著名な数学者ヘルマン・ミンコフスキーに敬意を表して付けられました。

定義

n次元空間上の任意の二つの点XとYを考えます。点Xの座標を $(x_1, x_2, \ldots, x_n)$、点Yの座標を $(y_1, y_2, \ldots, y_n)$ とします。このとき、ミンコフスキー距離は、正の実数であるパラメータpを用いて以下のように定義されます。

まず、各座標軸における二点間の差の絶対値 $|x_i - y_i|$ を計算します。次に、これらの絶対値をそれぞれp乗し、全ての成分について合計します。最後に、この合計値の1/p乗根を取ることで、二点間のミンコフスキー距離 $D(X, Y)$ が得られます。数式で表現すると以下のようになります。

$$ D(X, Y) = \left( \sum_{i=1}^{n} |x_i - y_i|^p \right)^{\frac{1}{p}} $$

この定義において、パラメータpの値が、どのような種類の距離を計算するのかを決定します。

距離としての性質

数学において「距離計量」と呼ばれるためには、いくつかの厳密な数学的条件（非負性、同一律、対称性、三角不等式）を満たす必要があります。ミンコフスキー距離がこれらの条件をすべて満たし、真の意味での距離計量となるのは、パラメータpが1以上 $(p \geq 1)$ の実数である場合に限られます。

特に重要なのは、3点間での距離の関係を示す三角不等式です。これは「任意の二点間の直接距離は、他のいかなる点を経由した場合の距離の合計よりも短くなるか、または等しくなる」という性質であり、直感的な距離の概念の根幹をなします。もしパラメータpが1未満 $(p < 1)$ の場合、ミンコフスキー距離はこの三角不等式を満たさなくなるため、通常の距離計量としては扱われません。しかし、このようなpの値に対しても、1/p乗根の操作を除いた形はF-ノルムという別の重要な概念として意味を持ちます。

特殊なケース

ミンコフスキー距離の定義は非常に柔軟であり、パラメータpの値を特定の数値に設定したり、極限を考えたりすることで、 familiar な距離の定義を導出できます。

p = 1 の場合:
$$ D(X, Y) = \sum_{i=1}^{n} |x_i - y_i| $$
これはマンハッタン距離として知られています。都市のブロックを移動する際の距離にたとえられ、L1距離や都市ブロック距離とも呼ばれます。

p = 2 の場合:
$$ D(X, Y) = \left( \sum_{i=1}^{n} (x_i - y_i)^2
ight)^{\frac{1}{2}} = \sqrt{\sum_{i=1}^{n} (x_i - y_i)^2} $$
これは最も一般的で、日常生活で「距離」として認識されることが多いユークリッド距離です。空間における二点を結ぶ直線の長さに対応し、L2距離とも呼ばれます。多次元におけるピタゴラスの定理そのものと言えます。

p が無限大 ($p \to \infty$) に近づく場合:
パラメータpが無限大に近づく極限を考えると、ミンコフスキー距離は以下の形になります。
$$ \lim_{p \to \infty} \left( \sum_{i=1}^{n} |x_i - y_i|^p \right)^{\frac{1}{p}} = \max_{i=1}^{n} |x_i - y_i| $$
これはチェビシェフ距離（L∞距離）と呼ばれ、二点間の各座標成分の差の絶対値のうち、最も大きいものを距離と定義します。

p が負の無限大 ($p \to -\infty$) に近づく場合:
同様に、pが負の無限大に近づく極限も考えることが可能です。
$$ \lim_{p \to -\infty} \left( \sum_{i=1}^{n} |x_i - y_i|^p \right)^{\frac{1}{p}} = \min_{i=1}^{n} |x_i - y_i| $$
この場合、距離は各座標差の絶対値の最小値として定義されます。

応用と意義

ミンコフスキー距離は、二点間の成分ごとの差の絶対値を、p乗平均の考え方を用いて統合し、その結果をスケーリングしたものと解釈することもできます。パラメータpの値を調整することで、この「平均化」の方法、ひいては距離空間の構造そのものを様々に変化させることができます。たとえば、中心からの距離が等しい点の集合である単位円（あるいは高次元での単位球）の形状は、pの値によって大きく変わります。p=1ではひし形、p=2では円、p→∞では正方形になります。

データ分析、機械学習、パターン認識、統計学など、多岐にわたる分野で、データ間の類似性や非類似性を評価するための基本的なツールとして活用されています。分析の目的やデータの特性に応じて適切なパラメータpを選択することが、効果的な分析を行う上で重要となります。

もう一度検索