独立変数と従属変数
研究や分析を行う際に、ある事柄の原因や説明となる変数と、その結果として観察される変数という、二つの基本的な種類の変数が用いられます。前者を「
独立変数(independent variable)」、後者を「従属変数(dependent variable)」と呼びます。
定義と基本的な関係
独立変数は、対象となる研究や分析の範囲において、他の変数から
独立して存在し、その値が直接操作されたり、他の変数に影響されずに観測されたりする変量です。これは、探求の対象となる事柄の原因や説明要因として想定されます。
一方、従属変数は、
独立変数の値に応じて変化すると仮定される変量です。これは、
独立変数によって説明される結果や現象を表します。従属変数は、数学的な関数など、変数間の特定の関係性があるという前提に基づいて、
独立変数の値に依存して変化すると考えられます。
多くの研究や
実験において関心の中心となるのは、この従属変数の変化です。統計分析では、
独立変数を「説明変数」とも呼び、その値を変化させたときに従属変数がどのように反応するかを詳細に調べます。特に
実験では、
実験者が意図的にその値を操作したり、特定の条件を設定したりできる変数が
独立変数として扱われます。モデル構築や
実験設計の主な目的の一つは、
独立変数が従属変数に与える影響の性質や大きさを明らかにすることです。
独立変数には、
時間、
空間上の位置、物質の
密度や
質量、
流量など、直接操作されたり、他の変数に影響されずに観測されたりする様々な要因が含まれます。また、将来の従属変数の値を予測するために、
過去の観測値が
独立変数として用いられることもあります。
独立変数と従属変数の直接的な関係だけでなく、他の潜在的な要因(
交絡変数など)の影響を排除または考慮するために、無関係に見える
独立変数がモデルや
実験に含まれることもあります。
数学における捉え方
純粋数学において、関数は特定の入力に対して一つの出力を対応させる
規則と定義されます。この文脈では、関数の入力として用いられる変数を
独立変数、入力によって決定される出力を表す変数を従属変数と呼びます。例えば、最も一般的な関数の表記である `y = f(x)` において、`x` は
独立変数、`y` は従属変数です。
関数は、単一の
独立変数だけでなく、複数の
独立変数を持つことも可能です。多変数関数 `z = f(x, y)` の場合、`z` が従属変数、`x` と `y` が
独立変数となります。また、複数の従属変数を持つ関数は、ベクトル値関数と呼ばれることがあります。
統計学とモデル化における適用
数理モデルや統計分析、特に回帰分析では、従属変数の
集合と
独立変数の
集合との間の関係性を定式化し、研究することが中心となります。例えば、単純な
線形回帰モデルは以下の形式で表されます。
`yi = a + bxi + ei`
ここで、`yi` は `i` 番目の観測における従属変数の値、`xi` は同じ観測における
独立変数の値です。`a` は切片、`b` は
独立変数が従属変数に与える影響の大きさを表す傾き(回帰係数)です。そして、`ei` は「誤差項」と呼ばれ、
独立変数だけでは説明できない従属変数のばらつきや、測定誤差などを含みます。
独立変数が複数ある場合は、重回帰モデルとなり、式は `yi = a + b1xi,1 + b2xi,2 + ... + bnxi,n + ei` のように拡張されます。
統計データの分析において、二つの変数間の関係を視覚的に示す
散布図を作成する際には、慣習的に
独立変数を水平軸(X軸)に、従属変数を垂直軸(
Y軸)にプロットすることが多いです。
実験計画法においては、
実験者がその水準(値)を自由に設定または選択できる変数が
独立変数に相当し、その
独立変数の操作によって結果として観察される応答変数が従属変数となります。
多変量解析・機械学習における呼称
多変量解析や機械学習の分野では、
独立変数と従属変数はしばしば異なる名称で呼ばれます。
- - 従属変数:目的変数(target variable)、応答変数(response variable)、ラベル属性(label attribute)
- - 独立変数:説明変数(explanatory variable)、予測変数(predictor variable)、特徴量(feature)、入力変数(input variable)
教師あり学習では、既知の入力データ(特徴量)とそれに対応する出力データ(目的変数)のペアを用いてモデルを構築し、未知の入力データに対する目的変数の値を予測します。一方、
教師なし学習では目的変数は存在しません。
独立変数の主な類義語
文脈や分野によって、
独立変数は以下のような様々な名称で呼ばれます。
- - 予測変数(Predictor Variable)
- - 回帰変数(Regressand Variable)
- - 共変量(Covariate)
- - 操作変数(Manipulated Variable)
- - 説明変数(Explanatory Variable)
- - 曝露変数(Exposure Variable)(信頼性工学など)
- - 危険因子(Risk Factor)(医療統計学など)
- - 特徴(Feature)(機械学習、パターン認識)
- - 入力変数(Input Variable)
- - 制御変数(Control Variable)(計量経済学など)
これらの用語は、それぞれの分野における
独立変数の特定の役割や特性を強調するために使い分けられます。