マクネマー検定
マクネマー検定(McNemar's test)は、
統計学において、同じ対象者やペアから得られた二つの関連する名目データ(例えば、「はい/いいえ」のような二値の結果)の結果を比較するために使用されるノンパラメトリック検定です。特に、ある介入や時間の経過に伴う変化が、特定の方向へ偏っているかどうかを
統計的に評価したい場合に適しています。この検定は、1947年にクイン・マクネマーによって提唱されました。
検定の目的と用途
この検定の主な目的は、「限界均一性」と呼ばれる性質が満たされているかを判定することです。これは、二つの測定時点(例えば、治療前と治療後、または二つの異なるテスト結果)で結果が一致しなかった対象者において、一方の結果から他方へ変化した人数と、その逆方向へ変化した人数の間に
有意な差がない、という仮説を検証することに相当します。
マクネマー検定は、医学、心理学、社会科学など、様々な分野で応用されます。最も一般的な用途の一つは、医学における二つの診断テストの感度や特異度の比較です。同じ患者群に対して二つのテストを実施し、それぞれのテストが病気を正しく検出するか、あるいは病気でないかを正しく判断する能力が
統計的に同等であるかを調べます。全体的な一致率が高い場合でも、特定のカテゴリーへの誤分類に
偏りがないかを厳密に評価できる点が重要です。
データの準備と仮説
マクネマー検定を行うためには、まず対象者ごとの二つの測定結果を基に、以下のような2x2の
分割表にデータを整理します。
| 測定2: 結果1 | 測定2: 結果2 | 合計 |
---|
:-- | :-- | :-- | :--- |
測定1: 結果1 | a | b | a+b |
測定1: 結果2 | c | d | c+d |
合計 | a+c | b+d | N |
ここで、セルa, b, c, dには、それぞれのカテゴリーに分類された対象者の人数が入ります。例えば、測定1を「テストA」、測定2を「テストB」、結果1を「陽性」、結果2を「陰性」とすると:
a: テストA、テストBともに陽性だった人数
b: テストAは陽性、テストBは陰性だった人数
c: テストAは陰性、テストBは陽性だった人数
d: テストA、テストBともに陰性だった人数
この検定では、結果が一致しなかった対象者(セルbとセルc)に注目します。
帰無仮説(H₀)は、セルbとセルcの
母集団における確率が等しい(pb = pc)というものです。つまり、結果が一致しなかったケースにおいて、一方への変化ともう一方への変化が起こる確率に差がない、という仮説です。対立仮説(H₁)は、これらの確率に差がある(pb ≠ pc)というものです。
H₀: pb = pc
H₁: pb ≠ pc
帰無仮説を検定するために、以下のχ²
統計量(カイ二乗
統計量)が計算されます。
χ² = (b - c)² / (b + c)
この
統計量は、結果が一致しなかったケース(b + c)の中で、結果の変化にどの程度の
偏りがあるかを示します。不一致の総数 (b + c) が十分に大きい場合、このχ²
統計量は
自由度1の
カイ二乗分布に従います。
計算されたχ²値に対応するP値が、事前に設定した
有意水準(通常0.05)より小さい場合、
帰無仮説は
棄却されます。これは、観測されたセルbとセルcの人数の差は偶然によるものとは考えにくく、二つの測定結果の間には
統計的に
有意な差、すなわち結果の変化に
偏りがある(例:テストAで陽性だがテストBで陰性となる傾向が、テストAで陰性だがテストBで陽性となる傾向よりも強い、または弱い)と結論付けられます。
適用上の注意点と代替法
上記で示したχ²
統計量は、不一致の総数 (b + c) がある程度大きい場合にのみ、
自由度1の
カイ二乗分布に適切に近似されます。不一致のケースが少ない場合には、この近似の精度が低下し、検定結果が不正確になる可能性があります。
このような場合、より信頼性の高い結果を得るために、いくつかの代替手法が用いられます。代表的なものとして、正確
二項検定、連続性補正を用いたマクネマー検定、そしてmid-Pマクネマー検定などがあります。正確
二項検定は二項分布を用いて確率を直接計算します。連続性補正は近似の精度を向上させます。mid-P検定はより良好な性能を持つと報告されています。
データの扱いに関する重要なポイント
マクネマー検定では、結果が変化したケース(セルbとセルc)が分析の中心です。結果が一致したケース(セルaとセルd)は計算に直接使用されませんが、全体の状況理解には重要です。不一致の総数 (b + c) が少ないと検出力が低くなる点に注意が必要です。
最も基本的な注意点は、データが正しく「対応のあるペア」として集計されているかを確認することです。例えば、
ホジキンリンパ腫と扁桃腺摘出に関する研究例では、患者とその兄弟というペアでデータを収集しました。ペアリング情報が考慮されずに集計された最初の表ではマクネマー検定は適用できませんが、ペアごとの結果を組み合わせて集計した2x2表を作成すれば、変化の
偏りを正しく検定できます。
関連する統計手法
マクネマー検定に関連する、あるいは拡張された
統計手法には以下のようなものがあります。
二項符号検定: マクネマー検定の正確な代替手法。
コクランのQ検定: 3つ以上の関連する二値データを比較する場合の拡張。
スチュアート-マクスウェル検定: 2x2より大きい正方形の
分割表の限界均一性を検定。
コクラン・マンテル・ヘンツェル検定: 複数の層にわたる2x2
分割表を分析する手法。マクネマー検定はその特殊なケース。
結論
マクネマー検定は、対応のある二値名目データにおける変化の方向の
偏りを検出するための、シンプルかつ強力な
統計的ツールです。前後比較やペアデータの分析に広く活用されています。データの性質に応じて適切なバリエーションを選択し、ペアリング情報を正しく扱って集計することが、信頼性の高い結果を得るために不可欠です。