生存関数について
生存関数(せいぞんかんすう)または生存
時間関数は、被験者や機械が特定の
時間を越えて生存する
確率を提供する重要な関数です。この関数は、生存者関数あるいは信頼性関数とも呼ばれ、特に
工学分野では信頼性関数という用語がよく使われます。一方、生存関数という名称は、主に人間の死亡率を含む様々なアプリケーションに適用されます。生存関数のもう一つの呼び名は、相補
累積分布関数(CCDF)です。
定義
生存関数を定義するためには、連続
確率変数Tが区間[0,∞)で
累積分布関数F(t)を持つとします。このとき、生存関数S(t)は次のように表されます:
S(t) = P({T > t}) = ∫(t to ∞) f(u) du = 1 - F(t)
ここで、Pは
確率、f(u)は
確率密度関数を示します。この表記より、S(t)は対象が
時間tを超えて生存する
確率を表していることがわかります。
生存関数の具体例
生存関数の具体例として、あるグラフを考えてみましょう。このグラフでは、X軸が
時間を、Y軸が生存率を示しています。たとえば、「生存関数1」と呼ばれる場合、t = 2ヶ月に対して長く生存する
確率が0.37、つまり37%の被験者が2ヶ月以上生存することを示しています。一方、「生存関数2」では、同じくt = 2ヶ月の場合、97%が生存します。
生存関数は生存期間中央値を計算するためにも利用可能です。たとえば、生存関数2の中央値は3.72ヶ月であり、これは調査対象の50%が3.72ヶ月以上生存することを意味します。
生存分析とデータ表現
生存関数は生存データを整理し、視覚的に表示するための方法の一つです。別の方法としては、生存期間の分布を示すグラフがあり、たとえば空調システムの連続故障
時間を分析したケースでは、故障間隔が多様であり、データの
平均故障
時間は59.6
時間に達しました。これに基づいたグラフは、所定の期間における故障の分布を示し、指数分布を用いて近似することができます。
生存データの累積分布
生存データの分析では、各観測時点までの累積故障数を示すグラフも有用です。これにより、累積
故障率や
確率を視覚的に理解できます。
累積分布関数(CDF)は、生存期間が特定の
時間t以下である
確率を示します。
パラメトリックモデルと非パラメトリックモデル
生存期間のモデル化には、パラメトリックなアプローチが一般的です。指数分布や
ワイブル分布など、特定の分布に基づくモデルが存在します。特に、
ワイブル分布は危険率が
時間によって変動する様子を表現するのに適しています。対照的に、ノンパラメトリックな生存関数である
カプラン=マイヤー推定量も、データに適応する柔軟性を持っています。
期待生存期間の計算
期待生存期間は、生存関数を用いて以下のように計算されます。
E(T) = ∫(0 to ∞) S(t) dt
この関数は、
確率変数Tの期待値を示しています。ここで、S(t)は生存関数であり、これを基にした計算が行われます。期待生存期間の理解は、特に臨床試験や製造業の信頼性評価において重要です。
生存関数は、
故障率や生存
確率に関連する多くの現象を数学的に捉えるために使用され、各種分布の特性を通じて多様な応用が可能です。