生存関数とは？意味をやさしく解説 - サードペディア百科事典

生存関数について

生存関数（せいぞんかんすう）または生存時間関数は、被験者や機械が特定の時間を越えて生存する確率を提供する重要な関数です。この関数は、生存者関数あるいは信頼性関数とも呼ばれ、特に工学分野では信頼性関数という用語がよく使われます。一方、生存関数という名称は、主に人間の死亡率を含む様々なアプリケーションに適用されます。生存関数のもう一つの呼び名は、相補累積分布関数（CCDF）です。

定義

生存関数を定義するためには、連続確率変数Tが区間[0,∞)で累積分布関数F(t)を持つとします。このとき、生存関数S(t)は次のように表されます:

S(t) = P({T > t}) = ∫(t to ∞) f(u) du = 1 - F(t)

ここで、Pは確率、f(u)は確率密度関数を示します。この表記より、S(t)は対象が時間tを超えて生存する確率を表していることがわかります。

生存関数の具体例

生存関数の具体例として、あるグラフを考えてみましょう。このグラフでは、X軸が時間を、Y軸が生存率を示しています。たとえば、「生存関数1」と呼ばれる場合、t = 2ヶ月に対して長く生存する確率が0.37、つまり37%の被験者が2ヶ月以上生存することを示しています。一方、「生存関数2」では、同じくt = 2ヶ月の場合、97%が生存します。

生存関数は生存期間中央値を計算するためにも利用可能です。たとえば、生存関数2の中央値は3.72ヶ月であり、これは調査対象の50%が3.72ヶ月以上生存することを意味します。

生存分析とデータ表現

生存関数は生存データを整理し、視覚的に表示するための方法の一つです。別の方法としては、生存期間の分布を示すグラフがあり、たとえば空調システムの連続故障時間を分析したケースでは、故障間隔が多様であり、データの平均故障時間は59.6時間に達しました。これに基づいたグラフは、所定の期間における故障の分布を示し、指数分布を用いて近似することができます。

生存データの累積分布

生存データの分析では、各観測時点までの累積故障数を示すグラフも有用です。これにより、累積故障率や確率を視覚的に理解できます。累積分布関数（CDF）は、生存期間が特定の時間t以下である確率を示します。

パラメトリックモデルと非パラメトリックモデル

生存期間のモデル化には、パラメトリックなアプローチが一般的です。指数分布やワイブル分布など、特定の分布に基づくモデルが存在します。特に、ワイブル分布は危険率が時間によって変動する様子を表現するのに適しています。対照的に、ノンパラメトリックな生存関数であるカプラン＝マイヤー推定量も、データに適応する柔軟性を持っています。

期待生存期間の計算

期待生存期間は、生存関数を用いて以下のように計算されます。

E(T) = ∫(0 to ∞) S(t) dt

この関数は、確率変数Tの期待値を示しています。ここで、S(t)は生存関数であり、これを基にした計算が行われます。期待生存期間の理解は、特に臨床試験や製造業の信頼性評価において重要です。

生存関数は、故障率や生存確率に関連する多くの現象を数学的に捉えるために使用され、各種分布の特性を通じて多様な応用が可能です。

もう一度検索