반응형

생존 함수와 위험 함수의 관계

 

 생존 분석에 대해 공부를 하다 보면 생존 함수, 위험 함수가 나오게 되고, 그들의 관계를 나타내는 식이 등장한다.

 

1. 생존 함수와 위험 함수의 정의

먼저 생존 함수($S(t)$), 위험 함수($h(t)$)에 대해 설명하고 넘어가고자 한다.

 

1) 생존 함수

생존 함수 $S(t)$는 시간 $t$일 때, 살아있는 사람의 분율 (proportion)이다. 즉, 시간 $t$까지 살아남을 확률을 의미한다.

- 처음 ($t=0$)에는 모든 사람이 살아있으므로 $S(0)=1$이다.

- 시간이 무한히 흐르고 나면 모든 사람이 죽으므로 $S(\infty)=0$이다.

 

2) 위험 함수

위험 함수 $h(t)$는 그 개념이 조금 더 복잡하다. 거칠게 설명하면 다음과 같다.

"시간 $t$까지 살아남았을 때, 그 순간에 단위시간당 사망할 확률"

이 설명은 이해하기 어려우므로 예시를 들어 이해해보고자 한다.

 

(0) 상황

아침 9시에 200명으로 연구를 시작했다.

하지만 12시가 되었을 때 100명이 살아남았다.

 

(1) 1분간 관찰해보기

12시부터 12시 1분까지 10명이 죽었다고 하자. 즉, 사망할 확률은 10%(소수점으로 나타내면 0.1)이다

그렇다면, 60초동안 사망할 확률은 0.1이므로 위험 함수의 값은 다음과 같이 정해진다.

$$h(12시)= \frac {0.1} {60} = 0.00166667$$

 

그런데 위에서 위험 함수는 "그 순간에 단위시간당 사망할 확률"이라고 하였으므로 60초라는 간격은 너무 길다. 60초가 아니라 10초 동안 관찰해보자

 

(2) 10초간 관찰해보기

12시부터 12시 0분 10초까지 5명이 죽었다고 하자. 즉, 사망할 확률은 5%(소수점으로 나타내면 0.05)이다

그렇다면, 10초동안 사망할 확률은 0.05이므로 위험 함수의 값은 다음과 같이 정해진다.

$$h(12시)= \frac {0.05} {10} = 0.005$$

 

이렇게 시간 간격을 무한히 줄이기 위해 0에 가까워지는 극한을 적용하면 위험 함수의 값을 구할 수 있다.

$t$이상 살 확률을 시각 변수 $T$에 대해 $P(T\geq t)$라고 표현한다면, 위험 함수 $h(t)$는 다음과 같이 나타낼 수 있다.

$$h(t) = \lim_{\Delta t \rightarrow 0} \frac {P (t \leq T \leq t+ \Delta t \vert T \geq t)} {\Delta t} $$

 

2. 생존 함수와 위험 함수의 관계

보통 다음과 같은 관계로 나타난다.

$$h(t) = -\frac{S'(t)} {S(t)} = - \frac {dS(t)/dt} {S(t)}$$

또한 이는 일종의 미분방정식이므로 양변을 적분하고 정리하면 다음을 얻을 수 있다.

$$S(t) = \exp \left[ - \int_{0}^{t} h(u) du  \right] = e^{- \int_{0}^{t} h(u) du}$$

 

어떻게 이런 관계가 도출되는지 설명하고자 한다.

 

시간 $[0,1]$ 사이를 굉장히 큰 수 $n$에 대해 $n$개의 구간으로 나눈다.

처음 ($t=0$)에는 모든 사람이 살아있으므로 $S(0)=1$이다. 이번에는 $S \left( \frac {1} {n} \right)$을 구해볼 것이다.

그렇다면 우리가 관심을 갖는 시간의 구간은 $\left[ 0, \frac{1}{n} \right]$이다.

 

 위험 함수는 "그 순간에 단위시간당 사망할 확률"이므로 매 순간마다 다른 값을 가지는 것이 당연하지만, $n$이 매우 큰 수이므로 구간 $\left[ 0, \frac{1}{n} \right]$은 매우 짧은 찰나의 순간일 것이고, 그 사이에는 값이 거의 변하지 않는다고 봐도 무방하다. 이 구간의 $h(t)$는 $h \left( \frac {1} {n} \right)$으로 고정되어 있다고 가정하자.

 그런데 위험함수는 단위 시간당 사망할 확률이므로 기준이 구간 $[0,1]$이다. 그런데 우리가 관심을 갖는 구간은 $\left[ 0, \frac{1}{n} \right]$이므로 이 구간에서 사망할 확률은 $h \left( \frac {1} {n} \right)$에 $\frac{1}{n}$을 곱해주어야 한다.

$$\left[ 0, \frac{1}{n} \right]에~사망할~확률=h \left( \frac {1} {n} \right)\frac{1}{n}$$

이 구간에서 생존할 확률은 이 값을 1에서 빼주면 된다.

 

$$\left[ 0, \frac{1}{n} \right]에~생존할~확률=1-h \left( \frac {1} {n} \right)\frac{1}{n}$$

 

그렇다면 $S \left( \frac {1} {n} \right)$은 처음 ($t=0$)에 생존한 사람의 분율인 $S(0)$에 $\left( 1-h \left( \frac {1} {n} \right)\frac{1}{n} \right)$을 곱하여 구할 수 있다.

 

$$S \left( \frac {1} {n} \right) =S(0) \times \left( 1-h \left( \frac {1} {n} \right)\frac{1}{n} \right)=1-h \left( \frac {1} {n} \right)\frac{1}{n} $$

 

$\left[ 0, \frac{1}{n} \right]$에서의 생존할 확률을 구한 것과 같은 논리로 이를 일반화하면 $\left[ \frac{j-1}{n}, \frac{j}{n} \right]$에 생존할 확률은 다음과 같다.

$$ \left[ \frac{j-1}{n}, \frac{j}{n} \right]에~생존할~확률=1-h \left( \frac {j} {n} \right)\frac{1}{n} $$

 

한편 어떤 수 $k$에 대해  $\frac {k} {n}$ 까지 살아남을 확률을 구하는 것은

$\left[0,\frac{1}{n}\right]$에 생존한 사람이

$\left[\frac{1}{n},\frac{2}{n}\right]$에 생존한 사람이

$\left[\frac{2}{n},\frac{3}{n}\right]$에 생존한 사람이

$...$

$\left[\frac{k-1}{n},\frac{k}{n}\right]$에 생존할 확률을 구하는 것과 같다.

 

따라서 $\frac {k} {n}$ 까지 살아남을 확률인 $S \left( \frac{k}{n}\right)$은 다음과 같이 구할 수 있다.

$$\begin{align}S \left( \frac{k}{n}\right) &= S(0) \times\left(1-h \left( \frac {1} {n} \right)\frac{1}{n} \right)\times\left(1-h \left( \frac {2} {n} \right)\frac{1}{n} \right)\cdots\times\left(1-h \left( \frac {k} {n} \right)\frac{1}{n} \right)\\&=\prod_{j=1}^{k} \left( 1-h \left( \frac{j}{n} \right) \frac{1}{n} \right)\\&& \end{align}$$

 

그러므로 다음 등식이 성립한다.

$$S \left( \frac{k}{n} \right) \div S \left( \frac{k-1}{n} \right) = 1-h \left( \frac{k}{n} \right) \frac{1}{n}$$

 

이 식을 정리하면 다음을 얻게 되고

$$h \left( \frac{k}{n} \right) = - \frac{S \left( \frac{k}{n} \right) - S \left( \frac{k-1}{n} \right)}{ \frac{1}{n} S \left( \frac{k}{n} \right)}$$

 

$\lim_{ n \rightarrow \infty, \frac{k}{n} \rightarrow t}$의 극한을 씌우게 되면 다음 등식이 성립한다.

$$h(t) = -\frac{S'(t)} {S(t)} = - \frac {dS(t)/dt} {S(t)}$$

 

따라서 위 수식을 얻게 된다.

 

 

 

 

[이론] 생존 함수와 위험 함수의 관계 정복 완료!

 

작성일: 2022.11.10.

최종 수정일: 2022.11.10.

 

 

반응형

+ Recent posts