오늘은 HRplot을 해석하는 방법에 대해 알아보려고 한다.

 

우선 R에서 HRplot을 그리는 방법은 매우 간단하다.

HRplot(cox_fit)

cox_regression을 수행한 cox_fit모델을 HRplot함수에 넣어주면 HRplot을 그려준다.

 

예를 들면 이런 식으로!

 

이제 여기서 해석을 해보고자한다. 

 

Hazard Ratio의 의미는, 대조군의 위험률대비 실험군의 위험률이다. 

예를 들면, HR이 1.3인 경우 '대조군의 위험률이 실험군의 위험률보다 1.3배 크다.'의 의미를 가진다.

 

HR은 세가지로 분류할 수 있는데

1보다 크거나, 1이거나, 1보다 작은것이다.

 

1보다 큰 경우: 실험군의 위험도는 증가한다.

1보다 작은 경우: 실험군의 위험도는 감소한다.

1인 경우: 실험군과 대조군의 위험률은 같다.

 

이제 간단히 HR을 알아보았으니,

HRplot을 보고 의미를 해석해보자. 

 

1. 상관관계

 

그래프에 보면, 파란색 봉과  빨강색 봉이 있다. 

이는 양의상관관계와 음의 상관관계를 의미한다.

물론 각 변수 위에 적힌 숫자는 HR을 의미하는 것으로

앞서 1보다 크면 위험도가 증가한다는 것이라는 것을 알 수 있을때,

파란색의 것들은 모두 HR 1보다 큰 값을 가진다. 

고로 우리는 파란색이 양의 상관관계를 갖는다는 것을 유추할 수 있다. 

(실제로도 그렇다)

 

2. 봉의 길이

 

봉의 길이는 95%의 신뢰구간을 의미한다.

따라서 봉의 길이가 너무 긴것보다 짧은것이 더욱 신뢰도가 높고,

봉이 중앙에 점선에 걸쳐있다면, 

HR값이 1이될수도 있는 확률을 지닌것이기 때문에

그 변수는 통계적으로 의미가 없다고 본다.

우리는 보통 의학통계에서 95%의 신뢰구간을 사용한다.

 

더보기

신뢰구간이란? 

점추정(표본집단의 통계량으로 모집단을 추정하는 방법)을 할때, 모집단의 통계량을 신뢰하기가 어려운데 이때, 모집단의 통계량이 존재할 구간을 확률로 나타낸것이 구간추정이며, 구간추정의 방법중 가장 흔히 쓰이는 것이 신뢰구간이다. 

신뢰구간은 90, 95, 99%등으로 다양하게 사용된다.

 

+ Recent posts