journal.chestnet.org/action/showPdf?pii=S0012-3692%2821%2900031-3

 

IF가 10점대의 저널 논문으로 좋은 예시라고 생각합니다. 

 

목표: 천식 악화를 예측하는 머신러닝 모델을 수립

 

1. Baseline characteristics

 

 

2. 천식악화 outcome 분류 

  • nonsevere asthma exacerbation : systemic steroid를 28일 이하로 사용한 환자 
  • ED : Emergency Room visit history
  • hospitalization : Hospitalization visit history 

3. 논문의 특징

  • 약물 사용력을 포함( outcome에 직접적인 영향을 줄 수 있음에도 불구하고)
  • NaN데이터를 살림 (n = 10만명)
  • SHAP로 각 feature의 importance를 설명하고, LightGBM모델로 성능을 최대로 끌어냄
  • AUC, recall, precision, PPV, NPV 제안
  • 메인 feature는 이전에 약물조합(ICS, LABA), HDiCs, oral glucocorticoid burst history 등 그 후 race, age등. outcome의 종류에 따라 변함.

4. 사용모델

  • Logistic regression 
  • Random forest
  • Light GBM 

5. Test data: 1만명의 replicative cohort를 사용하여 test.

 

6. 결론

  • 약물정보가 1st risk factor.
  • 만약, lung function test data가 들어간다면, FEV1, FVC, FEV1/FVC가 main feature가 되지만 모델 performance에 영향을 주지 않음
  • Asthma exacerbation의 경우에는 LightGBM과 logistic regression model의 결과가 다르지 않으나, ED와 hospitalization에 대해서는 outperform

model performance

 

7. SHAP 

 

 

 

+ Recent posts