According to the National Health Insurance Service(NHIS) in 2013, 3.9% of adults aged 30 years or older have chronic kidney disease, and 16.5% are over 65 years old. In particular, renal insufficiency causes many complications in the onset of the disease, which causes many patients to die as their diseases worsen. Nevertheless, the initial symptoms are not clear, so it is rare that patients feel a kidney abnormality in the patient 's position and want to enter the hospital. Studies using electronic health records (EHR) have been conducted to detect these chronic kidney diseases early. Recently, as the technology of deep learning has rapidly developed, it has been actively researched and utilized in the medical field and has shown good performance. In addition, various experiments have been made to modify the model structure of the deep learning, and there have been cases in which performance varies depending on the structure. However, there are relatively few cases of studies for the prediction of chronic kidney disease in the medical field by experimenting with various types of deep learning model structures. In this paper, we evaluated the risk of chronic kidney disease using diagnostic and prescription information of EHR data, and compared the performance of several structural deep learning models. We extracted the weights of the learned data and confirmed the information of the time points with high weight in the prediction of chronic kidney disease. The results of this study were as follows: National Health Insurance Corporation sample DB, 81.09% of Accuracy, 87.75% of the area under the Receiver Operating Characteristics Curve (AUROC), 52.72% of the Area under the Precision-Recall Curve (AUPRC) and 83.03% of weighted F1-score. The accuracy of the database of Ajou University Hospital was 82.07%, 88.24% of AUROC, 63.61% of AUPRC, 82.93% of weighted F1-score. Based on this, it is expected that the proposed model will effectively contribute to the early detection, delay, and reduction the prevalence of chronic kidney disease.
2013년도 질병관리본부의 국민건강통계에 따르면 30세 이상의 성인 중 3.9%가 만성 신질환(chronic kidney disease)을 가지고 있으며, 65세 이상에서는 16.5%로 유병률이 매우 높은 질환이다. 특히 발병 과정에서 신부전증으로 인해 여러 가지 합병증들이 유발되는데, 해당 질병들이 악화되면서 많은 환자들을 사망에 이르게 만든다. 그럼에도 불구하고 초기 증상이 뚜렷하지 않아 환자가 신장 이상을 느끼고 병원에 내원하는 경우는 드문 실정이다. 이러한 만성 신질환을 조기에 예측하고자 전자의무기록(electronic health record, EHR)을 이용한 연구들이 선행되고 있다. 최근 딥러닝의 기술이 급속하게 발전하면서 의료 분야에서도 활발한 연구가 진행되고 있으며 기존의 전통적인 기계학습(Machine Learning)보다 좋은 성능을 보이고 있다. 또한, 딥러닝 분야에서 다양한 모델 구조 실험들이 이루어지고 있으며 구조에 따라 성능이 달라지는 연구 사례들이 있었다. 그러나 의료분야에서 다양한 딥러닝 모델 구조를 실험하고 만성 신질환 예측을 위한 연구 사례는 비교적 적었다. 이에 본 논문에서는 이에이치알(EHR) 데이터 중 진단과 처방 정보를 활용한 만성 신질환 위험도를 예측하였으며 여러 가지 구조의 딥러닝 모델에 따른 성능을 비교 평가하였다. 학습된 데이터의 가중치를 추출하여 만성 신질환 예측에 높은 수치를 가진 시점들의 정보들을 확인하여 정성적인 평가를 하였다. 실험 결과 국민건강보험공단 표본연구 DB에 대하여 정확도(accuracy) 81.09%, 에이유알오씨(The Area under the Receiver Operating Characteristics Curve, AUROC) 87.75%, 에이유피알씨(The Area under the Precision-Recall Curve, AUPRC) 52.72%, 웨이티드 에프원 스코어(Weighted F1-score) 83.03%를 나타냈고, 아주대학교병원 데이터베이스에 대해서 정확도 82.07%, 에이유알오씨 88.24%, 에이유피알씨 63.61%, 웨이티드 에프원 스코어 82.93%를 나타냈다. 이에 기반하여 본 연구에서 제안된 모델이 만성 신질환의 조기 발견과 지연 및 유병률을 감소시키는 데 효과적으로 기여하리라 기대한다.