Coronary artery atherosclerosis can cause serious complications like angina pectoris or myocardial infarction. Coronary artery calcium score (CACS), which can be measured from coronary CT angiography (CCTA) is a hallmark of atherosclerosis. If coronary artery calcification is detected, prophylactic treatment and additional invasive testing may be considered to prevent disease progression. However, CCTA is costly and cannot be routinely taken. More patients with coronary artery atherosclerosis will be able to receive early diagnosis and treatment if high CACS can be accurately predicted solely by electrocardiograms (ECGs) which is cost-effective, non-invasive, radiation-free and frequently performed during health check-ups. Therefore, in this study, we aimed at developing an artificial intelligence model that detects coronary artery calcification using only ECG signals. In this study, a total of 13,683 CACS were extracted by applying regular expression to the coronary artery CCTA readings stored in the electronic medical record database of Ajou University Hospital. Among patients 18 years of age or older, 8,178 standard 12-lead ECGs were extracted in the period of 60 days around those readings and labeled with the corresponding CACS. Only the raw waveform of the ECG was used as input for model training. Among the 12 leads, the 3 leads closest to the orthogonal axis (leads I, II, V2) were used as input. Moreover, the 10-second ECGs were divided into 2.5 second intervals for data augmentation. The primary outcome of this study was defined as CACS400. Additionally, we performed two secondary analyses in order to assess the model’s performance among subclinical patients. Secondary analysis dataset 1 was defined as ECGs from patients of whom CCTA and ECG were not prescribed or measured in the emergency room and secondary analysis dataset 2 was defined as ECGs from patients of whom CCTA was taken at a health checkup and ECG was not prescribed or measured in the emergency room. Models were trained for each of the two secondary analysis datasets. The artificial neural network built in this study is based on residual networks. K-fold group cross validation was performed and the average performance of all folds was derived. The total study population consists of 8,178 ECGs from 5,765 patients, the secondary dataset 1 consists of 6,976 ECGs from 5,372 patients and the secondary dataset 2 consists of 2,336 ECGs from 1,996 patients. The AUROC was 0.7940.028 for the model trained with total study population, 0.7940.024 for the model trained with secondary analysis dataset 1 and 0.7330.043 for the model trained with secondary analysis dataset 2. At threshold=0.5, accuracy, sensitivity, specificity were 0.7980.039, 0.5570.092, 0.8300.054 for the model trained with total study population, 0.7640.121, 0.6900.156, 0.7650.139 for the model trained with secondary analysis dataset 1 and 0.7150.146, 0.5600.213, 0.7250.166 for the model trained with secondary analysis dataset 2. When the threshold was adjusted so that sensitivity=0.8, accuracy, specificity were 0.6600.044, 0.6420.048 for the model trained with total study population, 0.6600.027, 0.6430.030 for the model trained with secondary analysis dataset 1 and 0.5500.107, 0.5310.112 for the model trained with secondary analysis dataset 2. Recently, studies have been published that utilize artificial intelligence (AI) to detect even minute changes in ECGs that were previously unreadable by human eyes. This study was conducted in concordance with these new discoveries. The AI model constructed in this study is easily applicable in clinical practice since only the ECG is used as input. The fact that high performance was maintained for the models constructed with the two secondary analysis datasets suggests that these models can be used as a screening test for early detection of coronary atherosclerosis before clinical symptoms develop. Moreover, the results from several studies indicating that higher CACS leads to higher incidence of coronary events suggest that our model can be used as a predictor of such coronary events.
죽상경화에 의해 관상동맥의 내부 지름이 좁아지면 심장 근육으로의 혈류 공급에 장애가 생겨 협심증, 심근경색과 같은 허혈성 심질환이 발생할 수 있다. 관상동맥 석회화는 죽상경화증의 표지자로 사용되고 있고, 이는 관상동맥 CT 혈관촬영술에서 관상동맥석회화수치로 측정할 수 있다. 관상동맥 석회화가 발견되었을 경우, 질병의 진행을 막기 위해 예방적 치료 및 추가적인 침습적 검사를 고려할 수 있다. 하지만 관상동맥 CT 혈관촬영술은 고비용이기 때문에 일상적으로 시행되기는 어렵다. 상대적으로 저렴하고 비침습적이며 방사선 피폭이 발생하지 않고 건강검진 등에서도 자주 시행되는 심전도 검사만으로 관상동맥 석회화 정도를 탐지할 수 있다면 더 많은 관상동맥 죽상경화증 환자가 조기 진단 및 치료를 받을 수 있을 것이다. 따라서 본 연구에서는 심전도만을 활용해서 관상동맥 석회화를 탐지하는 인공지능 모델을 개발하고자 하였다. 본 연구에서는 아주대학교병원 전자의무기록 데이터베이스에 저장되어 있는 관상동맥 CT 혈관촬영술 판독문에 정규표현식을 적용하여 관상동맥석회화수치를 총 13,683건 추출하였다. 만 18세 이상의 환자들 중 해당 판독문들과 60일 전후로 측정된 해당 환자의 표준 12 유도 심전도를 총 8,178건 추출한 후 해당 관상동맥석회화수치로 라벨링하였다. 심전도의 원본 파형만을 인공지능 모델 훈련에 입력변수로 사용하였다. 표준 12 유도 심전도 중 직교축에 가장 근접한 3개의 유도인 I, II ,V2 만을 입력으로 사용하였다. 또한 데이터 증대를 위해 10초 길이의 심전도를 2.5초씩 분할하여 사용하였다. 본 연구의 주요 결과변수는 관상동맥석회화수치 400 이상 또는 미만으로 정의하였다. 그리고 임상증상이 생기기 전의 환자들만을 대상으로도 분석을 진행하고자 관상동맥 CT 혈관촬영술 및 심전도가 응급실에서 처방되거나 측정되지 않은 경우(이차분석 데이터셋 1), 관상동맥 CT 혈관촬영술은 건강검진에서 시행되었고 심전도는 응급실에서 처방되거나 측정되지 않은 경우(이차분석 데이터셋 2)에 대해서도 각각 모델을 구축하여 이차분석을 진행하였다. 본 연구에서는 residual network 기반의 인공신경망을 구축하였다. k-fold group cross validation을 진행하여 모든 fold의 평균 성능을 도출하였다. 전체 데이터셋의 샘플수는 8,178건, 환자수는 5,765명, 이차분석 데이터셋 1의 샘플수는 6,976건, 환자수는 5,372명, 이차분석 데이터셋 2의 샘플수는 2,336건, 환자수는 1,996명이다. 전체 데이터셋을 사용한 모델의 평균 AUROC는 0.7940.028, 이차분석 데이터셋 1을 사용한 모델의 평균 AUROC는 0.7940.024, 이차분석 데이터셋 2를 사용한 모델의 평균 AUROC는 0.7330.032였다. Threshold가 0.5일 때, 전체 데이터셋을 사용한 모델의 accuracy, sensitivity, specificity는 각각 0.7980.039, 0.5570.092, 0.8300.054, 이차분석 데이터셋 1을 사용한 모델에서는 각각 0.7640.121, 0.6900.156, 0.7650.139, 이차분석 데이터셋 2을 사용한 모델에서는 각각 0.7150.146, 0.5600.213, 0.7250.166였다. Sensitivity가 0.8이 되도록 threshold를 조정하였을 때, 전체 데이터셋을 사용한 모델의 accuracy, specificity는 각각 0.6600.044, 0.6420.048, 이차분석 데이터셋 1을 사용한 모델에서는 각각 0.6600.027, 0.6430.030, 이차분석 데이터셋 2를 사용한 모델에서는 각각 0.5500.107, 0.5310.112였다. 최근에 인공지능을 활용하여 기존에 인간의 눈으로는 판독할 수 없었던 미세한 심전도상의 변화까지도 탐지하는 연구들이 발표되었다. 본 연구도 이러한 새로운 발견들의 일환으로 수행되었다. 본 연구모델은 심전도만을 입력으로 하기 때문에 임상에서의 적용이 용이하다. 이차분석 데이터셋 2가지에 대해서도 높은 성능이 유지되었다는 사실은 본 연구모델이 임상 증상이 생기기 전에 관상동맥 죽상경화증을 조기 탐지하는 선별검사로써 활용될 수 있음을 시사한다. 또한, 여러 연구에 따르면 관상동맥석회화수치가 높을수록 coronary event의 발생률이 높아지므로, 본 연구모델은 이러한 coronary event의 예측인자로 활용될 수 있다.