본문 바로가기

흥미로운 의학 이야기/의학과 기술, Hi-tech

[Hi-tech] 머신 러닝을 활용한 흉부 X-ray 판독

반응형
[Google AI Blog] Detecting Abnormal Chest X-rays using Deep Learning
https://ai.googleblog.com/2021/09/detecting-abnormal-chest-x-rays-using.html

영상 기기를 활용한 진단을 보조하기 위한 머신 러닝(ML, Machine Learning) 기술은 지금 이 순간에도 발전하고 있습니다. 이미 폐암(Lung Cancer), 결핵(Tuberculosis) 및 기흉(Pneumothorax) 등 특정 질환을 감별하기 위한 알고리즘이 개발되었으나, 해당 질환에 특이적으로만 활용할 수 있다는 한계가 있습니다. 즉, 일반적인 임상 현장에서의 활용은 제한적이라는 것입니다.

구글은 임상 현장 전반에서의 알고리즘 효율을 높이기 위해 모든 종류의 이상(Abnormalities)을 식별할 수 있는 범용 알고리즘을 개발하고자 합니다. 물론 흉부 X-ray의 결과 자체가 정상인 경우와 이상이 있는 경우 모두에서 워낙 다양하게 나타나기 때문에 이 과정은 결코 쉬운 과정이 아닙니다.

X-ray 이상 감별을 위한 딥러닝 시스템

ImageNet에서 선행학습된 EfficientNet-B7 아키텍쳐에 기반하여 개발하였습니다. 인도 아폴로 병원의 20만 개 이상의 판독 전 모델을 이용해 학습을 진행하였으며, 특정 질환을 감별해내는 것이 아닌, '정상' 소견과 '이상' 소견만을 감별하도록 학습하였습니다. 시스템을 일반화하여 적용하기 위해 진행한 평가는 아폴로 병원 자체 데이터셋(DS-1) 및 공개 데이터인 ChestX-ray14(CXR-14)을 이용하여 진행하였습니다. 미국의 방사선과 전문의 그룹이 모든 모델에 대해 판독을 진행한 결과, DS-1에서의 AUROC 값은 0.87, CXR-14에서의 AUROC 값은 0.94가 나왔습니다.

 

AUROC(Area Under ROC)란 무엇인가?

Hanley JA, McNeil BJ. The meaning and use of the area under a receiver operating characteristic (ROC) curve. Radiology. 1982 Apr;143(1):29-36. doi: 10.1148/radiology.143.1.7063747. PMID: 7063747. A..

dizarr.tistory.com

시스템은 두 개 데이터셋(DS-1, CXR-14)에서 광범위한 이상 감지 능력을 보여주었는데, 실제 임상에서의 활용 가능성을 확인하기 위해 추가적인 검토가 필요하였습니다. 따라서 시스템이 학습한 적 없는 새로운 4개의 데이터셋으로 평가를 진행한 결과, 결핵(Tuberculosis)에 대한 AUC 값은 0.95~0.97, 코로나19에 대한 AUC 값은 0.65~0.68이 나왔습니다. 위 두 개의 질환이 아니더라도 관련한 다른 이상 소견이 있을 수 있기 때문에 이상 소견의 유무를 두고 다시 진행한 평가에서는 결핵 데이터셋에서 0.91~0.93, 코로나19 데이터셋에서 0.86이 나왔습니다.

헷갈릴 수 있는 점은, 시스템의 검증을 위해 두 가지의 평가를 진행하였다는 것입니다. '이상 소견의 유무'에 대한 평가를 진행함과 동시에 '질환의 유무' 즉, 감별진단에 대해서도 평가를 진행하였습니다. 질환이 있는 경우에도 특정 이상 소견은 있을 수도, 없을 수도 있으며 질환이 없는 경우에도 특정 이상 소견이 있을 수도, 없을 수도 있습니다. 실제 진단의 과정 또한 이와 마찬가지로, x-ray 영상에 보이는 정상·이상 소견들을 종합해 최종적으로 질환에 대한 진단을 내립니다. 이러한 과정을 분리해 각각에 대한 평가를 내렸다는 것입니다.

시스템은 코로나19와 관련한 이상 소견을 감지하는 데에는 높은 AUROC 값을 보였으나, 감별 진단에는 다소 낮은 결과가 나왔습니다. 이는 코로나19에 대한 민감도가 비교적 높았기 때문으로 보이며, 이는 질환-특이적인 시스템이 추가적으로 적용될 경우 실용성이 배가될 것으로 보입니다.

임상 현장에서의 효용은?

이같은 시스템을 통해 업무 흐름을 보다 효율적으로 개선할 수 있습니다. 이상 소견이 발견된 케이스를 보다 빠르게 처리해낼 수 있게 되기 때문입니다. 시뮬레이션 결과, 이상 소견이 발견된 영상에 대한 판독 소요 시간이 28% 가까이 감소하였다고 합니다. 복잡한 이상 소견이 발견된 경우 전문의에게 할당하며, 긴급한 결정이 필요한 경우 신속하게 분류하고, 간략하게만 검토해도 충분한 영상은 비교적 후순위로 판독하는 식으로 업무 효율성을 끌어올릴 수 있습니다.

반응형