"인공지능(AI)이 인간 의사보다 정확하게 암을 찾아낸다"는 소식에 건강검진 수검자들의 기대감이 커지고 있다. 하지만 화려한 홍보 문구 뒤에 숨겨진 기술적 한계와 '가짜 양성(위양성)'의 위험성을 경계해야 한다는 전문가들의 고언이 나왔다.
한국의학바이오기자협회는 최근 서울 중구 한국프레스센터에서 '의료 패러다임의 대전환, AI 건강검진의 현재와 미래' 심포지엄을 개최하고, 급변하는 검진 현장의 실태를 진단했다.
미래 의료의 핵심 도구, 'K-메디슨'의 선봉장
기조 강연을 맡은 강대희 서울의대 예방의학교실 교수는 AI를 미래 의료의 핵심 가치인 '4P(예방·예측·맞춤·참여)'를 실현할 결정적 도구로 정의했다.
강 교수는 "AI는 검진 전 고위험군 발굴부터 검진 중 판독 편차 감소, 검진 후 맞춤형 사후관리까지 전 과정에 개입할 것"이라며, "앞으로의 검진은 일회성 검사를 넘어 지속적인 '구독형 건강관리' 모델로 진화해 K-메디슨의 세계화를 이끌 것"이라고 내다봤다.
실제 임상 현장에서의 성과도 공유됐다. 안지현 한국의학연구소(KMI) 수석상임연구위원은 대장내시경 시 병변 누락을 방지하거나, 안저 사진 촬영만으로 심혈관질환 위험을 예측하는 등 추가 방사선 노출 없이 검사의 효율을 극대화하는 사례들을 소개하며 AI와 의료진의 '상생 모델'을 강조했다.
'논문 속 숫자'의 함정... 현장 정확도는 절반 수준?
그러나 AI의 완벽성을 맹신해서는 안 된다는 신중론도 거셌다. 김형진 삼성서울병원 국제진료센터 교수는 "상당수 AI 업체가 홍보하는 90% 이상의 정확도는 최적화된 조건에서의 '논문 속 숫자'일 가능성이 크다"고 꼬집었다.
실제 의료 현장은 병원마다 장비와 촬영 방식이 다르고 환자 특성도 제각각이다. 한 메타 분석 결과에 따르면, 실험실에서 92%의 정확도를 보였던 AI 모델이 실제 현장에서는 52.1%까지 급락한 사례도 확인됐다. 숫자에 안심하기보다 한국인 환자를 대상으로 실제 검증이 이루어졌는지를 따져봐야 한다는 지적이다.
특히 '위양성(병이 없는데 있다고 판정하는 것)' 문제는 심각한 부작용을 낳을 수 있다. 저선량 폐 CT의 경우 AI의 위양성률이 최대 49.3%에 달한다는 보고도 있다. 김 교수는 "AI가 제시하는 이상 소견은 진단이 아닌 '추가 확인 신호'일 뿐"이라며 "이를 확진으로 오해하면 불필요한 추가 검사와 침습적 시술로 이어질 수 있다"고 경고했다.
정부 "국가검진 도입은 시기상조... 비판적 질문 던져야"
정부 역시 AI의 국가건강검진 도입에 대해서는 신중한 태도를 유지하고 있다. 정혜은 보건복지부 건강증진과장은 "기술 활용을 위해서는 지금까지 축적된 근거와 임상적 유효성에 대한 엄격한 검증 과정이 더 필요하다"고 밝혔다.
심포지엄을 마무리하며 김형진 교수는 "AI 건강검진을 불신할 필요는 없지만, 그 결과를 비판적으로 해석하는 태도가 안전한 의료로 가는 길"이라며 "AI 시대에 중요한 것은 더 나은 기술이 아니라 의료진과 환자가 던지는 '더 나은 질문'"이라고 강조했다.
이번 심포지엄은 AI가 가져올 혁신에 환호하기에 앞서, 의료 데이터의 편향성과 임상적 실효성을 냉정하게 점검해야 한다는 의료계의 숙제를 남겼다.

