AI Sparkup

복잡한 AI 세상을 읽는 힘 ⚡

AI가 방사선의학과 의사를 대체하지 못하는 세 가지 이유

AI가 폐렴 진단에서 전문의보다 높은 정확도를 보이고 700개 이상의 의료 AI 모델이 승인받았지만, 방사선의학과 의사의 수요와 연봉은 오히려 사상 최고치를 기록하고 있습니다.

2017년 스탠포드대가 발표한 CheXNet은 충격적이었습니다. 10만 개 이상의 흉부 엑스레이로 훈련한 이 AI 모델은 폐렴 진단에서 전문 방사선의학과 의사 패널보다 높은 정확도를 보였거든요. 1초 만에 새로운 스캔을 분석할 수 있고, 일반 GPU 하나면 돌아갔습니다.

AI 모델의 방사선의학 진단 정확도 비교
AI 모델이 방사선의학과 의사보다 높은 진단 정확도를 보이는 사례들 (출처: Works in Progress)

그 이후 Annalise.ai, Lunit, Aidoc 같은 회사들이 수백 가지 질병을 진단하는 AI 모델을 내놓았습니다. 현재 FDA 승인을 받은 방사선의학 AI 모델만 700개가 넘어요. 전체 의료 AI 기기의 4분의 3을 차지합니다.

그런데 이상한 일이 벌어졌습니다.

예측과 정반대로 흘러간 현실

2016년 튜링상 수상자인 제프리 힌튼은 “방사선의학과 의사 양성을 지금 당장 중단해야 한다”고 선언했습니다. 디지털 입력, 패턴 인식, 명확한 벤치마크가 있는 방사선의학이야말로 AI가 인간을 대체할 최적의 분야라고 봤거든요.

하지만 2025년 현실은 완전히 다릅니다. 미국 방사선의학과 레지던트 자리는 사상 최대인 1,208개로 늘었어요. 2024년보다 4% 증가한 수치입니다. 공석률도 역대 최고치를 기록하고 있고요.

방사선의학과 의사 연봉 증가 추이
2015년 대비 48% 급증한 방사선의학과 의사 평균 연봉 (출처: Works in Progress)

돈도 더 많이 받습니다. 2025년 방사선의학과는 미국에서 두 번째로 높은 연봉을 받는 전문과가 됐어요. 평균 52만 달러로 2015년보다 48%나 올랐습니다.

이 데이터는 Works in Progress의 심층 분석에서 나온 것인데요, AI 기술이 실제 현장에서 어떻게 작동하는지 보여주는 흥미로운 사례입니다.

AI가 현장에서 막히는 세 가지 벽

1. 벤치마크와 현실의 간극

실험실에서 훌륭한 성과를 보인 AI 모델들이 병원에서는 맥을 못 춥니다. 대부분의 모델은 훈련 데이터에 많이 포함된 일반적인 질병만 진단할 수 있어요. 훈련된 환경과 다른 곳에서는 성능이 20%포인트까지 떨어지기도 합니다.

문제는 의료 데이터의 특성에 있어요. 훈련용 데이터는 진단이 명확하고 이미지 품질이 좋은 쉬운 사례들로 구성됩니다. 하지만 실제 병원에서는 애매한 각도로 찍힌 사진, 흐릿한 이미지, 미묘한 증상들이 가득하거든요.

2. 규제와 보험의 높은 벽

FDA는 의료 영상 소프트웨어를 두 종류로 나눕니다. 의사가 검토해야 하는 보조 도구와 혼자서 판단하는 자율 도구죠. 자율 도구가 되려면 훨씬 높은 기준을 통과해야 해요. 흐릿한 스캔이나 범위를 벗어난 케이스를 거부할 수 있어야 하거든요.

더 큰 문제는 의료사고 보험입니다. 보험사들은 AI가 대규모 피해를 낼 수 있다고 봅니다. 한 알고리즘이 고장 나면 수많은 환자가 한꺼번에 피해를 볼 수 있으니까요.

실제로 버클리(Berkley) 보험사는 ‘Absolute AI Exclusion(절대 AI 면책)’ 조항을 만들어 AI로 인한 피해는 아예 보상하지 않겠다고 선언했습니다. 다른 보험사들도 “의사가 검토하고 승인한 진단에만 보상이 적용되며, 소프트웨어가 자율적으로 생성한 진단에는 보상하지 않는다”는 조건을 계약서에 명시하고 있어요.

3. 방사선의학과 의사는 진단만 하지 않는다

2012년 연구에 따르면 방사선의학과 의사가 이미지 판독에 쓰는 시간은 전체 업무의 36%에 불과합니다. 나머지 시간에는 검사 감독, 결과 설명, 레지던트 교육, 프로토콜 검토 등을 해요.

AI가 진단을 완벽하게 해낸다 해도 방사선의학과 의사는 다른 업무로 시간을 옮길 수 있습니다. 완전한 대체가 아니라 업무 분담이 일어나는 거죠.

방사선의학과 의사의 업무 시간 분배
방사선의학과 의사의 실제 업무 구성: 이미지 판독은 36%에 불과 (출처: Works in Progress)

90년대 실패의 재현

사실 비슷한 일이 90년대에도 있었어요. 유방암 검진용 컴퓨터 보조 진단 시스템이 그랬습니다. 실험에서는 의사보다 뛰어난 성과를 보였죠. FDA 승인도 받았고 정부가 돈까지 더 줬어요.

하지만 현실은 달랐습니다. 43개 병원 43만 건을 분석한 결과, AI 시스템은 더 많은 생검을 유발했지만 암 발견율은 늘리지 못했어요. 오히려 환자를 10% 더 자주 재검사하게 만들었습니다.

문제는 의사들의 행동 변화였어요. 실험실에서와 달리 실제 진료에서는 AI에 과도하게 의존했거든요. AI가 알려주지 않으면 안전하다고 여기는 경우가 많았습니다.

제본스 역설: 효율성이 오히려 수요를 늘린다

2000년대 병원들이 필름에서 디지털로 바뀌면서 흥미로운 현상이 나타났어요. 방사선의학과 의사의 생산성이 27-98% 향상됐습니다. 스캔 한 장 읽는 시간도 줄었고요.

그런데 방사선의학과 의사가 해고되지 않았어요. 오히려 영상 검사 이용률이 60% 늘었습니다. 검사 결과 나오는 시간이 76시간에서 38시간으로 줄어들면서 의사들이 더 자주 검사를 처방하기 시작한 거예요.

빨라진 CT 덕분에 예전에는 심각한 외상 환자에게만 시행하던 전신 CT가 이제는 일상적인 선택이 됐습니다. 가격(대기 시간)이 떨어지니 수요가 늘어난 대표적인 사례죠.

기술 혁신이 일자리에 미치는 복잡한 현실

방사선의학 사례는 AI가 일자리에 미치는 영향이 생각보다 복잡하다는 걸 보여줍니다. 기술적 성능만으로는 인간을 대체할 수 없어요. 행동 변화, 제도, 인센티브가 모두 얽혀 있거든요.

물론 페이스북처럼 AI가 인간을 대체한 분야도 있어요. 콘텐츠 검수의 94-98%를 AI가 담당합니다. 하지만 의료처럼 업무가 다양하고 위험도가 높으며 수요가 탄력적인 분야에서는 다른 결과가 나타나네요.

역설적이게도 기계가 좋아질수록 방사선의학과 의사들은 더 바빠졌습니다. AI 시대의 일자리 미래를 예측할 때 기술 성능만이 아니라 이런 복합적 요인들을 함께 고려해야 하는 이유입니다.


참고자료:


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments