AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

AI 연구자 Mollick의 현재 진단, 지금이 형태를 결정할 마지막 창문

사진 출처: One Useful Thing (Ethan Mollick)

2023년 ChatGPT가 나왔을 때, 사람들은 AI와 함께 일하는 법을 배웠습니다. 이제 Wharton 스쿨 교수 Ethan Mollick은 그 단계가 끝났다고 말합니다. 지금은 AI에게 일을 맡기는 시대입니다. 그리고 이 전환이 얼마나 빠르게, 얼마나 넓은 범위에서 일어나고 있는지 — 그게 그의 최근 글의 핵심입니다.

출처: The Shape of the Thing – One Useful Thing (Ethan Mollick)

AI는 지금 얼마나 빠른가

Mollick이 제시하는 숫자들을 보면 흐름이 보입니다. 구글 프루프 Q&A 벤치마크에서 대학원생이 전공 외 분야에서 34%를 맞출 때, 최신 AI는 94%를 기록합니다. 복잡한 실무 과제에서 숙련된 인간 전문가와 비교하는 GDPval 평가에서는 최신 AI가 82%의 경우 동등하거나 더 나은 결과를 냅니다. 그리고 이 곡선들은 아직 꺾이지 않았습니다.

중요한 건 수치 자체보다 방향입니다. Mollick은 이 지수적 성장이 단순히 “AI가 더 똑똑해지는 것”을 넘어, 사람들이 하룻밤 사이에 AI에 대한 인식을 바꾸는 임계점들을 계속 넘기고 있다고 봅니다. 이미지 생성, 영상, 코딩, 추론 — 각 영역이 차례로 그 임계점을 통과했습니다.

“코드를 쓰지도, 보지도 않는다”

Mollick이 가장 주목한 사례는 보안 소프트웨어 회사 StrongDM의 3인 팀이 구축한 소프트웨어 팩토리입니다. 이들의 규칙은 두 가지입니다. 코드는 인간이 쓰지 않는다. 코드는 인간이 검토하지 않는다.

작동 방식은 이렇습니다. 인간이 제품 로드맵을 작성하면, 코딩 에이전트가 소프트웨어를 만들고, 테스트 에이전트가 시뮬레이션 고객 환경에서 검증합니다. 에이전트들이 서로 피드백을 주고받으며 결과를 개선하고, 인간은 완성된 결과물만 확인한 뒤 배포합니다. 인간 엔지니어 한 명당 하루 AI 토큰 비용으로 1,000달러 이상을 씁니다.

Mollick의 관점에서 이 사례가 중요한 이유는 특정 기술 때문이 아닙니다. AI가 이미 조직 운영 방식 자체를 실험하게 만들 수준에 도달했다는 신호이기 때문입니다.

한 주 만에 벌어진 일들

올해 2월 마지막 주, Mollick이 “앞으로의 일상을 미리 보여준 주”라고 부르는 시간이 있었습니다.

2월 22일, 금융 리서치 회사 Citrini Research가 AI가 2028년까지 다수의 기업을 붕괴시킨다는 가상 시나리오를 발표했습니다. 소설이었지만 월가가 반응했고 주가가 출렁였습니다. 나흘 뒤 금융 서비스 기업 Block은 40% 대규모 해고를 발표하며 AI를 이유로 내세웠습니다. 그 다음 날엔 미 국방부와 Anthropic 사이에서 Claude 사용 규칙의 통제권을 둘러싼 공개 충돌이 벌어졌습니다.

Mollick은 각 사건의 실제 내막이 처음 보도와 달랐다고 짚습니다. Citrini 보고서는 픽션이었고, Block 해고에서 AI의 역할은 과장됐으며, Anthropic-Pentagon 갈등은 훨씬 복잡한 맥락이 있었습니다. 그러나 그는 이 주간을 이렇게 읽습니다. AI 능력에 대한 갑작스러운 인식이 시장 반응을 부르고, 고용에 실질적 영향을 미치며, 정책 갈등과 뒤엉키는 패턴 — 이것이 앞으로의 일상이 될 것이라고.

RSI, 이제는 SF가 아닌 로드맵

Mollick이 마지막으로 언급하는 것은 재귀적 자기 개선(RSI)입니다. AI가 더 나은 AI를 만드는 데 쓰이는 피드백 루프입니다. OpenAI는 2월 공개한 Codex 모델에 대해 “자기 자신을 만드는 데 기여한 첫 번째 모델”이라고 밝혔습니다. Anthropic의 Dario Amodei는 다보스에서 Anthropic 내부 엔지니어들이 더 이상 코드를 직접 쓰지 않는다고 언급했고, Google DeepMind의 Demis Hassabis는 모든 주요 AI 랩이 이 루프를 닫기 위해 적극적으로 작업 중이라고 인정했습니다.

Mollick은 RSI가 반드시 실현된다고 주장하지 않습니다. 컴퓨팅, 데이터, 연구 난이도에서 병목이 생길 수 있고, LLM이 어느 수준 이상으로는 개선되지 않을 가능성도 있습니다. 다만 한 가지는 분명합니다. RSI는 더 이상 이론적 개념이 아니라 주요 AI 기업들의 실제 로드맵에 올라와 있다는 것입니다.

불확실성은 무력감이 아니다

Mollick의 진단을 한 문장으로 압축하면 이렇습니다. AI의 형태가 이제 보이기 시작했지만, 그 형태를 결정할 창문은 아직 열려 있다.

그는 지금 AI를 어떻게 사용할지 답을 찾아내는 조직이 다른 모든 이들의 선례가 된다고 봅니다. 규칙도, 역할 모델도 아직 없는 지금이 오히려 기회라는 시각입니다. 이 창문이 얼마나 오래 열려 있을지는 알 수 없습니다.

원문에는 Mollick이 2023년부터 추적해온 AI 이미지 진화 사례와 METR 벤치마크에 대한 비판적 시각, StrongDM 팩토리의 구체적 작동 방식도 담겨 있습니다.

참고자료:


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다