AI가 AI를 만드는 시대, 재귀적 자기개선은 어디까지 왔나

2026-05-19

﹒

2 minutes

Anthropic의 코드 중 과반이 이제 Claude Code로 작성됩니다. OpenAI는 GPT‑5.3‑Codex가 자기 자신을 만드는 데 기여했다고 밝혔습니다. AI가 AI를 만드는 시대가, 조용히 시작되고 있습니다.

사진 출처: McKibillo / IEEE Spectrum

출처: Recursive Self-Improvement Edges Closer In AI Labs – IEEE Spectrum

RSI란 무엇이고, 어디까지 왔나

재귀적 자기개선(RSI, Recursive Self-Improvement)은 AI가 스스로를 개선하는 능력을 말합니다. 가장 엄밀한 의미에서는 시스템이 아이디어를 생성하고, 결과를 평가하고, 인간의 개입 없이 자신의 방법 자체를 수정하는 완전한 자율 루프를 가리킵니다.

지금 그 수준에 도달한 시스템은 없습니다. 하지만 루프의 상당 부분이 이미 닫혀가고 있습니다.

OpenAI는 GPT‑5.3‑Codex가 훈련 디버깅, 배포 관리, 평가 결과 분석 등 자기 자신을 만드는 과정에 기여했다고 밝혔습니다. Anthropic은 코드의 과반이 Claude Code로 작성된다고 공개했습니다. 두 시스템 모두 인간이 여전히 방향을 설정하고 결과를 검토하지만, AI가 개발 파이프라인의 핵심 역할을 맡기 시작했다는 점은 분명합니다.

더 구체적인 사례들

Google DeepMind의 AlphaEvolve는 LLM을 활용해 알고리즘을 진화시키는 코딩 에이전트입니다. 신경망 아키텍처 최적화, 데이터센터 스케줄링, 칩 설계 등에 이미 투입되어 있습니다. AlphaEvolve에 참여한 컴퓨터과학자 Matej Balog는 “시스템이 발견한 것을 보면서 우리도 그로부터 배웁니다”라고 말했습니다.

한편 AlphaChip의 공동 리드들은 Ricursive Intelligence라는 스타트업을 창립해 AI로 AI 칩을 설계하는 작업을 추진 중입니다. 현재 1~2년 걸리는 설계 사이클을 수일로 단축하는 것이 목표입니다. 3단계 계획의 마지막은 AI가 더 나은 칩을 설계해 더 강력한 AI를 훈련시키는 재귀적 루프를 구현하는 것이지만, 여전히 인간 감독 하에서입니다.

UBC와 Sakana AI의 연구팀은 Darwin Gödel Machines(DGM)를 선보였습니다. 이 시스템은 진화 알고리즘을 통해 LLM 기반 코딩 에이전트를 개선하고, 에이전트가 자신의 코드를 직접 수정해 더 잘 개선할 수 있도록 합니다. 최신 버전은 자기 개선의 메타 메커니즘, 즉 어떻게 개선할 것인가 자체도 수정할 수 있습니다.

같은 팀이 개발한 AI Scientist는 올해 3월 Nature에 발표되었습니다. 연구 아이디어 생성, 소프트웨어 실험 실행, 논문 작성, 동료 검토까지 연구의 전체 루프를 자동화하려는 시도입니다.

왜 아직 완전하지 않은가

UBC의 Jeff Clune는 “핵심 부품들이 모두 그럭저럭은 작동하지만, 완벽하지는 않다”고 말합니다. AI는 아이디어를 생성하고 구현하고 평가하는 데 있어 아직 인간 최고 수준에 미치지 못합니다.

Allen Institute for AI의 Nathan Lambert는 ‘손실 있는 자기개선(LSI, Lossy Self-Improvement)’이라는 개념을 제안합니다. 대형 AI 시스템은 갈수록 복잡해지고, 그 복잡성을 관리하는 것이 AI 연구자의 주요 임무가 되어 개선의 속도가 둔화될 수 있다는 논지입니다. 수십억 달러가 투입된 시스템을 AI에 맡겨 독립적으로 운영하는 것도 현실적으로 쉽지 않습니다.

Meta의 연구자들은 RSI 대신 ‘공동 개선(co-improvement)’을 목표로 삼아야 한다고 주장합니다. 인간이 루프 안에 남아 통찰을 제공하고 AI를 인류에게 유익한 방향으로 이끄는 것이 더 빠르고 안전하다는 시각입니다.

위험과 미래

25명의 AI 전문가를 인터뷰한 최근 연구에 따르면, 23명이 자동화된 AI 연구개발이 지능 폭발로 이어질 수 있다는 가능성을 열어뒀습니다. AI 안전 비영리단체를 운영하는 David Scott Krueger는 AI가 작성하는 코드 비율이 99%에 달하는 시점을 개발 중단을 검토해야 할 레드라인으로 제시하며, “어쩌면 지금 그 선을 넘고 있는 것 같다”고 말합니다.

RSI의 미래는 거대한 단일 AI보다 다양한 에이전트들의 생태계에 가까울 수 있습니다. AI Scientist처럼 결과를 논문으로 패키징해 공유하는 방식은 에이전트들이 서로의 성과를 기반으로 발전하는 구조를 만들 수 있습니다.

Clune는 인간 과학자들이 AI 연구에서 서서히 밀려나는 과정을 단계적으로 예측합니다. 먼저 하위 작업에서 손을 떼고 교수나 팀 리드처럼 연구 방향을 결정하는 역할로, 그 다음엔 더 넓은 연구 의제를 설정하는 역할로, 마지막으로는 감독 역할만 남게 되는 방향입니다. 그는 “암 치료를 위해 내 취미를 포기할 수 있다”고 했습니다.

참고자료:

Like?

AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

AI Sparkup

AI가 AI를 만드는 시대, 재귀적 자기개선은 어디까지 왔나

RSI란 무엇이고, 어디까지 왔나

더 구체적인 사례들

왜 아직 완전하지 않은가

위험과 미래

AI Sparkup 구독하기

Comments

답글 남기기 응답 취소

More posts

AI 에이전트 프리랜서 자동화율 16%, 8개월 새 6배 뛰다

AI 텍스트 워터마크, SynthID·유니코드 모두 쉽게 뚫리는 이유

장기 실행 AI 에이전트, 기억을 버릴 것인가 압축할 것인가

MCP 서버 만들기 전에 확인할 8가지 질문