AI 에이전트가 코드를 더 빠르게 만들수록, 정작 엔지니어가 다뤄야 할 대상은 코드 너머로 넓어지고 있습니다. Chalmers University of Technology와 Volvo Group 연구자들이 이 흐름을 이론화한 논문을 발표했습니다.
Robert Feldt 교수 팀이 발표한 논문 “The Semi-Executable Stack”은 AI 에이전트 시대에 소프트웨어 엔지니어링의 대상이 어떻게 달라지는지를 분석합니다. 핵심 주장은 단순합니다. AI가 엔지니어를 대체하는 게 아니라, 엔지니어링해야 할 것의 범위 자체가 코드 바깥으로 확장된다는 것입니다.
출처: The Semi-Executable Stack: Agentic Software Engineering and the Expanding Scope of SE – arXiv / Feldt et al. (Chalmers University of Technology, Volvo Group)
코드만이 엔지니어링의 대상이었던 시대
지금까지 소프트웨어 엔지니어링이 다루는 핵심 대상은 코드였습니다. 명확한 규칙으로 실행되고, 테스트할 수 있고, 버전 관리가 되는 것. 엔지니어링 방법론도 전부 여기에 맞춰 발전해왔습니다.
그런데 AI 에이전트 기반 시스템이 조직 안으로 들어오면서 달라지기 시작했습니다. 지금 실제 시스템 동작을 결정하는 건 코드만이 아닙니다. 어떻게 질문하냐에 따라 결과가 달라지는 프롬프트, 여러 에이전트가 어떤 순서로 움직이는지를 정의하는 워크플로우, 언제 사람의 판단을 개입시킬지를 정하는 에스컬레이션 규칙. 이것들은 시스템 행동을 코드만큼 강하게 결정하지만, 결정론적으로 실행되지 않습니다. 사람의 해석이나 확률적 판단에 의존합니다. 연구팀은 이를 “semi-executable artifacts(반실행형 아티팩트)”라고 부릅니다.
6개의 링: 엔지니어링 대상의 스펙트럼
논문은 이 변화를 “Semi-Executable Stack”이라는 6개 링 모델로 정리합니다.

중심에서 바깥으로 갈수록 실행이 덜 결정론적이 됩니다.
- 링 1: 클래식 코드 — 결정론적 실행
- 링 2: 프롬프트와 자연어 명세
- 링 3: 오케스트레이션된 에이전트 워크플로우
- 링 4: 가드레일·모니터링 등 통제 시스템
- 링 5: 의사결정 루틴 같은 운영 조직 로직
- 링 6: EU AI Act 같은 사회·제도적 적합성
소프트웨어 엔지니어링은 오랫동안 링 1과 링 2에 집중해왔습니다. 그런데 지금은 링 2부터 5까지가 실질적인 엔지니어링 대상으로 떠오르고 있고, 링 6은 점점 더 “실제로 작동하는가”를 결정하는 요소가 되고 있습니다.
연구팀이 가장 큰 공백으로 지목한 건 링 5와 6입니다. 코드를 다루는 엔지니어링 방법론은 수십 년에 걸쳐 축적됐지만, 조직의 의사결정 루틴이나 제도적 적합성을 엔지니어링하는 방법론은 아직 제대로 존재하지 않습니다.
익숙한 문제들, 새로운 엔지니어링 과제로
논문은 AI 에이전트 시대에 자주 제기되는 비판들을 “무시해야 할 이유”가 아니라 “해결해야 할 엔지니어링 과제”로 재정의합니다.
에이전트가 환각(hallucination)을 일으킬 때, 그건 테스팅과 모니터링이 더 중요해진다는 신호입니다. AI가 코드를 더 빠르게 만들어낼수록, 유지보수 비용도 함께 올라갑니다. 논문이 특히 주목하는 건 “prompt drift”입니다. 누군가 프롬프트를 조금 수정했는데 시스템 동작이 달라지고, 나중에 왜 그렇게 됐는지 아무도 설명할 수 없는 상황입니다. 코드의 버그와 다를 바 없지만, 기존 버전 관리나 테스팅 방식으로는 잡아내기 어렵습니다.
희소해지는 것은 “무엇을 만들지” 결정하는 능력
논문은 이렇게 씁니다. “희소해지는 스킬은 더 빠르게 만드는 능력이 아니라, 무엇을 만들거나 바꿀 가치가 있는지 결정하는 능력이다. 어떤 링이 실제로 바뀌는지, 그 변화를 어떻게 검증하고 거버넌스하고 유지할 것인지.”
AI 에이전트를 링 1과 2의 효율화 도구로만 쓰는 팀은 생산성 이득을 얻겠지만, 더 큰 질문인 조직 재설계를 놓치게 됩니다. 코드가 자동화될수록, 오히려 코드 너머의 영역을 엔지니어링하는 역량이 더 중요해진다는 게 논문의 결론입니다.
이 논문은 2026년 리우데자네이루에서 열린 Agentic Engineering 워크숍 키노트의 개념적 동반 논문으로, 실증 연구보다는 의제 설정과 진단에 초점을 맞추고 있습니다.
참고자료: AI agents aren’t replacing software engineering but expanding it far beyond code, researchers argue – The Decoder

답글 남기기