AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

OpenSkill – 정답 데이터 없이 에이전트 스킬과 검증 신호를 스스로 만드는 자기진화 프레임워크

OpenSkill은 LLM 에이전트가 배포 후 새로운 작업을 만났을 때, 정답 데이터나 성공 trajectory 없이 스스로 스킬과 검증 신호를 만드는 open-world self-evolution 프레임워크다. 핵심은 대상 작업의 답을 보지 않고도 문서, 저장소, 웹 자료에서 지식과 verification anchor를 수집해 연습 환경을 만드는 것이다.

문제 설정

기존 자기개선 에이전트 연구는 대체로 다음 중 하나를 가정한다.

  • 사람이 만든 스킬 라이브러리
  • 성공한 실행 궤적
  • 정답을 확인할 수 있는 verifier
  • 목표 작업에서 나온 supervision signal

하지만 실제 배포 환경에서는 사용자가 “이 일을 해줘”라는 프롬프트만 줄 때가 많다. OpenSkill은 이런 상황을 open-world self-evolution으로 정의한다. 에이전트는 목표 작업 정답을 보지 않고, 외부 자료에서 배울 내용과 연습 문제와 검증 기준을 모두 만들어야 한다.

작동 방식

OpenSkill은 세 단계로 볼 수 있다.

  1. 지식 획득: 문서, 코드 저장소, 웹 자료에서 grounded knowledge와 verification anchor를 수집한다.
  2. 스킬 합성: 수집한 지식을 재사용 가능한 스킬 형태로 정리한다.
  3. 가상 과제 검증: target answer가 아니라 anchor에 기반한 virtual task를 만들어 스킬을 개선한다.

이 구조는 agent-skillsautoskill의 확장선에 있다. 다만 OpenSkill은 “스킬을 어떻게 쓸 것인가”보다 “아무 스킬도 없는 환경에서 스킬과 검증 기준을 어떻게 동시에 만들 것인가”에 초점을 둔다.

왜 중요한가

장기적으로 에이전트가 새로운 도구, API, 업무 절차를 계속 배워야 한다면 사람이 매번 스킬을 작성할 수 없다. OpenSkill은 오픈월드 자료 자체를 학습 대상이자 연습 환경으로 바꾸는 접근을 제안한다.

논문은 세 개 benchmark와 두 target agent에서 OpenSkill이 no-supervision constraint를 만족하면서 가장 높은 automated pass rate를 달성했다고 보고한다. 또한 생성된 스킬이 특정 모델에 고정되지 않고 다른 모델로도 전이되며, self-built verifier가 ground truth outcome과 정렬되는 경향을 보였다고 설명한다.

관련 문서

  • autoskill — 상호작용에서 재사용 가능한 스킬을 자동 추출·진화하는 에이전트 프레임워크
  • agent-skills — AI 에이전트 스킬 시스템 개요
  • ssl-agent-skills — 스킬 텍스트를 구조화해 발견·위험 평가를 개선하는 프레임워크
  • reasoning-bank — 성공·실패 경험에서 추론 전략을 학습하는 에이전트 메모리

참고 자료



AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)