OpenSkill – 정답 데이터 없이 에이전트 스킬과 검증 신호를 스스로 만드는 자기진화 프레임워크

문제 설정
작동 방식
왜 중요한가
관련 문서
참고 자료

OpenSkill은 LLM 에이전트가 배포 후 새로운 작업을 만났을 때, 정답 데이터나 성공 trajectory 없이 스스로 스킬과 검증 신호를 만드는 open-world self-evolution 프레임워크다. 핵심은 대상 작업의 답을 보지 않고도 문서, 저장소, 웹 자료에서 지식과 verification anchor를 수집해 연습 환경을 만드는 것이다.

문제 설정

기존 자기개선 에이전트 연구는 대체로 다음 중 하나를 가정한다.

사람이 만든 스킬 라이브러리
성공한 실행 궤적
정답을 확인할 수 있는 verifier
목표 작업에서 나온 supervision signal

하지만 실제 배포 환경에서는 사용자가 “이 일을 해줘”라는 프롬프트만 줄 때가 많다. OpenSkill은 이런 상황을 open-world self-evolution으로 정의한다. 에이전트는 목표 작업 정답을 보지 않고, 외부 자료에서 배울 내용과 연습 문제와 검증 기준을 모두 만들어야 한다.

작동 방식

OpenSkill은 세 단계로 볼 수 있다.

지식 획득: 문서, 코드 저장소, 웹 자료에서 grounded knowledge와 verification anchor를 수집한다.
스킬 합성: 수집한 지식을 재사용 가능한 스킬 형태로 정리한다.
가상 과제 검증: target answer가 아니라 anchor에 기반한 virtual task를 만들어 스킬을 개선한다.

이 구조는 agent-skills와 autoskill의 확장선에 있다. 다만 OpenSkill은 “스킬을 어떻게 쓸 것인가”보다 “아무 스킬도 없는 환경에서 스킬과 검증 기준을 어떻게 동시에 만들 것인가”에 초점을 둔다.

왜 중요한가

장기적으로 에이전트가 새로운 도구, API, 업무 절차를 계속 배워야 한다면 사람이 매번 스킬을 작성할 수 없다. OpenSkill은 오픈월드 자료 자체를 학습 대상이자 연습 환경으로 바꾸는 접근을 제안한다.

논문은 세 개 benchmark와 두 target agent에서 OpenSkill이 no-supervision constraint를 만족하면서 가장 높은 automated pass rate를 달성했다고 보고한다. 또한 생성된 스킬이 특정 모델에 고정되지 않고 다른 모델로도 전이되며, self-built verifier가 ground truth outcome과 정렬되는 경향을 보였다고 설명한다.

참고 자료

OpenSkill: Open-World Self-Evolution for LLM Agents — arXiv (2026-06-04)
OpenLAIR/OpenSkill — GitHub 공식 저장소

Like?

AI Sparkup

OpenSkill – 정답 데이터 없이 에이전트 스킬과 검증 신호를 스스로 만드는 자기진화 프레임워크

문제 설정

작동 방식

왜 중요한가

관련 문서

참고 자료

AI Sparkup 구독하기