OpenSkill은 LLM 에이전트가 배포 후 새로운 작업을 만났을 때, 정답 데이터나 성공 trajectory 없이 스스로 스킬과 검증 신호를 만드는 open-world self-evolution 프레임워크다. 핵심은 대상 작업의 답을 보지 않고도 문서, 저장소, 웹 자료에서 지식과 verification anchor를 수집해 연습 환경을 만드는 것이다.
문제 설정
기존 자기개선 에이전트 연구는 대체로 다음 중 하나를 가정한다.
- 사람이 만든 스킬 라이브러리
- 성공한 실행 궤적
- 정답을 확인할 수 있는 verifier
- 목표 작업에서 나온 supervision signal
하지만 실제 배포 환경에서는 사용자가 “이 일을 해줘”라는 프롬프트만 줄 때가 많다. OpenSkill은 이런 상황을 open-world self-evolution으로 정의한다. 에이전트는 목표 작업 정답을 보지 않고, 외부 자료에서 배울 내용과 연습 문제와 검증 기준을 모두 만들어야 한다.
작동 방식
OpenSkill은 세 단계로 볼 수 있다.
- 지식 획득: 문서, 코드 저장소, 웹 자료에서 grounded knowledge와 verification anchor를 수집한다.
- 스킬 합성: 수집한 지식을 재사용 가능한 스킬 형태로 정리한다.
- 가상 과제 검증: target answer가 아니라 anchor에 기반한 virtual task를 만들어 스킬을 개선한다.
이 구조는 agent-skills와 autoskill의 확장선에 있다. 다만 OpenSkill은 “스킬을 어떻게 쓸 것인가”보다 “아무 스킬도 없는 환경에서 스킬과 검증 기준을 어떻게 동시에 만들 것인가”에 초점을 둔다.
왜 중요한가
장기적으로 에이전트가 새로운 도구, API, 업무 절차를 계속 배워야 한다면 사람이 매번 스킬을 작성할 수 없다. OpenSkill은 오픈월드 자료 자체를 학습 대상이자 연습 환경으로 바꾸는 접근을 제안한다.
논문은 세 개 benchmark와 두 target agent에서 OpenSkill이 no-supervision constraint를 만족하면서 가장 높은 automated pass rate를 달성했다고 보고한다. 또한 생성된 스킬이 특정 모델에 고정되지 않고 다른 모델로도 전이되며, self-built verifier가 ground truth outcome과 정렬되는 경향을 보였다고 설명한다.
관련 문서
- autoskill — 상호작용에서 재사용 가능한 스킬을 자동 추출·진화하는 에이전트 프레임워크
- agent-skills — AI 에이전트 스킬 시스템 개요
- ssl-agent-skills — 스킬 텍스트를 구조화해 발견·위험 평가를 개선하는 프레임워크
- reasoning-bank — 성공·실패 경험에서 추론 전략을 학습하는 에이전트 메모리
참고 자료
- OpenSkill: Open-World Self-Evolution for LLM Agents — arXiv (2026-06-04)
- OpenLAIR/OpenSkill — GitHub 공식 저장소