AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

NVIDIA Agent Skills – CUDA-X와 AI Blueprint 사용법을 에이전트에 주입하는 공식 스킬 카탈로그

NVIDIA Agent Skills는 CUDA-X 라이브러리, AI Blueprint, NVIDIA 플랫폼 도구를 AI 코딩 에이전트가 올바르게 사용하도록 돕는 공식 검증 스킬 카탈로그다. 스킬은 각 제품 저장소에서 관리되고, NVIDIA/skills 저장소로 매일 동기화된다.

무엇이 다른가?

일반적인 스킬 모음은 개인이나 커뮤니티가 만든 워크플로우를 공유하는 경우가 많다. NVIDIA Agent Skills는 제품 팀이 관리하는 공식 지식을 에이전트 스킬 형식으로 배포한다는 점이 다르다. 예를 들어 에이전트에게 “cuOpt로 선형계획 문제를 풀어라”라고 요청하면, 관련 스킬이 cuOpt Python API와 설치·배포 흐름을 안내한다.

이 방식은 문서를 사람이 읽고 다시 프롬프트로 설명하는 대신, 에이전트가 작업 시점에 제품별 절차를 직접 로드하게 만든다.

설치

기본 설치는 skills CLI를 사용한다.

npx skills add nvidia/skills

특정 스킬만 설치하려면 이름을 지정한다.

npx skills add nvidia/skills \
  --skill cuopt-numerical-optimization-api-python \
  --yes

에이전트별 설치 대상도 지정할 수 있다.

npx skills add nvidia/skills \
  --skill cuopt-numerical-optimization-api-python \
  --agent claude-code \
  --agent codex \
  --agent cursor

카탈로그만 확인하려면 다음 명령을 쓴다.

npx skills add nvidia/skills --list

카탈로그 구성

2026-05-22 기준 README에 공개된 주요 제품군은 다음과 같다.

제품군스킬 수용도
CUDA-Q1CUDA Quantum 설치, 테스트, GPU 시뮬레이션, QPU 하드웨어
cuOpt12차량 경로 최적화, 선형·이차 계획, 서버 배포
DALI1GPU 가속 데이터 로딩과 전처리
DeepStream2DeepStream 개발 안내
Megatron-Bridge29NeMo와 Megatron 간 데이터 처리, 변환, 학습 유틸리티
Megatron-Core12대규모 분산 학습, 모델 병렬화, 파이프라인 병렬화
Model-Optimizer8양자화, 희소화, 증류 기반 추론 최적화
NeMo Evaluator4LLM 평가 실행과 MLflow 결과 접근
NeMo Gym5RL 학습 환경, 벤치마크, 리소스 서버
NeMo-RL14GRPO, DPO, SFT 기반 RLHF 학습
NemoClaw23OpenClaw를 NVIDIA OpenShell 안에서 안전하게 실행
TensorRT-LLM25LLM 추론 최적화, 커널 작성, CI 진단, 코드베이스 탐색
TileGym7타일 기반 GPU 커널 작성과 성능 최적화
Video Search and Summarization10VSS Blueprint 배포, 영상 검색·요약, 분석 리포트

신뢰와 배포 모델

저장소는 Agent Skills specification을 따른다. 각 스킬은 루트에 SKILL.md를 갖는 이식 가능한 디렉터리이며, YAML frontmatter의 name, description 메타데이터로 발견된다. 에이전트는 시작 시 가벼운 메타데이터만 보고, 관련 작업에서 본문을 로드하는 점진적 공개(progressive disclosure) 모델을 사용한다.

로드맵에는 스킬 서명, 범용 평가 기준, 태스크별 평가 기준, 기계 판독 가능한 Skill Card, 외부 마켓플레이스와 MCP 허브 배포가 포함돼 있다. 이는 “누가 만든 스킬인지”, “어떤 품질 기준을 통과했는지”, “어떤 행동 경계를 갖는지”를 검증 가능한 형태로 만들려는 방향이다.

누구에게 유용한가?

  • NVIDIA 스택을 쓰는 ML 엔지니어: TensorRT-LLM, NeMo, Megatron, CUDA-Q 같은 복잡한 도구의 최신 절차를 에이전트에게 맡기고 싶을 때.
  • 플랫폼 팀: 사내 코딩 에이전트에 검증된 벤더 지식을 설치해 반복적인 설정 오류를 줄이고 싶을 때.
  • GPU 최적화 작업자: 양자화, 커널 작성, 분산 학습, 데이터 파이프라인 최적화처럼 문맥이 많은 작업을 에이전트와 함께 진행할 때.

관련 문서

  • agent-skills — AI 에이전트의 능력을 확장하는 스킬 시스템
  • awesome-agent-skills — 공식 팀이 만든 에이전트 스킬 큐레이션
  • ai-q-skill — NVIDIA 딥리서치 스킬 사례
  • llm-inference — LLM 추론 최적화의 기본 개념
  • openclaw — NemoClaw가 다루는 에이전트 런타임 맥락

참고 자료



AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)