NVIDIA Agent Skills – CUDA-X와 AI Blueprint 사용법을 에이전트에 주입하는 공식 스킬 카탈로그

무엇이 다른가?
설치
카탈로그 구성
신뢰와 배포 모델
누구에게 유용한가?
관련 문서
참고 자료

NVIDIA Agent Skills는 CUDA-X 라이브러리, AI Blueprint, NVIDIA 플랫폼 도구를 AI 코딩 에이전트가 올바르게 사용하도록 돕는 공식 검증 스킬 카탈로그다. 스킬은 각 제품 저장소에서 관리되고, NVIDIA/skills 저장소로 매일 동기화된다.

무엇이 다른가?

일반적인 스킬 모음은 개인이나 커뮤니티가 만든 워크플로우를 공유하는 경우가 많다. NVIDIA Agent Skills는 제품 팀이 관리하는 공식 지식을 에이전트 스킬 형식으로 배포한다는 점이 다르다. 예를 들어 에이전트에게 “cuOpt로 선형계획 문제를 풀어라”라고 요청하면, 관련 스킬이 cuOpt Python API와 설치·배포 흐름을 안내한다.

이 방식은 문서를 사람이 읽고 다시 프롬프트로 설명하는 대신, 에이전트가 작업 시점에 제품별 절차를 직접 로드하게 만든다.

설치

기본 설치는 skills CLI를 사용한다.

npx skills add nvidia/skills

특정 스킬만 설치하려면 이름을 지정한다.

npx skills add nvidia/skills \
  --skill cuopt-numerical-optimization-api-python \
  --yes

에이전트별 설치 대상도 지정할 수 있다.

npx skills add nvidia/skills \
  --skill cuopt-numerical-optimization-api-python \
  --agent claude-code \
  --agent codex \
  --agent cursor

카탈로그만 확인하려면 다음 명령을 쓴다.

npx skills add nvidia/skills --list

카탈로그 구성

2026-05-22 기준 README에 공개된 주요 제품군은 다음과 같다.

제품군	스킬 수	용도
CUDA-Q	1	CUDA Quantum 설치, 테스트, GPU 시뮬레이션, QPU 하드웨어
cuOpt	12	차량 경로 최적화, 선형·이차 계획, 서버 배포
DALI	1	GPU 가속 데이터 로딩과 전처리
DeepStream	2	DeepStream 개발 안내
Megatron-Bridge	29	NeMo와 Megatron 간 데이터 처리, 변환, 학습 유틸리티
Megatron-Core	12	대규모 분산 학습, 모델 병렬화, 파이프라인 병렬화
Model-Optimizer	8	양자화, 희소화, 증류 기반 추론 최적화
NeMo Evaluator	4	LLM 평가 실행과 MLflow 결과 접근
NeMo Gym	5	RL 학습 환경, 벤치마크, 리소스 서버
NeMo-RL	14	GRPO, DPO, SFT 기반 RLHF 학습
NemoClaw	23	OpenClaw를 NVIDIA OpenShell 안에서 안전하게 실행
TensorRT-LLM	25	LLM 추론 최적화, 커널 작성, CI 진단, 코드베이스 탐색
TileGym	7	타일 기반 GPU 커널 작성과 성능 최적화
Video Search and Summarization	10	VSS Blueprint 배포, 영상 검색·요약, 분석 리포트

신뢰와 배포 모델

저장소는 Agent Skills specification을 따른다. 각 스킬은 루트에 SKILL.md를 갖는 이식 가능한 디렉터리이며, YAML frontmatter의 name, description 메타데이터로 발견된다. 에이전트는 시작 시 가벼운 메타데이터만 보고, 관련 작업에서 본문을 로드하는 점진적 공개(progressive disclosure) 모델을 사용한다.

로드맵에는 스킬 서명, 범용 평가 기준, 태스크별 평가 기준, 기계 판독 가능한 Skill Card, 외부 마켓플레이스와 MCP 허브 배포가 포함돼 있다. 이는 “누가 만든 스킬인지”, “어떤 품질 기준을 통과했는지”, “어떤 행동 경계를 갖는지”를 검증 가능한 형태로 만들려는 방향이다.

누구에게 유용한가?

NVIDIA 스택을 쓰는 ML 엔지니어: TensorRT-LLM, NeMo, Megatron, CUDA-Q 같은 복잡한 도구의 최신 절차를 에이전트에게 맡기고 싶을 때.
플랫폼 팀: 사내 코딩 에이전트에 검증된 벤더 지식을 설치해 반복적인 설정 오류를 줄이고 싶을 때.
GPU 최적화 작업자: 양자화, 커널 작성, 분산 학습, 데이터 파이프라인 최적화처럼 문맥이 많은 작업을 에이전트와 함께 진행할 때.

참고 자료

NVIDIA/skills — GitHub 공식 저장소

Like?

AI Sparkup