OpenAI Codex Record & Replay: Mac 작업을 Skill로 재사용하는 방법

요약

OpenAI Codex Record & Replay는 사용자가 Mac에서 직접 수행하는 반복 업무를 Codex가 관찰한 뒤, 그 흐름을 재사용 가능한 Skill로 정리해 주는 기능입니다. 공식 문서 기준으로 현재 macOS에서 제공되며, Computer Use가 사용 가능하고 활성화되어 있어야 합니다. 초기 제공 지역에서는 EEA, 영국, 스위스가 제외된다고 안내되어 있습니다.

핵심은 단순한 화면 녹화가 아니라, “어떤 상황에서 이 Skill을 써야 하는지”, “매번 바뀌는 입력값은 무엇인지”, “어떤 순서로 실행해야 하는지”, “성공 여부를 어떻게 검증할지”를 Codex가 문서화한다는 점입니다. 즉, 사람이 프롬프트로 길게 설명하기 어려운 UI 기반 반복 업무를 한 번 보여주고, 이후에는 새 스레드에서 값만 바꿔 재사용하는 구조에 가깝습니다.

배경

이번 글은 GeekNews에 올라온 “OpenAI Codex Record & Replay” 소개 글을 출발점으로 확인했습니다. 해당 글은 OpenAI 개발자 문서의 Record & Replay 페이지를 요약하면서, 작성자가 “직접 써봤는데 생각보다 skill로 잘 말아주더라”는 짧은 사용 소감을 덧붙인 글입니다.

그래서 단순히 GeekNews 요약만 옮기지 않고, 아래 자료를 함께 확인했습니다.

OpenAI 공식 Record & Replay 문서
OpenAI 공식 Agent Skills 문서
OpenAI 공식 Plugins 문서
OpenAI의 공개 openai/skills GitHub 저장소
공개 Skill 예제인 linear, gh-fix-ci, skill-creator의 SKILL.md

확인 결과, Record & Replay 자체가 생성한 전체 Skill 결과물을 대량으로 공개해 둔 사례는 아직 많지 않습니다. 대신 OpenAI가 공개한 공식 Skill 저장소를 보면, Codex가 목표로 하는 Skill 형식과 실제 작성 방식은 꽤 명확하게 확인할 수 있습니다.

Record & Replay란?

Record & Replay는 말 그대로 “기록하고 다시 실행한다”는 의미입니다. 하지만 여기서 기록은 단순 비디오 녹화가 아닙니다. 사용자가 Mac에서 실제 업무 절차를 수행하면, Codex가 그 절차를 관찰하고 재사용 가능한 Skill 초안으로 정리합니다.

공식 문서가 설명하는 사용 예시는 다음과 같습니다.

비용 처리 제출
주차 공간 예약
정해진 형식의 이슈 생성
영상 게시
주기적으로 반복되는 리포트 다운로드

이 예시들의 공통점은 “매번 흐름은 비슷하지만 입력값만 바뀐다”는 점입니다. 예를 들어 이슈 생성 업무라면 프로젝트, 라벨, 담당자, 본문 템플릿은 반복되고, 실제 이슈 제목이나 설명만 달라질 수 있습니다.

Skill로 만들어진다는 의미

OpenAI 문서에서 Skill은 Codex에 특정 업무 능력을 추가하는 폴더형 패키지입니다. 최소 구조는 보통 다음과 같습니다.

my-skill/
├── SKILL.md
├── scripts/
├── references/
├── assets/
└── agents/
    └── openai.yaml

필수 파일은 SKILL.md이며, name과 description 메타데이터가 필요합니다. 여기에 업무 절차, 필요한 입력, 주의사항, 검증 방법을 적습니다. 스크립트나 참고 자료가 필요하면 scripts/, references/, assets/ 같은 폴더를 붙일 수 있습니다.

Progressive disclosure 구조

공식 Agent Skills 문서에서 흥미로운 부분은 “progressive disclosure”입니다. Codex는 처음부터 모든 Skill의 전체 본문을 컨텍스트에 넣지 않습니다. 먼저 Skill 이름, 설명, 경로만 보고 어떤 Skill이 필요한지 판단한 뒤, 실제로 쓸 때 전체 SKILL.md를 읽습니다.

이 구조는 Skill이 많아질수록 중요합니다. Skill 설명이 너무 길거나 모호하면 Codex가 적절한 Skill을 고르기 어렵고, 반대로 설명이 명확하면 새 스레드에서도 해당 Skill을 자연스럽게 불러올 수 있습니다.

사용 흐름

OpenAI 공식 문서 기준의 Record & Replay 흐름은 다음과 같습니다.

1. 녹화할 업무를 고른다

공식 문서는 “이미 사용자가 완료 방법을 알고 있는 업무”를 고르라고 설명합니다. Record & Replay는 모르는 업무를 자동으로 발견해 주는 기능이라기보다, 사용자의 기존 노하우를 Codex가 재사용 가능한 형태로 정리해 주는 기능에 가깝습니다.

좋은 후보는 다음 조건을 만족합니다.

단계가 비교적 안정적이다.
성공 기준이 명확하다.
매번 입력값만 일부 달라진다.
사용자의 선호나 암묵적 규칙이 중요하다.
자연어로 설명하기보다 화면에서 보여주는 편이 쉽다.

2. Codex 앱에서 Record a skill을 시작한다

공식 문서의 시작 절차는 다음과 같습니다.

Codex 앱 → Plugins → + 메뉴 → Record a skill

그다음 Codex가 제안하는 프롬프트를 검토하고, 필요한 맥락을 추가한 뒤 제출합니다. 이후 Codex가 작업 녹화 권한을 요청하면, 실제 시연을 시작할 준비가 되었을 때 승인합니다.

3. Mac에서 실제 업무를 수행한다

녹화 중에는 Codex가 Skill을 만들기 위해 필요한 사용자 동작과 창 내용을 관찰합니다. 중요한 점은 녹화를 업무 범위 안에서만 짧고 완결성 있게 유지해야 한다는 것입니다.

예를 들어 “월간 광고 리포트 다운로드”를 녹화한다면, 리포트 사이트 접속 → 날짜 범위 선택 → CSV 다운로드 → 파일명 확인까지만 포함하는 것이 좋습니다. 다운로드 후 개인 폴더 정리, 메신저 확인, 다른 탭 정리까지 같이 녹화하면 Skill이 불필요하게 복잡해질 수 있습니다.

4. 녹화를 멈추면 Codex가 Skill 초안을 만든다

공식 문서에 따르면 녹화를 멈추면 Codex가 캡처된 워크플로를 분석해 Skill 초안을 작성합니다. 이 Skill에는 보통 다음 정보가 들어갑니다.

언제 이 Skill을 사용할지
필요한 입력값은 무엇인지
어떤 단계를 따라야 하는지
결과를 어떻게 검증할지
사용자가 선호하는 기본값이나 네이밍 규칙은 무엇인지

녹화 직후에는 Skill을 그대로 쓰기보다, 사용자가 알고 있는 숨은 규칙을 추가로 보완하는 것이 좋습니다. 예를 들어 파일명 규칙, 기본 라벨, 예외 처리 기준, 저장 위치 같은 것들입니다.

5. 새 스레드에서 Replay한다

다음번에는 새 스레드에서 생성된 Skill을 사용하라고 요청하고, 이번 실행에서 달라지는 값만 전달하면 됩니다.

예를 들면 다음처럼 요청할 수 있습니다.

지난번에 만든 월간 광고 리포트 다운로드 Skill을 사용해줘.
이번에는 2026-06-01부터 2026-06-30까지의 리포트를 내려받고,
파일명은 ads-report-2026-06.csv로 저장해줘.

Codex는 Skill을 재사용 가능한 컨텍스트로 읽고, 현재 환경에서 사용할 수 있는 Computer Use, 브라우저 액션, 플러그인, MCP 도구 등을 조합해 작업을 수행할 수 있습니다.

실제 공개 예제로 보는 Skill 구조

Record & Replay가 실제로 만들어낸 Skill 결과물만 따로 모아 둔 공개 저장소는 아직 제한적입니다. 다만 OpenAI의 공식 openai/skills 저장소에는 Codex에서 사용할 수 있는 실제 Skill 예제가 공개되어 있습니다. 이 예제들을 보면 Record & Replay가 만들려는 결과물의 형태를 이해하기 쉽습니다.

예제 1: Linear Skill

OpenAI의 linear Skill은 Linear 이슈와 프로젝트를 관리하기 위한 Skill입니다. 앞부분은 대략 이런 구조입니다.

---
name: linear
description: Manage issues, projects & team workflows in Linear. Use when the user wants to read, create or updates tickets in Linear.
metadata:
  short-description: Manage Linear issues in Codex
---

본문에는 전제 조건, Linear MCP 연결 방법, OAuth 로그인, 팀과 프로젝트 확인, 이슈 생성/수정 흐름이 순서대로 정리되어 있습니다. 중요한 점은 단순히 “Linear를 사용해라”가 아니라, 실패 시 설정 방법과 어떤 순서로 읽고 쓰기를 해야 하는지까지 적는다는 것입니다.

예제 2: gh-fix-ci Skill

gh-fix-ci Skill은 GitHub PR의 실패한 CI 체크를 조사하는 Skill입니다. 설명만 봐도 사용 범위가 꽤 명확합니다.

---
name: "gh-fix-ci"
description: "Use when a user asks to debug or fix failing GitHub PR checks that run in GitHub Actions; use `gh` to inspect checks and logs, summarize failure context, draft a fix plan, and implement only after explicit approval. Treat external providers (for example Buildkite) as out of scope and report only the details URL."
---

이 예제에서 배울 점은 두 가지입니다.

첫째, Skill 설명에는 “언제 써야 하는지”뿐 아니라 “언제 쓰면 안 되는지”도 들어갑니다. 예제에서는 GitHub Actions는 범위 안이지만 Buildkite 같은 외부 CI는 범위 밖이라고 못 박습니다.

둘째, 실행 순서가 안전하게 설계되어 있습니다. 먼저 gh auth status로 인증을 확인하고, PR을 확인하고, 실패한 체크 로그를 읽고, 원인을 요약한 뒤, 바로 수정하지 않고 계획을 제안합니다. 자동화라고 해서 무조건 실행하는 것이 아니라, 위험한 단계 앞에서는 승인 지점을 둡니다.

예제 3: Record & Replay로 만들 수 있는 업무 Skill 예시

아래는 공식 문서의 사용 사례를 바탕으로 재구성한 예시입니다. OpenAI가 공개한 실제 Record & Replay 출력물이 아니라, Record & Replay로 만들어질 법한 Skill의 형태를 이해하기 위한 예시입니다.

---
name: monthly-report-download
description: Use when the user asks to download the monthly analytics report from the internal dashboard. Requires a target month and output filename.
---

# Monthly Report Download

## Inputs

- `month`: report month, for example `2026-06`
- `output_filename`: final CSV filename

## Workflow

1. Open the analytics dashboard.
2. Select the report menu.
3. Set date range to the first and last day of `month`.
4. Choose CSV export.
5. Save the downloaded file as `output_filename`.
6. Verify the file exists and has non-zero size.

## Pitfalls

- Do not record or store login passwords.
- If a two-factor prompt appears, stop and ask the user.
- If the report is empty, verify the selected date range before concluding there is no data.

이 정도로 정리되면 다음번에는 “6월 리포트 받아줘”라는 요청만으로도 Codex가 필요한 입력값을 추론하거나 물어보고, 같은 절차를 다시 수행할 수 있습니다.

Record & Replay가 잘 맞는 업무

Record & Replay는 모든 자동화 문제의 답은 아닙니다. 잘 맞는 업무와 그렇지 않은 업무를 구분하는 것이 중요합니다.

잘 맞는 경우

매주 또는 매월 반복되는 관리자 화면 작업
리포트 다운로드, 파일명 변경, 업로드 같은 단순 반복 업무
Jira, Linear, GitHub Issue처럼 양식과 규칙이 있는 업무
WordPress, YouTube, Notion처럼 UI 단계가 많지만 흐름은 안정적인 게시 업무
조직 내부 도구처럼 API 문서보다 실제 화면 조작이 빠른 업무
사용자의 선호가 중요한 업무, 예를 들어 기본 라벨, 제목 형식, 저장 폴더, 검수 체크리스트

피하는 것이 좋은 경우

매번 화면 구조나 흐름이 크게 바뀌는 업무
결제, 송금, 계약 승인처럼 되돌리기 어려운 업무
비밀번호, 2FA 코드, 개인식별정보, 고객 데이터가 많이 노출되는 업무
한 번만 할 일이라 Skill로 만들 가치가 낮은 업무
이미 안정적인 API나 스크립트가 있고, UI 자동화보다 코드 자동화가 더 안전한 업무

Record & Replay는 빠르게 Skill을 만들 수 있다는 장점이 있지만, 화면 기반 자동화의 특성상 UI 변경에 약할 수 있습니다. 장기적으로 팀 전체가 써야 하는 업무라면 Plugin이나 MCP 서버, API 기반 자동화를 함께 고려해야 합니다.

Skill과 Plugin의 차이

OpenAI 문서에서 Skill과 Plugin은 역할이 다릅니다.

구분	Skill	Plugin
주된 목적	특정 업무 절차와 지식을 재사용	Skill, 앱 통합, MCP 서버를 묶어 배포
기본 단위	`SKILL.md`가 있는 폴더	설치 가능한 배포 패키지
적합한 상황	개인 또는 저장소 단위 반복 업무	팀 전체 배포, 외부 앱 연동, 여러 Skill 묶음
예시	CI 실패 조사 절차, 월간 리포트 다운로드 절차	Gmail/Slack/Google Drive 연동, Codex Security plugin

공식 Plugins 문서는 Plugin이 Skill, 앱 통합, MCP 서버를 포함할 수 있다고 설명합니다. 즉, Record & Replay는 빠르게 Skill을 만드는 방법이고, 그 Skill을 팀 전체에 안정적으로 배포하거나 앱 통합까지 포함해야 한다면 Plugin으로 패키징하는 방향이 더 적합합니다.

보안과 운영 주의사항

Record & Replay는 사용자의 실제 화면과 동작을 관찰한다는 점에서 편리하지만, 보안 관점에서는 주의가 필요합니다.

1. 비밀 정보는 녹화하지 않는다

공식 문서도 현실적인 입력값을 쓰되 secrets와 sensitive data는 피하라고 권합니다. 로그인 비밀번호, API 키, 고객 개인정보, 사내 민감 데이터가 화면에 노출되는 상태에서 녹화하면 Skill 작성 과정에 불필요한 위험이 생깁니다.

가능하면 다음 원칙을 지키는 것이 좋습니다.

테스트 계정 또는 더미 데이터를 사용한다.
비밀번호 입력 단계는 녹화하지 않는다.
2FA, 결제, 승인 화면이 나오면 중단한다.
녹화 후 생성된 Skill에 민감한 값이 들어갔는지 검토한다.

2. 녹화 범위를 짧게 유지한다

Skill은 반복 가능한 절차를 담아야 합니다. 녹화가 길어질수록 불필요한 행동이 섞이고, Codex가 무엇을 핵심 절차로 봐야 하는지 흐려질 수 있습니다.

좋은 녹화는 “업무 시작 → 결과 확인”까지만 포함합니다. 업무와 무관한 창 정리, 메신저 확인, 다운로드 폴더 정리 등은 별도 Skill로 분리하는 편이 낫습니다.

3. 성공 검증을 꼭 넣는다

자동화에서 가장 중요한 부분은 실행보다 검증입니다. 예를 들어 리포트를 다운로드했다면 파일 존재 여부, 파일 크기, 날짜 범위, 행 수를 확인해야 합니다. 이슈를 생성했다면 이슈 URL, 라벨, 담당자, 본문 템플릿이 맞는지 확인해야 합니다.

Skill에는 반드시 다음 식의 검증 단계가 들어가야 합니다.

Verify:
- The created issue URL is returned.
- The issue has the expected label and assignee.
- The description contains the required checklist.

4. 승인 지점을 구분한다

CI 로그 조회나 리포트 다운로드는 비교적 안전하지만, 삭제, 발행, 결제, 승인, 외부 전송은 위험도가 높습니다. 이런 단계는 Skill 안에 “실행 전 사용자 승인 필요”라고 명확히 적어야 합니다.

문제 해결

Record & Replay는 기능 자체보다 “생성된 Skill을 어떻게 다듬느냐”가 중요합니다. 아래처럼 문제를 증상 기준으로 정리해 두면 FAQ보다 실제 작업 중 다시 보기 좋습니다.

Record & Replay 메뉴가 보이지 않을 때

공식 문서 기준으로 Record & Replay는 Computer Use가 사용 가능하고 활성화되어 있어야 합니다. 조직에서 Codex 설정을 requirements.toml로 관리한다면, [features].computer_use 설정이 Record & Replay에도 영향을 줍니다.

예를 들어 아래처럼 꺼져 있으면 Computer Use와 Record & Replay가 모두 사용할 수 없다고 안내되어 있습니다.

[features]
computer_use = false

녹화한 Skill이 너무 복잡할 때

원인은 대부분 녹화 범위가 넓거나, 예외 상황까지 한 번에 담으려 했기 때문입니다. 이 경우에는 Skill을 하나로 유지하기보다 다음처럼 분리하는 것이 좋습니다.

“리포트 다운로드” Skill
“파일명 정리” Skill
“Notion에 요약 붙여넣기” Skill
“Slack에 공유 초안 작성” Skill

작고 성공 기준이 명확한 Skill이 재사용하기 쉽습니다.

Skill이 엉뚱한 상황에서 호출될 때

Agent Skills 문서에 따르면 Codex는 Skill의 description을 보고 명시적 또는 암묵적으로 Skill을 선택합니다. 따라서 설명이 너무 넓으면 원하지 않는 상황에서도 호출될 수 있습니다.

좋은 설명은 다음 요소를 포함합니다.

어떤 요청에서 사용해야 하는지
어떤 입력값이 필요한지
어떤 범위는 제외해야 하는지
위험한 작업은 승인 후 진행해야 한다는 점

RPA처럼 써도 되는지 헷갈릴 때

겹치는 부분은 있지만 전통적인 RPA와 완전히 같지는 않습니다. Record & Replay는 화면 좌표만 고정해 반복 실행하기보다, 사용자의 시연을 바탕으로 Codex가 Skill이라는 절차 문서를 만들고 이후 현재 환경의 도구를 조합해 다시 수행하는 방식에 가깝습니다.

macOS 밖에서 재사용할 수 있는지 확인할 때

공식 Record & Replay 문서 기준으로 녹화 기능은 macOS 제공으로 안내되어 있습니다. 다만 Skill 자체는 Codex CLI, IDE extension, Codex app에서 사용할 수 있으므로, 실제 재사용 가능 여부는 Skill 내용과 Computer Use·브라우저·플러그인 같은 도구 의존성에 따라 달라집니다.

Skill 저장 위치를 정리할 때

Agent Skills 문서는 Codex가 repository, user, admin, system 위치에서 Skill을 읽는다고 설명합니다. 개인 Skill은 $HOME/.agents/skills, 저장소 Skill은 .agents/skills 계층에 둘 수 있습니다. 팀 배포가 필요하면 Plugin으로 패키징하는 편이 더 적합합니다.

결론

OpenAI Codex Record & Replay는 “프롬프트로 설명하기 어려운 반복 작업”을 Codex에게 한 번 보여주고, 이후 Skill로 재사용하게 만드는 기능입니다. 특히 Mac에서 브라우저나 데스크톱 앱을 오가며 처리하는 반복 업무, 사용자의 선호와 규칙이 중요한 업무, 매번 입력값만 바뀌는 업무에 잘 맞습니다.

다만 자동화의 핵심은 녹화 자체보다 Skill의 품질입니다. 좋은 Skill은 범위가 작고, 입력값이 명확하며, 실패 조건과 검증 방법이 들어 있고, 민감정보를 포함하지 않습니다. 개인 업무를 빠르게 자동화하려면 Record & Replay로 시작하고, 팀 전체에 배포할 수준이 되면 Plugin이나 MCP 기반 통합으로 확장하는 흐름이 가장 현실적입니다.

참고 자료

GeekNews – OpenAI Codex Record & Replay 소개 글: https://news.hada.io/topic?id=30642
OpenAI 공식 문서 – Record & Replay: https://developers.openai.com/codex/record-and-replay
OpenAI 공식 문서 – Agent Skills: https://developers.openai.com/codex/skills
OpenAI 공식 문서 – Plugins: https://developers.openai.com/codex/plugins
OpenAI GitHub – skills catalog: https://github.com/openai/skills
OpenAI GitHub – Linear Skill 예제: https://github.com/openai/skills/tree/main/skills/.curated/linear
OpenAI GitHub – gh-fix-ci Skill 예제: https://github.com/openai/skills/tree/main/skills/.curated/gh-fix-ci
OpenAI GitHub – skill-creator Skill 예제: https://github.com/openai/skills/tree/main/skills/.system/skill-creator

Claude Code와 OpenAI Codex, AI 코딩 에이전트 과금은 왜 갈라지고 있을까?: https://daily-it.duckdns.org/2026/06/19/ai-coding-agent-pricing-claude-code-openai-codex/
Codex CLI 설치 방법: macOS·Windows·Linux에서 OpenAI 코딩 에이전트 시작하기: https://daily-it.duckdns.org/2025/10/18/codex-cli-install-guide/
더 보기: OpenAI Codex 관련 글 더 보기

OpenAI Codex Record & Replay 정리: 작업을 한 번 보여주면 Skill로 재사용하는 방식

요약

목차

배경