OpenAI Codex 출시: 소프트웨어 엔지니어링의 미래를 엿보다

OpenAI Codex 출시: 소프트웨어 엔지니어링의 미래를 엿보다

2025. 5. 18. 11:52ㆍ카테고리 없음

안녕하세요, 저희는 OpenAI Codex 팀입니다. 소프트웨어 엔지니어링은 계속 변화하고 있으며, 2025년 말에는 근본적으로 달라질 것이라고 생각합니다. 오늘 저희는 이 변화를 더욱 가속화할 수 있는 새로운 시스템, OpenAI Codex를 출시하게 되어 매우 기쁩니다.

Codex, 소프트웨어 개발 방식을 변화시키다

2021년에 저희는 첫 번째 Codex 모델을 발표하며, 현재 '바이브 코딩(vibe coding)'이라고 부르는 것을 처음으로 선보였습니다. 이후에도 저희는 코딩하는 대규모 언어 모델을 수년간 연구해왔으며, GitHub Copilot의 스마트 자동 완성 기능을 지원했던 첫 Codex 모델부터 GPT-4에 이르기까지 모델의 사전 학습 스택과 사후 학습 레시피를 개선해왔습니다. 이미 매일 수백만 명의 사용자들이 ChatGPT를 활용하여 업무 속도를 높이고 있습니다.

하지만 프로그래밍 관련 프로젝트에서 LLM과 함께 작업하는 것은 여전히 투박하게 느껴질 때가 많습니다3. 많은 수작업과 컨텍스트 전환이 필요하기 때문입니다3. 저희는 이러한 한계를 넘어, 모델이 실제 프로덕션 코드베이스에서 사용자를 위해 작업을 오랫동안 수행할 수 있는 새로운 패러다임을 믿고 개발해왔습니다3. 이것이 바로 오늘 저희가 선보이는 새로운 Codex 시스템입니다.

새로운 Codex 시스템의 특징

이 새로운 Codex는 단순히 개선된 언어 모델을 넘어, 원격 소프트웨어 에이전트입니다1. 저희는 OpenAI의 위대한 전통에 따라 이 시스템에도 'Codex'라는 이름을 붙였습니다1. 이 시스템은 Codex One이라는 새로운 모델에 의해 구동되며, 이는 지금까지 최고의 코딩 모델입니다4. Codex One은 벤치마크뿐만 아니라 사람들이 실제로 코드베이스에 병합하고 싶어 하는 코드 유형에 맞게 최적화되어 있습니다4. 주석, 불필요한 변경, 스타일 등을 고려하여 사람들의 작업 속도를 높이도록 설계되었습니다.

Codex의 가장 흥미로운 점 중 하나는 저장소 환경과 함께 실행된다는 것입니다1. OpenAI의 컴퓨팅 환경에서 실행되며, 많은 복사본을 동시에 실행할 수 있습니다1. 따라서 여러 작업을 병렬로 수행하고, 실행을 위임했다가 나중에 다시 돌아올 수 있습니다....

강력하고 확장 가능한 인프라

이 모든 작업은 여러분의 노트북에서 실행되지 않습니다6. 에이전트에게 자체 GPU와 CPU가 필요한 새로운 에이전트 코딩 인프라가 필요하며6, 이 인프라는 OpenAI의 컴퓨팅 인프라, 특히 강화 학습에 사용하는 것과 동일한 인프라에서 실행됩니다6. 저희는 대규모 훈련 실행을 통해 이 인프라를 테스트했습니다.

무엇보다 중요한 것은, 이 인프라가 완벽하게 확장 가능하다는 점입니다3. 클라우드에서 실행되며, 버튼 하나로 한 명의 에이전트든 만 명의 에이전트든 가동할 수 있습니다3. 이는 **온디맨드 AI의 강력한 힘의 승수(force multiplier)**이며, 내부적으로 정말 좋은 결과를 보고 있습니다.

각 작업은 자체적인 마이크로 VM 샌드박스에서 실행됩니다. 각 샌드박스는 자체 파일 시스템, CPU 메모리, 네트워크 정책을 가지며, 에이전트는 그 안에서 자유롭게 제어할 수 있습니다. 에이전트는 grep, sed와 같은 모든 POSIX 명령을 사용하는 방법을 배웠고, 린팅(linting), 포맷팅(formatting)을 실행하는 방법을 알고 있으며, 코드를 작성하고 실행하는 것을 좋아합니다

Agent.md를 통한 유연한 가이드라인

개발자에게 모델에 대한 방향성과 지침을 제공하는 것이 매우 중요하다는 것을 알기에, 저희는 agent.md 파일이라는 개념을 도입했습니다8.... 리포지토리의 레이아웃, 테스트 실행 방법, 커밋 메시지 및 PR 메시지 형식, 코드 구조 등 자세한 지침을 agent.md에 제공할 수 있습니다. 에이전트는 이 파일을 참조하여 작업을 수행합니다.

Codex로 수행할 수 있는 작업 (데모를 통해 보여진 것)

데모에서 저희는 Codex 에이전트가 동시에 수행할 수 있는 몇 가지 주요 작업을 보여드렸습니다.

코드베이스 설명 및 구조 파악: 코드 에이전트에게 코드베이스의 일반적인 구조를 설명해 달라고 요청할 수 있습니다.
버그 찾기 및 수정: 리포지토리 어딘가에 있는 버그를 찾아서 수정하도록 요청할 수 있습니다. Codex는 스스로 문제를 재현하기 위해 작은 스크립트를 작성하고 코드를 실행하여 문제가 재현되는지 확인할 수 있습니다.
사전 작업 제안: 코드베이스를 탐색하고 스스로 할 수 있는 사전 작업 제안을 요청할 수 있습니다10. 예를 들어, 변경 가능한 기본값을 인수로 사용하는 것, 타임아웃 설정의 일관성 부족6 등 코드베이스를 개선할 수 있는 항목을 스스로 발견하고 제안했습니다.
오타 및 문법 오류 수정: 오타나 문법 오류를 찾아 수정하는 사소하지만 유용한 작업도 수행할 수 있습니다.
테스트 실행 및 검증: 에이전트는 agent.md 파일에서 지시된 테스트를 실행하는 방법을 알고 있으며14, 테스트가 통과했는지 실패했는지 보고합니다14. 작업 로그에서 테스트 실행 위치와 성공 여부를 확인할 수 있어 검증 가능한 출력을 제공합니다. 저희는 Codex가 스스로 테스트를 작성하여 작업을 검증하는 것도 보았습니다.
린터 및 포매터 실행: 코드 품질과 스타일을 위해 린터와 포매터를 실행합니다
풀 리퀘스트 (PR) 생성: 작업을 완료한 후 변경 사항을 담은 PR을 생성합니다.

소프트웨어 엔지니어링 워크플로우의 변화

저는 이 인터페이스에서 작업을 얼마나 가볍게 처리할 수 있느냐는 점이 정말 좋다고 생각합니다5.... 코드 변경이나 리팩터링에 대한 아이디어가 떠오르면 바로 Codex에서 작업을 시작하고 다시 하던 일로 돌아갑니다. 나중에 돌아오면 작업이 완료되어 있죠. 이는 비동기 위임과 에이전트와의 상호 작용을 통해 완전히 일어나며, 저의 노트북에는 반영되지도 않습니다. 제대로 작동했을 때, 그것은 정말 마법 같은 순간이었습니다.

이것은 지난 몇 년 동안 엔지니어링 업무가 어떻게 변화했는지를 반영합니다. 이제 코드를 작성하는 것보다 코드를 검토하는 데 많은 시간을 할애하고 있습니다. 따라서 모델이 저희의 기대치(alignment)와 일치하는 것이 더욱 중요해졌습니다. 저희는 해석 가능성과 검증 가능한 출력에 정말 중점을 두었습니다. 모델이 생성한 요약, 참조한 코드, 테스트 결과 로그 등을 통해 에이전트가 무엇을 했고 왜 했는지 정확히 알 수 있습니다. 이는 AI가 점점 더 많은 코드를 작성하는 세상으로 나아갈수록 정말 중요해질 것입니다.

동료이자 조력자

Codex는 인간과 다른 강점과 약점을 가지고 있습니다. 단순히 사용하는 정적인 도구가 아니라, 전문 지식을 쌓을 필요 없이 사용하는 것만으로도 많은 것을 얻을 수 있다고 생각합니다. 좋은 테스트와 모듈식 코드베이스와 같은 좋은 소프트웨어 엔지니어링 관행은 Codex의 강점과 잘 맞으며, 이를 통해 빠르게 움직일 수 있습니다.

Codex는 여러분의 컴퓨터에서 실행되는 로컬 에이전트(Codex CLI)와 클라우드에서 실행되는 비동기 버전20, 이 두 가지 폼팩터로 제공됩니다. 미래에는 이 두 시스템이 통합될 것이라고 생각합니다20. 여러분이 정말로 원하는 것은 자신의 컴퓨터를 가지고 있으면서도 어깨 너머로 볼 수 있는 원격 동료입니다. 점심을 먹으러 가거나 종속성이 누락된 경우에도 Codex가 작업을 원활하게 이어받아 실행합니다. 동료, 위임할 수 있는 인턴, 멘토, 페어 프로그래머 등 이 모든 것이 한 번에 가능해집니다.

저희의 목표는 유용한 작업을 가속화하여 세상에 더 많은 소프트웨어 엔지니어가 생겨나고, 더 많은 프로그래밍이 이루어지고, 유용하며, 세상을 발전시킬 수 있도록 돕는 것입니다.

오늘부터 시작

이 기능은 오늘부터 Pro, Enterprise 및 Teams 사용자를 위한 ChatGPT에 적용되며, 향후 Plus 및 EDU에도 적용될 예정입니다. 초기 요금 한도는 매우 넉넉하게 설정했으며, 처음에는 추가 요금 없이 시작할 예정입니다.

미래를 향해

이 여정은 거의 끝나지 않았습니다. Codex는 이제 시작 단계에 불과하며, 계속해서 개선해 나갈 것입니다. 이슈 트래커와 통합하고, API를 공개하여 CI에 자동으로 통합되도록 하는 등 훨씬 더 많은 시스템에 통합될 수 있도록 계획하고 있습니다. CI에 오류가 발생하면 더 이상 직접 수정할 필요 없이 Codex가 이를 처리할 것입니다.

저희는 이 제품에 대해 여러분과 공유하고 여러분 모두가 이 제품을 어떻게 사용하는지 보는 것이 매우 기대됩니다

첨부자료

https://youtu.be/J3XT3sqx5JY?list=TLGGPOKeqc9IcC0xODA1MjAyNQ

우당탕탕 프로젝트