Chaos and Order

💡 왼쪽 원문을 읽으면서 오른쪽에 따라 써보세요. Tab 키로 힌트를 받을 수 있습니다.

원문 렌더가 준비되기 전까지 텍스트 가이드로 표시합니다.

프롤로그 — 왜 다시 "CLI"인가

2024년만 해도 AI 코딩 도구의 디폴트 surface는 IDE였다. Cursor가 시장을 정의했고, Copilot은 VS Code 패널에서 살았고, Continue는 사이드바였다. 그런데 2026년 봄, 진지하게 프로덕션 코드를 맡길 만한 도구들이 일제히 **터미널로 내려왔다**. Claude Code가 길을 텄고, OpenAI Codex CLI가 따라왔고, JetBrains는 자존심을 굽혀 Junie CLI를 베타에 올렸고, Cursor도 `cursor-agent` 바이너리를 출시했다. Cline은 IDE 익스텐션이지만 CLI 형태로도 돈다. Aider는 처음부터 CLI였다. Continue.dev는 "Continuous AI"로 피벗하며 PR마다 도는 CLI를 핵심에 놓았다.

왜 다시 CLI인가. 세 가지다.

1. **에이전트는 자유로워야 한다.** 진짜 자율 에이전트는 `Bash`·`Read`·`Edit`·`Grep`을 자유롭게 조합한다. IDE 패널 안에 가둬두면 그 자유가 깎인다. 터미널은 본래부터 도구 조합의 공간이다.

2. **워크플로가 합쳐진다.** Git, CI, 컨테이너, SSH, tmux — 개발자의 진짜 작업은 터미널에 모인다. 에이전트가 거기 있으면 워크플로가 매끄럽다.

3. **자동화 가능하다.** CLI는 `cron`·GitHub Actions·Slack 봇·다른 에이전트가 호출할 수 있다. IDE 패널은 호출할 수 없다.

이 글은 7개 CLI/터미널-네이티브 도구를 같은 축으로 정면 비교한다. 이전 글들이 "IDE까지 포함한 전체 시장"을 다뤘다면, 이 글은 **터미널에서 도는 에이전트 하니스**만 본다. 비교 후 세 가지 실제 시나리오 — 플래키 테스트 고치기, 엔드포인트 추가, 모듈 리팩토링 — 에서 어떤 도구가 맞는지 따져본다.

> 모델은 점점 같아지고, **하니스가 차이를 만든다**. 7개 도구는 같은 Claude·GPT·Gemini를 부르지만, 행동이 완전히 다르다.

가격·기능 수치는 빠르게 바뀐다. 이 글의 모든 숫자는 **2026년 5월 기준**이며, 구조적 차이에 집중한다. 6개월 뒤 숫자가 바뀌어도 의사결정 프레임은 유효해야 한다.

1장 · 비교 축 — 무엇을 보고 골라야 하는가

7개 도구를 8개 축으로 분해해서 본다. 축 자체가 의사결정 프레임이다.

**축 1 · 에이전트 루프 전략**

모델을 어떻게 반복해서 부르는가. (a) 모놀리식 루프 — 하나의 메인 모델이 모든 결정을 한다. Aider, Codex CLI 기본 모드. (b) 아키텍트·에디터 분리 — 강한 모델이 계획하고, 빠른 모델이 편집한다. Aider architect, Codex CLI의 reasoning 모드. (c) 메인+서브에이전트 — 메인이 위임하고 서브가 격리된 컨텍스트로 일한다. Claude Code, Cursor Background, Junie CLI. (d) Plan/Act 토글 — 사용자가 명시적으로 모드를 바꾼다. Cline의 시그니처.

**축 2 · 파일 편집 모델**

이게 의외로 중요하다. (a) **서치-리플레이스(SEARCH/REPLACE) 블록** — 모델이 "이 부분을 → 이 부분으로" 형태로 출력하면 하니스가 적용한다. Aider의 정통 포맷. 토큰 효율 좋고, 적용 실패가 명확하다. (b) **유닿이드 디프(unified diff)** — 패치 형식. Codex CLI 일부 모드. (c) **직접 파일 쓰기(write_file 도구)** — 모델이 전체 파일을 도구 호출로 다시 쓴다. Claude Code, Cursor, Junie. 큰 파일에서 토큰 폭증. (d) **부분 편집 도구(Edit)** — 모델이 정확한 옛 문자열·새 문자열을 도구 인자로 넘긴다. Claude Code의 `Edit`. 안전하지만 매칭 실패가 잦다.

**축 3 · 컨텍스트 전략**

어떻게 코드를 본 후 모델에게 보여주는가. (a) 임베딩 인덱스 — Cursor가 대표. 빠른 시맨틱 검색이지만 색인 신선도 이슈. (b) grep/find 1차 — Claude Code, Aider, Codex CLI. 임베딩 없이 정교한 검색 도구 조합. (c) 명시적 `add` — Aider — 파일을 사용자가 골라 컨텍스트에 넣는다. 통제력 최고. (d) 자동 수집 — 모델이 어떤 파일이 필요한지 스스로 결정해 읽는다.

**축 4 · 서브에이전트 / 병렬성**

하나의 작업을 여러 에이전트에 분할할 수 있는가. Claude Code는 Task 도구로 서브에이전트를 띄운다. Cursor Background는 최대 8개 병렬. Junie CLI는 "agent skills"로 서브에이전트를 정의한다. Aider, Continue는 기본적으로 단일 에이전트. 큰 리팩토링에서 차이가 결정적이다.

**축 5 · MCP 지원**

Model Context Protocol — 2026년 사실상 업계 표준이 됐다. (a) 1급 지원 — Claude Code(MCP를 처음 표준화), Codex CLI, Cursor CLI, Junie CLI. (b) 2급 지원 — Cline은 stdio/SSE MCP를 마켓플레이스와 함께 지원. Continue도 지원. (c) 부분 지원 — Aider는 일부 MCP를 받지만 깊이 통합되진 않음. MCP가 있으면 외부 도구(DB, 이슈 트래커, 브라우저, 사내 API)를 표준 방식으로 붙인다.

**축 6 · 가격 / 비용 모델**

세 가지 패턴. (a) 정액 구독 — Claude Code Pro 월 20달러, Max 100·200달러. 헤비 유저에게 유리. (b) BYOK(Bring Your Own Key) — Cline, Aider, Continue, Junie CLI. 자기 API 키로 추론 비용만 지불. (c) 토큰/크레딧 — Cursor의 Max 모드, Codex CLI의 API 사용량. 변동성 큼. 헤비 유저의 월 비용을 반드시 추정하라 — 같은 작업에도 도구마다 10배 차이가 난다.

**축 7 · OSS 여부**

(a) 오픈소스 — Aider(Apache), Cline(MIT), Continue(Apache), Codex CLI(Apache, Rust). (b) 클로즈드 — Claude Code(바이너리 배포, SDK는 일부 공개), Cursor CLI, Junie CLI(JetBrains 라이선스). 엔터프라이즈 도입에서는 OSS 여부가 결정 인자가 될 수 있다 — 감사·포크·on-prem 배포.

**축 8 · 관측 가능성 / 안전장치**

에이전트가 무엇을 했는지 추적할 수 있는가. (a) 체크포인트 — Cline은 매 도구 호출마다 그림자 git에 커밋. 롤백 가능. (b) 권한 게이트 — Claude Code의 yes/no 프롬프트. Codex CLI도 비슷. (c) 샌드박스 — Codex CLI는 Linux에서 bubblewrap, Docker devcontainer 통합. (d) 디프 미리보기 — 모든 도구가 어느 정도는 제공하지만 깊이는 다르다.

이 8개 축을 머리에 넣고, 이제 도구를 하나씩 본다. 각 장은 같은 틀로 정리한다.

2장 · Claude Code — 터미널 에이전트의 기준점

**Surface · 강점**

순수 CLI. `claude` 명령으로 진입. 코드베이스 어디서나 돌아간다. Anthropic 자체 모델(Opus 4.5, Sonnet 4.6)을 기본으로 쓰지만, 다른 모델은 SDK 레벨로만 지원. MCP를 만든 회사가 만든 도구라 MCP 통합이 1급 시민이다.

**에이전트 루프**

메인 에이전트가 ReAct 루프를 돈다. 필요할 때 `Task` 도구로 서브에이전트를 띄운다 — 서브는 독립된 컨텍스트 윈도를 받고, 자기 일만 끝낸 뒤 메인에 결과만 돌려준다. 컨텍스트 격리가 깨끗하다. 메인이 200k 토큰을 다 쓰기 전에 서브가 자기 일을 자기 윈도에서 해치우기 때문이다.

**파일 편집**

`Edit` 도구로 부분 편집(old\_string → new\_string)을 한다. 매칭이 정확해야 하지만 안전하다. 큰 파일을 전체 다시 쓰는 일이 드물어 토큰 효율이 좋다. `Write`로 새 파일 생성도 가능.

**컨텍스트 전략**

임베딩 인덱스 없음. `Read`·`Glob`·`Grep`·`Bash`로 그때그때 찾는다. 결과적으로 색인 신선도 이슈가 없고, 모델이 "어디를 봐야 하는지" 스스로 추론한다. 큰 저장소에서도 잘 견딘다.

**서브에이전트 / MCP / 가격**

서브에이전트는 핵심 기능. MCP는 stdio·HTTP 모두 1급 지원. 6,000개 이상의 MCP 서버 생태계가 있다. 가격은 Pro 월 20달러, Max 100·200달러. 평균 활성 일당 13달러, 월 150~250달러 정도가 엔터프라이즈 평균이라는 보고. 토큰 기반이 아닌 정액 모델이 헤비 유저에게 유리하다.

**약점**

모델 잠금 — Claude만 잘 도는 게 사실. 다른 모델은 SDK로 우회해야 한다. 100% 클로즈드는 아니지만 코어는 바이너리. 큰 팀에서 감사가 어렵다.

**한 줄 요약**

> 서브에이전트와 MCP가 1급 시민인 정액제 CLI 에이전트. 모델은 Claude에 묶이지만 그 안에서는 가장 매끈하다.

3장 · OpenAI Codex CLI — Rust 리라이트와 GPT-5.5

**Surface · 강점**

`codex` 명령으로 진입. 2025년 말 OpenAI가 Node/TypeScript 원본을 **Rust로 리라이트**했고, 2026년 봄에는 코드베이스의 95%가 Rust다. 시작 속도가 빠르고 메모리가 가볍다. GitHub 별 67,000개 이상, 일 10~15커밋의 매우 활발한 개발.

**에이전트 루프**

GPT-5.5(2026년 5월 현재 권장 모델), GPT-5.4, GPT-5.3-Codex를 골라 쓸 수 있고 reasoning 레벨을 조절한다. 서브에이전트 지원 — 한 Codex 에이전트가 다른 Codex 에이전트에게 코드 리뷰를 시키는 패턴이 공식 가이드에 들어 있다. MCP 서버의 `supports_parallel_tool_calls` 플래그로 병렬 도구 호출 — 동일 작업에서 58초가 31초로 줄었다는 보고.

**파일 편집**

유닾이드 디프 형식이 주력. 모델이 직접 패치를 생성하면 하니스가 적용. 큰 파일 변경에서 토큰 효율 좋다.

**컨텍스트 전략**

임베딩 인덱스 없음. grep/find 도구로 1차 검색. Claude Code와 철학이 같다.

**서브에이전트 / MCP / 가격**

MCP는 1급. stdio·streaming HTTP 둘 다 지원. 가격은 API 사용량 + ChatGPT Plus·Pro 구독 모델 둘 다. Pro 구독자는 일정량의 GPT-5.5 호출이 포함된다.

**샌드박스 — 이게 진짜 차별점**

Linux에서 bubblewrap 기반 샌드박스. Docker devcontainer 1급 지원. 호스트 파일시스템 접근을 격리한다. 에이전트에게 "지우라"고 말해도 호스트가 안전하다 — 다른 CLI 도구들이 못 따라잡는 부분.

**약점**

GPT 모델 전제. 다른 모델은 OpenAI API 호환 엔드포인트로 우회해야 한다. UI/UX가 Claude Code보다 거칠다 — Rust 리라이트가 진행 중인 만큼 일부 명령이 자주 바뀐다.

**한 줄 요약**

> Rust로 가볍게 다시 쓴 OpenAI의 터미널 에이전트. 샌드박스가 최강. GPT-5.5에 묶인다.

4장 · JetBrains Junie CLI — IDE에서 내려온 늦둥이

**Surface · 강점**

2026년 3월에 베타 출시. IntelliJ·PyCharm 같은 JetBrains IDE 내장 에이전트로 시작해 **CLI로 분리**됐다. 터미널에서 단독으로 돈다. IDE 안에서도, CI/CD에서도, GitHub/GitLab에서도 돈다.

**에이전트 루프**

"LLM-agnostic" — 처음부터 OpenAI, Anthropic, Google, Grok 모델을 모두 1급으로 지원한다. 다른 도구가 모델에 묶일 때 Junie CLI는 모델을 자유롭게 갈아끼우게 설계됐다. "agent skills"로 서브에이전트를 정의한다. "next-task prediction" — 프로젝트 컨텍스트를 이해해 다음 작업을 예측한다고 주장.

**파일 편집**

JetBrains의 IDE 분석을 일부 가져와 — AST 기반 편집을 시도한다. CLI 단독으로 돌 때는 텍스트 편집이지만 IDE 통합 시 인덱싱·리팩토링 도구를 빌려 쓴다.

**MCP / 가격**

MCP 지원. **BYOK가 디폴트** — 자기 모델 키를 가져오면 플랫폼 비용 없음. 출시 직후 Gemini 3 Flash를 1주일 무료로 풀었다. JetBrains AI 플랜과도 연동된다(Pro 100달러/년, Ultimate 300달러/년, Enterprise 720달러/년).

**원클릭 마이그레이션**

Claude Code, Codex 등 다른 에이전트 설정을 가져오는 기능을 명시적으로 광고한다. 늦게 들어온 만큼 "기존 사용자를 빼앗는다"가 노골적이다.

**약점**

베타. 안정성·생태계가 아직 빈약하다. JetBrains IDE에 가장 잘 맞는다 — IDE 통합 효과를 빼고 CLI만 쓰면 다른 도구 대비 압도적 강점이 없다. 가격 모델이 BYOK라 헤비 유저는 모델 비용을 따로 계산해야 한다.

**한 줄 요약**

> 늦게 들어왔지만 모델-불가지론과 BYOK라는 명확한 차별점. JetBrains 사용자에겐 즉시 매력적, 나머지에겐 관찰 대상.

5장 · Cline — VS Code에서 CLI까지, OSS의 챔피언

**Surface · 강점**

원래 VS Code 익스텐션이지만 2026년 들어 CLI 어시스턴트로도 돈다. MIT 라이선스, 깃허브 별 57,000개+, 400만 설치. 진짜 OSS다.

**에이전트 루프 — Plan/Act 토글이 시그니처**

Plan 모드 — 읽기만 하고 쓰지 않는다. 아키텍트 역할. 토큰 적게 쓰고 사용자와 계획을 맞춘다. Act 모드 — 계획을 실행한다. 명시적 토글이 핵심이다. "Plan을 건너뛰고 바로 Act로 가는 게 가장 흔한 실수"라고 공식 가이드가 못 박는다.

**파일 편집**

직접 파일 쓰기와 부분 편집 둘 다. 모델 선택에 따라 포맷이 바뀐다.

**체크포인트 — 관측 가능성의 챔피언**

모든 도구 호출 직후 **그림자 git에 커밋**한다. 매 편집·매 명령·매 웹 요청이 자기만의 체크포인트를 갖는다. "Restore Files", "Restore Task Only", 풀 리셋 세 가지 롤백 모드. 다른 어떤 도구보다 깊은 관측 가능성 — 에이전트가 6단계 전에 한 일을 그대로 되돌릴 수 있다.

**MCP / 가격**

MCP 마켓플레이스 — stdio/SSE 둘 다 지원하는 자체 마켓플레이스를 운영한다. 가격은 **BYOK** — 익스텐션 자체는 무료. 추론 비용만 자기 API 키로 낸다. 라이트 유저 월 5~50달러, 헤비 유저 100달러+. 팀 플랜은 사용자당 월 20달러(2026년 Q1 이후), 첫 10시트 무료. 엔터프라이즈는 VPC·on-prem·에어갭 배포까지 한다.

**약점**

순수 CLI 단독 사용은 아직 VS Code 익스텐션만큼 매끄럽지 않다. Plan/Act 토글이 좋지만 어떤 사용자에겐 마찰이 된다 — Claude Code의 매끈한 자율 루프에 익숙해진 사람은 답답해할 수 있다.

**한 줄 요약**

> 진짜 OSS, BYOK, 체크포인트로 무장한 OSS의 챔피언. Plan/Act는 호불호. VS Code와 짝일 때 최강.

6장 · Aider — Git-네이티브의 원조

**Surface · 강점**

Paul Gauthier가 만든 가장 오래되고 가장 성숙한 CLI 에이전트. `aider` 명령. Apache 라이선스. Git을 진실의 원천으로 본다 — 파일을 명시적으로 컨텍스트에 추가하고, 모델이 변경을 제안하면 자동으로 커밋된다. **모든 변경에 자동 커밋, 그것도 의미 있는 커밋 메시지로**.

**에이전트 루프 — Architect/Editor 패턴이 시그니처**

2개 모델을 동시에 쓴다. **아키텍트** — 강한 추론 모델(o3, Opus 4.5)이 "이렇게 고치자"는 계획을 낸다. **에디터** — 빠르고 싼 모델이 그 계획을 Aider 디프 포맷으로 옮긴다. 비용·품질 트레이드오프를 사용자가 정밀하게 조절한다.

**파일 편집 — SEARCH/REPLACE의 원조**

모델이 "이 정확한 옛 코드를 → 이 새 코드로" 형식의 디프 블록을 생성한다. 하니스가 매칭해서 적용. 매칭 실패가 명확하다 — 에이전트가 코드를 환각하면 적용이 실패하고 모델이 다시 시도한다. 토큰 효율이 최상.

**컨텍스트 전략 — 명시적 add**

사용자가 `/add file.py`로 파일을 명시 추가한다. 자동 수집 없음. 통제력이 최고다. 큰 저장소에서도 "지금 보는 건 이 다섯 파일"이라는 확실성을 준다. `/web`으로 웹 자료, `/voice`로 음성, watch 모드로 코멘트 트리거 — 워크플로 통합이 깊다.

**모델 / 폴리글롯 벤치마크**

모든 주요 모델 지원. Aider가 운영하는 **폴리글롯 리더보드**가 사실상 코딩 모델의 업계 기준이 됐다. 2026년 5월 기준 Claude Opus 4.5가 89.4%로 1등, GPT-5(high) 88.0%, Gemini 2.5 Pro Preview 06-05 82.2%, o3 81.3%. 평균 58.1%.

**MCP / 가격 / 약점**

MCP 부분 지원 — 일부 서버를 받지만 깊이는 다른 도구만큼 통합되지 않았다. 가격은 **BYOK** — 도구 자체 무료, 모델 비용만. 약점: 서브에이전트 없음(단일 에이전트). 자동 컨텍스트 수집 없음 — 학습 곡선 존재. UI가 거칠다. 큰 자율 작업보다 "한 변경 단위" 페어 프로그래밍에 맞춰진 철학.

**한 줄 요약**

> Git-네이티브, SEARCH/REPLACE의 원조, Architect/Editor 분리. 가장 성숙하고 가장 통제 가능한 CLI 도구. 자율성보다 정밀함.

7장 · Cursor CLI / Background Agents — IDE 회사의 비-IDE 표면

**Surface · 강점**

Cursor는 IDE로 유명하지만 2026년 1월부터 **`cursor-agent` 바이너리**를 출시했다. 터미널에서 단독으로 돈다. IDE와 같은 프롬프트·도구, MCP 통합도 그대로. 2026년 4월 Cursor 3.0의 핵심 추가는 **Background Agents** — 클라우드 VM에서 비동기로 도는 에이전트.

**에이전트 루프 — 동기/비동기 두 트랙**

`cursor-agent`는 동기 — 보통의 ReAct 루프. **Background Agents**는 비동기. 클라우드 VM에서 별도 브랜치를 만들고, 끝나면 PR을 푸시한다. **최대 8개 병렬** 실행. 3.0의 "Cloud handoff"로 로컬에서 시작한 작업을 클라우드로 넘긴다 — 머신을 꺼도 계속 돈다.

**파일 편집 / 컨텍스트**

직접 파일 쓰기 위주. 임베딩 인덱스(IDE에서 가장 발달한 부분)는 CLI에서도 부분적으로 가져온다. Cursor의 강점.

**MCP / 가격**

MCP 1급. `mcp.json`에 정의한 도구가 CLI에서도 자동으로 잡힌다. 가격은 5단계 — Hobby 0달러, Pro 월 20달러, Pro+ 60달러, Ultra 200달러, Teams 사용자당 월 40달러. Max 모드(강한 모델)는 토큰 기반 + 20% 마진. **Background Agents는 항상 Max 모드** — 50스텝 작업이 Claude Sonnet으로 0.30~0.60달러, 복잡한 작업은 4~5달러까지.

**약점**

근본은 IDE 회사다. CLI는 부속 surface지 일급 시민이 아니다. Background Agents는 강력하지만 비싸다. 클라우드 VM 의존 — 폐쇄망에선 안 돈다.

**한 줄 요약**

> IDE의 임베딩 강점을 CLI로 가져왔다. Background Agents의 비동기·병렬은 독보적. 클라우드 의존이 거버넌스 이슈.

8장 · Continue.dev — "Continuous AI"로 피벗한 OSS

**Surface · 강점**

원래 VS Code/JetBrains 사이드바 챗으로 시작. 2026년 들어 "Continuous AI"로 피벗 — **PR마다 도는 오픈소스 CLI**. Apache 라이선스. 팀 규칙 강제, 이슈 잡기, 픽스 제안을 CI에서 자동으로 돌린다.

**에이전트 루프**

2026년 Agent 모드 — 요구사항 분석 → 계획 → 파일 수정 → 터미널 실행 → 검증을 자율로 돈다. CLI는 PR 단위로 도는 게 핵심. "소스 컨트롤된 AI 체크, CI에서 강제 가능"이 캐치프레이즈.

**파일 편집 / 컨텍스트**

Context Providers — `@codebase`(아키텍처 이해), `@docs`(특정 문서 사이트), `@github`(이슈·PR) 등. 모델이 컨텍스트를 명시적 채널로 받는다.

**MCP / 가격**

MCP 지원. 가격은 **OSS 무료** + Continue Hub 유료 플랜(팀 협업, 프롬프트 템플릿 공유, 중앙집중식 설정 관리). 거의 모든 주요 모델 지원 — Claude Opus 4.6/Sonnet 4.6, GPT-4o/o3, Gemini 2.0 Pro, Llama 3.3, DeepSeek V3.

**약점**

Agent로서의 성숙도는 Claude Code/Codex/Aider보다 한 발 뒤. 강점은 "CI에 들어가는 에이전트"라는 포지션 — 인터랙티브 작업이 강점이 아니다.

**한 줄 요약**

> OSS·CLI·CI 통합이 트라이앵글. PR마다 도는 자동화 에이전트라는 포지션이 명확. 인터랙티브 코딩 동반자로는 평범.

9장 · 정면 비교 매트릭스

| :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- |

읽는 법: **시그니처 열**이 도구의 영혼이다. 한 줄로 "다른 도구가 안 하는 것"이 거기 적혀 있다. 시그니처가 당신의 워크플로와 맞으면 그 도구를 더 보고, 안 맞으면 빨리 다음으로 넘어가라.

편집 모델이 만드는 차이 — 더 깊게

표만 봐서는 잘 안 보이는 게 편집 모델의 실제 영향이다. 같은 한 줄 변경을 7개 도구가 어떻게 처리하는지 머릿속에 그려 보면 명확하다.

파일: src/auth.ts (200줄)

요청: getUser() 함수의 throw 메시지를 "Not authorized"에서 "Unauthorized: missing token"으로 바꿔라.

Aider (SEARCH/REPLACE):

모델 출력: 약 100 토큰 (블록 형태)

적용 안전성: 매칭 실패 시 명확한 에러

토큰 비용: 최소

Claude Code (Edit 도구):

모델 출력: 약 80 토큰 (old_string/new_string)

적용 안전성: 매칭 실패 시 도구 에러 → 모델이 재시도

토큰 비용: 최소

Codex CLI (유닾이드 디프):

모델 출력: 약 120 토큰 (context lines 포함)

적용 안전성: 헝크가 안 맞으면 fuzzy fallback

토큰 비용: 적음

Cursor / Junie (직접 쓰기):

모델 출력: 약 2000 토큰 (파일 전체 재출력)

적용 안전성: 항상 적용 가능

토큰 비용: 큼 (파일이 클수록 폭증)

Cline (혼합):

모델 선택에 따라 가변

같은 한 줄을 바꾸는데 토큰 비용이 20배 차이난다. 100번의 작은 편집이 쌓이면 월 청구서가 10배 차이난다. 하루 평균 50번의 작은 편집을 하는 개발자에게는 결정적이다.

또 하나, **매칭 실패 시 동작**의 차이도 크다. Aider와 Claude Code의 부분 편집은 "정확히 이 문자열" 매칭을 기대하므로 모델이 코드를 환각하면 적용이 실패한다 — 그러면 모델이 진짜 파일을 다시 읽고 정확한 문자열을 다시 만들어야 한다. 이건 **안전 기능**이다. 직접 쓰기 도구는 모델이 환각한 다른 부분도 함께 덮어쓸 위험이 있다.

10장 · 실제 워크플로 — 어떤 도구가 어느 자리에 맞는가

비교 표는 의사결정의 절반이다. 나머지는 "실제 작업에서" 어떻게 도는가다. 세 시나리오로 본다.

워크플로 1 · 플래키 테스트 고치기

**작업의 본질**: 가끔 실패하는 테스트가 있다. 환경에 따라 다르고, 타이밍 이슈일 수도 있고, 다른 테스트와의 의존성일 수도 있다. **재현이 어렵다**.

**필요한 능력**:

1. 테스트를 여러 번 돌려 패턴을 찾는다(`while`로 100번 돌리거나 시드를 바꾼다).

2. 의심되는 위치를 격리한다(시간·랜덤·전역 상태).

3. 가설을 세우고 코드를 약간 바꿔 검증한다.

4. 진짜 픽스를 PR로 만든다.

**잘 맞는 도구**:

- **Claude Code** — Bash로 재실행 루프를 자유롭게 돈다. 서브에이전트로 "테스트 100번 돌려 통계 내기"를 격리된 컨텍스트에 위임. 메인은 가설·픽스에 집중.

- **Codex CLI** — bubblewrap 샌드박스에서 안심하고 테스트를 막 돌린다. 호스트가 안전.

- **Aider** — 픽스가 명확해진 단계 이후에 강하다. SEARCH/REPLACE로 정밀한 한 줄 픽스, 자동 커밋.

**덜 맞는 도구**:

- **Cursor Background** — 비동기라 재현 불가능한 버그의 디버깅 루프와 잘 안 맞는다. "지금 옆에서 같이 돌려보는" 작업에는 너무 멀다.

- **Continue.dev** — CI에서 도는 게 강점이지 인터랙티브 디버깅이 강점이 아니다.

워크플로 2 · 새 엔드포인트 추가

**작업의 본질**: 기존 패턴을 따라 새 라우트를 만든다. 인증·검증·DB 호출·테스트·문서까지. **반복적이지만 정확해야 한다**. 기존 컨벤션을 따라야 한다.

**필요한 능력**:

1. 기존 엔드포인트 코드를 읽고 패턴을 학습한다.

2. 새 파일들을 만들고 기존 파일들에 라우트 등록.

3. 테스트를 추가.

4. OpenAPI 스키마/문서 업데이트.

5. 모든 게 컨벤션에 맞는지 검증.

**잘 맞는 도구**:

- **Cursor CLI** — 임베딩 인덱스로 "비슷한 엔드포인트"를 빠르게 찾아 패턴을 학습한다. 강점.

- **Junie CLI** — JetBrains IDE 통합에서 AST 분석을 빌려 와 정확한 라우트 등록·인터페이스 일치를 검증.

- **Claude Code** — `Glob`·`Grep`으로 패턴 찾고, 서브에이전트로 "테스트 추가"를 위임. 메인은 라우트 코드에 집중.

**덜 맞는 도구**:

- **Aider** — 가능하지만 명시적 `add`가 마찰. 패턴 학습을 위해 여러 파일을 직접 추가해야 한다. 정밀하지만 느림.

- **Cursor Background** — 가능하지만 컨벤션 검증에서 사람이 봐야 할 부분이 많다 — 비동기로 던지면 결과를 다시 손봐야 할 가능성.

워크플로 3 · 모듈 리팩토링

**작업의 본질**: 큰 모듈을 더 작은 단위로 쪼개거나, 시그니처를 바꾸거나, 다른 패턴으로 옮긴다. **수십 개 파일이 동시에 변한다**. 부분 적용은 빌드를 깬다.

**필요한 능력**:

1. 영향 범위를 정확히 파악한다(어떤 파일이 변해야 하는가).

2. 일관된 변경을 모든 곳에 적용한다.

3. 빌드·테스트로 검증.

4. 부분 실패 시 롤백.

**잘 맞는 도구**:

- **Cursor Background Agents** — 비동기 + 병렬(최대 8)이 결정적. 큰 리팩토링을 여러 모듈로 분할해 동시에 돌린다. 결과는 PR.

- **Claude Code** — 서브에이전트로 "각 모듈을 한 서브가 책임"으로 분할. 메인은 통합·일관성 검증.

- **Cline** — 체크포인트로 안전망. 큰 리팩토링이 망가지면 매 도구 호출 단위로 되돌릴 수 있다.

**덜 맞는 도구**:

- **Aider** — 명시적 `add`가 수십 파일 단위에선 부담. 가능하지만 워크플로가 무겁다.

- **Continue.dev** — PR 단위 자동화엔 강하지만 "지금 큰 리팩토링을 시작한다"는 인터랙티브 시작점이 아니다.

11장 · 결정 트리 — 정직한 가이드

당신이 다음 중 어디에 가장 가깝나.

**팀 규모와 거버넌스부터.**

1. **솔로 IC, 자유롭게.** OSS 우선 → **Aider** 또는 **Cline**. 정밀한 한 변경 단위면 Aider. VS Code 통합·체크포인트가 좋으면 Cline. 정액제가 좋으면 **Claude Code Pro**.

2. **소규모 팀(2~10명), 빠른 속도.** **Claude Code Max** 또는 **Cursor Pro**. Claude 생태계에 익숙하면 전자, 임베딩·Background가 매력적이면 후자.

3. **중대형 팀(10~50명), 정책·감사 필요.** **Cline 엔터프라이즈**(VPC/on-prem 가능) 또는 **Continue.dev**(CI 통합) 또는 **Junie CLI**(JetBrains 거버넌스 활용). 클로즈드는 보안팀이 통과시켜야 한다.

**워크플로 성격에 따라.**

4. **테스트 디버깅·즉시 피드백 루프 중심**. Codex CLI(샌드박스) 또는 Claude Code(서브에이전트).

5. **CRUD 패턴 반복 추가**. Cursor CLI(임베딩) 또는 Junie CLI(IDE 통합).

6. **큰 리팩토링 / 마이그레이션**. Cursor Background Agents 또는 Claude Code 서브에이전트.

7. **고립된 한 변경, 정밀하게**. Aider.

8. **CI 자동화 · PR 마다 도는 자동 점검**. Continue.dev.

**가격 민감도에 따라.**

9. **고정 비용 선호, 한도 안 신경**. Claude Code Pro 월 20달러부터.

10. **사용량 가변, 적게 쓰는 달은 적게 내고 싶다**. BYOK — Cline / Aider / Junie / Continue.

11. **비싸도 좋으니 최강**. Claude Code Max + Cursor Ultra + Codex CLI Pro 동시 운용 (실제 헤비 유저 일부 패턴).

**모델 락-인 회피.**

12. **여러 모델을 자유롭게**. Junie CLI(LLM-불가지론) 또는 BYOK OSS — Aider/Cline/Continue. Claude Code·Cursor·Codex는 어느 정도 모델에 묶인다.

**가장 흔한 실수**: 도구 하나로 다 한다는 가정. 2026년 헤비 유저의 실제 패턴은 **2~3개 동시 운용**이다. 인터랙티브 페어 프로그래밍엔 Claude Code, 자동 PR 점검엔 Continue, 큰 리팩토링엔 Cursor Background — 식으로 분담한다. 도구 비용은 늘지만 시간 비용이 훨씬 더 준다.

에필로그 — 체크리스트, 안티패턴, 다음 글

도구를 고른 다음 1주일 안에 확인할 체크리스트

- [ ] 내 실제 PR 3개를 그 도구로 다시 만들어 봤다(처음부터 끝까지).

- [ ] 큰 파일·작은 파일·새 파일 각각의 편집 동작을 확인했다.

- [ ] MCP 통합(있다면) 한 개를 실제로 설정해 봤다.

- [ ] 비용을 일주일치 측정했다(API 사용량 + 구독 합계).

- [ ] 보안팀(있다면)에 데이터 처리 정책을 한 번 보였다.

- [ ] 팀원 한 명에게 30분 쉐도잉을 부탁해 봤다 — 막히는 지점이 어디인지.

- [ ] CI에 어떻게 들어갈지 한 단락이라도 적어 봤다.

안티패턴 — 흔히 보는 실수

1. **벤치마크 점수만 보고 결정한다.** Aider 폴리글롯 1등 ≠ 당신 코드베이스에서 1등. 모델 점수와 도구 적합도는 다른 축이다.

2. **시그니처 기능을 무시한다.** Aider의 Architect/Editor, Cline의 Plan/Act, Cursor의 Background — 시그니처를 안 쓰면 그 도구의 진가를 못 본다. 그 도구의 가장 특이한 부분을 가장 먼저 시도하라.

3. **모든 워크플로에 한 도구를 강요한다.** 인터랙티브 디버깅과 비동기 큰 리팩토링은 다른 도구가 잘한다. 도구를 두세 개 묶어 운용해 비용 합쳐도 시간 비용보다 싸다.

4. **MCP가 뭔지 모르고 산다.** 2026년 MCP는 표준이다. 사내 도구·DB·이슈 트래커를 에이전트에 노출하는 표준 방식이다. 안 쓰면 에이전트의 손을 묶는 거다.

5. **체크포인트·롤백 없이 자율 모드를 푼다.** Cline의 체크포인트 없이 자율 에이전트를 풀면 한 번 망가졌을 때 30분이 날아간다. 체크포인트 또는 git의 안전망을 반드시 설정하라.

6. **비용을 추정하지 않는다.** BYOK 도구의 월 모델 비용은 사용자가 직접 추정해야 한다. "공짜 도구"라고 부르는 사람들의 월 API 청구서가 200~500달러인 경우가 흔하다.

7. **사람의 검토를 생략한다.** AI가 만든 PR을 그대로 머지하면 6개월 뒤 기술 부채로 돌아온다. 인간 리뷰는 줄어드는 게 아니라 더 정밀해져야 한다.

다음 글 예고

다음 글에서는 **이 7개 도구를 같은 작업에 동시에 돌려 본 결과 — 같은 PR, 다른 도구, 다른 결과**를 본다. 진짜 코드 변경의 정량 비교, 비용 비교, 그리고 "어떤 도구가 어떤 단계에서 막혔는가"의 솔직한 기록.

그리고 그 다음은 **MCP 서버 만들기** — 사내 도구를 표준 MCP 서버로 감싸 7개 도구 모두에서 쓰는 법. 한 번 만들면 모든 에이전트에서 산다.

참고 / References

- [Claude Code Agent Teams, Subagents, and MCP: The 2026 Playbook — Developers Digest](https://www.developersdigest.tech/blog/claude-code-agent-teams-subagents-2026)

- [Claude Code Pricing 2026 — Verdent Guides](https://www.verdent.ai/guides/claude-code-pricing-2026)

- [Junie CLI Beta — JetBrains Blog (2026-03)](https://blog.jetbrains.com/junie/2026/03/junie-cli-the-llm-agnostic-coding-agent-is-now-in-beta/)

- [JetBrains Launches Air and Junie CLI — DevOps.com](https://devops.com/jetbrains-launches-air-and-junie-cli-to-blend-traditional-ide-with-ai-agents/)

- [Cline GitHub — autonomous coding agent](https://github.com/cline/cline)

- [Cline Plan & Act Mode docs](https://docs.cline.bot/core-workflows/plan-and-act)

- [Aider Edit Formats docs](https://aider.chat/docs/more/edit-formats.html)

- [Aider Polyglot Leaderboard](https://aider.chat/docs/leaderboards/)

- [Aider Guide 2026: Atomic Commits & Architect Mode — DeployHQ](https://www.deployhq.com/guides/aider)

- [OpenAI Codex CLI — Features](https://developers.openai.com/codex/cli/features)

- [OpenAI Codex CLI — Changelog](https://developers.openai.com/codex/changelog)

- [Codex MCP — OpenAI Developers](https://developers.openai.com/codex/mcp)

- [The codex-rs Architecture: Rust Rewrite](https://codex.danielvaughan.com/2026/03/28/codex-rs-rust-rewrite-architecture/)

- [Cursor 2026: Composer, Agent Mode, MCP & Background Agent — DeployHQ](https://www.deployhq.com/guides/cursor)

- [Cursor Background Agent — Run Long Tasks](https://blink.new/blog/cursor-background-agent)

- [Cursor Pricing 2026 — AI Productivity](https://aiproductivity.ai/blog/cursor-pricing/)

- [Continue GitHub — Continuous AI](https://github.com/continuedev/continue)

- [Continue.dev — Open Source AI Code Agent Guide (Better Stack)](https://betterstack.com/community/guides/ai/continue-dev-ai/)

- [MCP — Model Context Protocol spec](https://modelcontextprotocol.io/)