Chaos and Order

💡 왼쪽 원문을 읽으면서 오른쪽에 따라 써보세요. Tab 키로 힌트를 받을 수 있습니다.

원문 렌더가 준비되기 전까지 텍스트 가이드로 표시합니다.

프롤로그 — 왜 번역 시장이 다시 흔들리는가

2014년에 신경망 기반 기계번역(NMT)이 통계 기반(SMT)을 갈아치웠고, 2017년 Transformer가 표준이 되면서 한동안 시장은 안정기로 들어갔다. 구글·DeepL·마이크로소프트가 큰 세 축이었고, 엔터프라이즈는 Lilt·Smartling·Phrase·Crowdin 같은 TMS(번역 관리 시스템)에 자기 워크플로를 맡겼다. 그런데 2023년 GPT-4가 등장한 뒤 풍경이 다시 바뀌었다. 단순한 문장 수준 번역만 보면 DeepL이 여전히 강하지만, **문서 전체 컨텍스트 · 톤 매뉴얼 · 용어집 적용 · 코드 스니펫 보존**이 필요한 순간 LLM이 압도적으로 유리하다. 2024년 Claude 3.5 Sonnet과 2025년 GPT-4o는 BLEU 기준으로 DeepL과 거의 같은 점수를 냈고, COMET·MQM 같은 사람 평가 기반 지표에선 일부 도메인에서 더 좋다는 보고도 나왔다.

2026년의 진짜 질문은 더 이상 "DeepL이냐 구글이냐"가 아니라 **"내 워크플로의 어느 자리에 무엇을 끼울 것인가"**다. 1억 문자짜리 제품 매뉴얼이라면 DeepL Pro + TMS 조합이 여전히 가장 빠르고 싸다. 그러나 100개 마케팅 카피의 톤을 한 가이드라인에 맞춰야 한다면 LLM 한 줄짜리 프롬프트가 더 정확하다. 의료·법무처럼 도메인 적응이 필요하다면 Lilt나 ModernMT의 사람-개입 적응형이 답이다. 음성·실시간 통역이라면 KUDO·Interprefy 같은 전문 서비스가 별도로 있다.

이 글은 30개 가까운 번역·로컬라이제이션 도구를 한 자리에 모아 정리한다. 비교 축은 일곱 가지 — **번역 품질, 도메인 적응, 컨텍스트 길이, 지원 언어 수, 가격, 프라이버시·데이터 잔류, TMS 통합**. 그 뒤로 i18next·react-intl·Next.js i18n 같은 프레임워크의 자리, ICU MessageFormat과 TMX·TBX·XLIFF 같은 포맷, COMET·BLEURT·MQM 같은 품질 평가 메트릭까지 묶는다. 한 번 읽으면 2026년 5월 기준 로컬라이제이션 스택의 전체 지형이 잡힌다.

가격·기능 수치는 6개월 단위로 바뀐다. 이 글의 모든 숫자는 **2026년 5월 18일 기준**이며, 구체적 숫자보다 의사결정 프레임에 집중한다. 1년 뒤 가격이 바뀌어도 "어느 자리에 어떤 종류의 도구를 두는가"라는 골격은 유효해야 한다.

1장 · 기계번역의 진화 — SMT, NMT, LLM 시대

기계번역의 역사는 세 시대로 깨끗하게 나뉜다.

**1세대 · 통계 기반 번역(SMT, 2007년경)**

구글 번역이 2007년부터 약 10년간 썼던 방식. 거대한 병렬 코퍼스에서 단어·구·문장 수준의 정렬을 학습해, 출력 문장의 각 구간을 확률로 조합했다. 짧은 문장과 일상 표현에선 그럭저럭 작동했지만 **긴 문장에서 어순이 깨지고, 의미가 뒤섞이는** 약점이 컸다. 한국어·일본어·아랍어처럼 어순이 영어와 다른 언어쌍에서 특히 약했다.

**2세대 · 신경망 기반 번역(NMT, 2014~)**

2014년 Sutskever 등의 Seq2Seq 논문이 출발점이었다. 2016년 구글이 자사 번역 엔진을 통째로 NMT(GNMT)로 교체했고, 그해 가을 한 번에 BLEU 점수가 10점 가까이 뛰었다. 2017년 Transformer 논문 이후엔 인코더-디코더 모델이 표준이 됐고, DeepL이 같은 해 8월 등장해 곧장 시장의 상위를 차지했다. NMT 시대의 강점은 **문장 단위 자연스러움**이지만, 약점도 여전히 있다. 컨텍스트 윈도가 짧아 단락·문서 전체 일관성이 약하고, 도메인 어휘 적응에 별도 학습이 필요하다.

**3세대 · LLM 기반 번역(2023~)**

GPT-4가 2023년 초 공개된 직후 사람들이 처음 발견한 깜짝 능력 중 하나가 번역이었다. 별도의 번역 학습 없이도 GPT-4는 DeepL·구글 NMT와 어깨를 나란히 했다. 2024년에는 Claude 3.5 Sonnet, 2025년 Claude 4와 GPT-4o가 등장하며 격차가 더 좁혀졌다. LLM 번역의 강점은 셋이다 — (a) **긴 컨텍스트**, 100k~1M 토큰까지 문서를 통째로 본다. (b) **프롬프트로 도메인·톤 지시 가능**, 별도 파인튜닝 없이도 "법무 톤으로", "마케팅 카피로" 같은 지시가 먹는다. (c) **코드·표 보존**이 자연스럽다.

LLM 번역의 약점은 두 가지다 — 비용(문자당 단가가 NMT의 5~50배)과 지연(NMT는 100ms 미만, LLM은 수 초). 그래서 2026년의 실제 워크플로는 **NMT가 1차로 빠르게 돌리고, LLM이 2차로 톤·일관성·도메인 보정**을 하는 하이브리드가 많다.

세 세대의 공존 — 2026년에도 SMT는 일부 임베디드 기기에서 살아 있고, NMT는 양적 워크로드의 주력이며, LLM은 품질이 결정적인 자리에 끼인다. 어느 한쪽이 모두를 대체하지 않는다.

2장 · DeepL — 유럽·한·일 언어의 챔피언

독일 Cologne에서 2017년 시작한 DeepL은 NMT 시대의 결정적 승자다. 출시 직후 BLEU 기준으로 구글·마이크로소프트·아마존을 동시에 앞섰고, 그 격차는 영어-독일어, 영어-프랑스어, 영어-스페인어 같은 유럽 언어쌍에서 가장 크다. 한국어와 일본어가 2020년 추가됐고, 2026년 5월 기준 32개 언어를 지원한다. DeepL Translator 무료 버전, DeepL Pro 유료 버전, DeepL API, 그리고 글쓰기 보조 도구인 DeepL Write 네 가지 제품군이 있다.

**가격 구조 — DeepL Pro 2026년 기준**

- Starter: 월 9 USD, 월 50만 문자

- Advanced: 월 33 USD, 무제한 문자 + CAT 통합

- Ultimate: 월 60 USD, 무제한 + 우선 처리

- API Free: 월 50만 문자 무료

- API Pro: 사용량 기반, 백만 문자당 25 USD부터

**DeepL의 강점**

한국어와 일본어 자연스러움에서 구글·마이크로소프트보다 한 단계 위라는 평이 지배적이다. 문장 안의 어휘 일관성, 격조사·접속사 처리, 경어체 인식이 좋다. 글머리 기호 · 마크다운 · HTML 태그를 보존하는 옵션이 안정적이라 문서 번역 워크플로에 끼우기 쉽다.

**DeepL Write**

별도 제품. 영어·독일어 글쓰기 톤·문법 보조. Grammarly와 비슷하지만 톤 변환(친근체, 비즈니스, 학술)의 깊이가 깊다. 2025년에 한국어 베타가 열렸고 2026년에 정식 출시됐다.

**한계 — 정직한 평가**

컨텍스트 윈도가 짧다. 문장 단위로 끊어 보내야 안전하고, 단락·문서 전체 일관성은 약하다. 도메인 어휘를 강제하려면 **글로사리(Glossary)** 기능을 써야 하는데, 무료에는 없고 Pro의 일부 플랜만 지원한다. LLM처럼 "이 문서의 톤은 ~로", "이 용어는 ~로" 같은 자유 형식 지시는 안 먹는다.

3장 · 구글 번역 & Cloud Translation API — 가장 넓은 커버리지

구글 번역은 2006년 SMT로 출발해 2016년 NMT로 갈아탔고, 2020년 zero-shot 다언어 모델로 전환하면서 **130개 이상의 언어**를 지원한다. 이건 시장 어느 곳도 따라오지 못하는 숫자다. 영어-스페인어 같은 메이저 쌍은 DeepL과 비슷하지만, 스와힐리어·우즈베크어처럼 자원이 적은 언어에선 구글이 훨씬 강하다.

**제품 구성**

- 구글 번역 웹·앱: 무료, 일반 사용자용

- Cloud Translation API v3: 엔터프라이즈용 NMT API

- Cloud Translation - Advanced(v3): 글로사리, 모델 커스터마이즈, 배치 번역, AutoML

- 구글 번역 카메라·음성: 모바일 앱 기능

**가격 — Cloud Translation 2026년**

- NMT 기본: 백만 문자당 20 USD

- AutoML Translation: 백만 문자당 80 USD (커스텀 모델)

- 무료 티어: 월 50만 문자

**구글 번역 앱 — 모바일의 강자**

카메라로 비추면 실시간 OCR + 번역. 음성 대화 모드(Conversation)에서 두 사람이 모국어로 말하면 양방향 번역. Lens 기능은 메뉴판 · 표지판처럼 자유 형식 텍스트에서 특히 강하다.

**Cloud Translation API의 자리**

다국어 채팅, UGC 번역, 사용자가 입력한 검색어 번역처럼 **대량 · 실시간 · 다양한 도메인** 워크로드의 디폴트. DeepL이 32개 언어만 지원하기 때문에, 베트남어·인도네시아어·태국어 같은 동남아 시장 진출이 필요하면 구글이 1순위가 된다.

**한계**

한국어·일본어 자연스러움에서 DeepL에 밀린다는 평이 많다. 글로사리 통합은 가능하지만 DeepL보다 미세 조정이 어렵다.

4장 · Microsoft Translator & Amazon Translate — 클라우드 통합형

**Microsoft Translator (Azure AI Translator)**

Azure 생태계의 번역 API. 100개 이상 언어 지원, NMT v3 기반. Office 365 · Teams · SharePoint 통합이 1급이다. 가격은 백만 문자당 10 USD부터 시작 — 구글보다 약간 싸다. **Custom Translator** 기능으로 사내 코퍼스를 업로드해 도메인 적응형 모델을 만들 수 있다. 의료 · 법무 · 금융 같은 도메인에서 잘 쓰인다. 데이터 잔류(data residency) 옵션이 강해, EU · UK · 일본의 데이터 주권 요구를 따르기 쉽다.

**Amazon Translate**

AWS 측 번역 API. 75개 언어. 가격은 백만 문자당 15 USD, Active Custom Translation은 60 USD. 강점은 **AWS 생태계 통합** — S3에서 배치 번역, Lambda 트리거, Comprehend(엔티티 추출)와 파이프라인. 단독 번역 품질만 보면 구글·DeepL·MS보다 살짝 떨어진다는 평이 일반적이지만, AWS에 이미 모든 인프라가 있다면 데이터 이동 비용이 0이라는 게 결정적이다.

**선택 기준**

- 마이크로소프트 365 · Azure 위주의 기업 → Microsoft Translator

- AWS 위주의 인프라 → Amazon Translate

- 멀티클라우드 또는 클라우드 무관 → DeepL · 구글 · LLM 직접 호출

이 둘 중 어떤 쪽도 NMT 품질의 절대 정상은 아니지만, 이미 그 클라우드를 쓰고 있는 팀에게는 통합 비용이 압도적으로 낮다.

5장 · ModernMT — 적응형 NMT의 원조

이탈리아 Translated.com이 만든 ModernMT는 **적응형(adaptive) MT**라는 개념을 시장에 정착시킨 도구다. 무엇이 적응형인가 — 번역가가 후편집(post-editing)한 결과가 즉시 모델에 피드백되어, 같은 세션 · 같은 프로젝트 안에서 점점 더 그 번역가의 스타일과 용어를 따라간다. 일반 NMT는 학습이 끝나면 그 자리에 고정되어 있지만, ModernMT는 **사용 중에 계속 배운다**.

**핵심 메커니즘**

번역 메모리(TM)와 용어집을 추론 시점에 모델에 주입하는 방식. fine-tuning이 아니라 retrieval-augmented inference라고 보면 정확하다. 그래서 모델 자체는 변하지 않고, 컨텍스트가 풍부해진다. 결과적으로 도메인 적응 비용이 거의 0에 가깝다.

**제품 라인**

- ModernMT Enterprise: 사내 배포(on-prem) 가능

- ModernMT Translate: SaaS API

- Lara: 2024년 발표한 차세대 모델, LLM 기반 + 적응형 결합

**Lara — 2026년 주력**

GPT-4 · Claude · Gemini와 비슷한 LLM 기반이면서, 사용 중인 TM과 용어집을 자동으로 끌어쓴다. 사용자 평가에서 표준 NMT보다 일관성이 크게 개선됐다는 데이터가 있다.

**가격**

공개 가격표는 없고 엔터프라이즈 견적. 일반적으로 백만 문자당 30~60 USD 범위로 알려져 있고, 사내 배포는 더 비싸다. 의료·법무·기술 매뉴얼처럼 도메인이 좁고 일관성이 결정적인 자리에 잘 맞는다.

6장 · Lilt — 사람-개입 적응형의 끝판왕

캘리포니아 Lilt는 ModernMT와 비슷한 적응형 철학이지만 한 발 더 나간다. 번역가가 키를 하나 칠 때마다 모델이 **다음 단어를 예측**해 제시하고, 번역가는 받아쓸지 거부할지 결정한다. 이걸 Lilt는 "Contextual AI"라 부른다. 결과적으로 번역가의 키 입력 수가 절반 가까이 줄어들고, 시간당 처리량은 두 배 가까이 늘어난다는 보고가 있다.

**비즈니스 모델**

Lilt는 단순 API가 아니라 **번역 서비스 + 플랫폼** 결합 상품이다. 자체 번역가 풀을 가지고 있고, 고객이 콘텐츠를 올리면 사람-개입 적응형 워크플로로 처리된다. 가격은 비싸다 — 보통 **월 1,500 USD 이상**의 엔터프라이즈 계약. 단어당 가격은 시장 평균이지만 플랫폼 사용료가 별도다.

**누가 쓰나**

인텔, Canva, 에어비앤비, Asics 같은 대기업이 고객 명단에 있다. 공통점은 **콘텐츠 볼륨이 크고, 품질이 결정적이며, 사내 LSP(언어 서비스 제공자) 운영 부담을 외부화하고 싶은** 회사다.

**vs ModernMT**

ModernMT는 도구를 팔고, Lilt는 도구+서비스를 판다. 사내에 번역가가 있고 도구만 필요하면 ModernMT, 번역가까지 외부에 위탁하고 싶으면 Lilt가 자연스러운 선택이다.

**한계**

가격 진입장벽이 높아 중소기업·개인이 쓸 수 없다. 또 영어를 축으로 한 언어쌍에 강점이 집중되어 있어, 한국어·일본어 쌍에서는 DeepL이나 LLM이 더 자연스럽다는 평이 일반적이다.

7장 · Smartling — 엔터프라이즈 로컬라이제이션 플랫폼

뉴욕 Smartling은 2009년 출범한 베테랑. **번역이 아니라 로컬라이제이션 플랫폼**으로 자기를 정의한다. 즉, 한 문장을 번역해 주는 게 아니라 **콘텐츠가 생성되는 지점부터 배포까지** 모든 단계를 자동화한다. CMS 통합, 자동 콘텐츠 추출, 번역 메모리·용어집 관리, 번역가 워크플로 관리, QA, 배포까지 한 자리에서 끝낸다.

**핵심 기능 — Global Delivery Network**

이게 Smartling의 시그니처. CDN처럼 동작하는 번역 프록시 — 영어 웹사이트의 URL을 다국어 도메인으로 라우팅하면, Smartling이 콘텐츠를 자동 추출·번역·캐시·배포한다. 사이트 코드를 수정하지 않고도 다국어 사이트가 떨어진다.

**가격**

공개 가격은 없고 엔터프라이즈 견적. 일반적으로 **연 수만 USD부터**. ROI 계산이 까다로워 중소기업은 진입이 어렵다.

**누가 쓰나**

British Airways, 우버, 슬랙, Affirm 등. 글로벌 콘텐츠 볼륨이 크고 마케팅·제품·법무 콘텐츠가 한 플랫폼에서 흘러야 하는 회사.

**번역 엔진**

Smartling 자체는 번역 엔진을 만들지 않는다. DeepL · 구글 · MS · ModernMT 등을 통합해 쓸 수 있고, LLM 통합도 2024년부터 지원. 진짜 가치는 워크플로 · 메모리 · 거버넌스에 있다.

8장 · Phrase (구 Memsource) — TMS의 챔피언

체코 출신 Memsource가 2021년 독일 Phrase를 인수해 브랜드를 통합했다. 2026년 기준 TMS 시장 점유율 상위. **번역 메모리, 용어집, 프로젝트 관리, 번역가 협업, 머신 번역 통합** 모두를 SaaS로 제공한다.

**Phrase의 자리**

DeepL과 구글이 "엔진"이라면 Phrase는 **그 엔진들을 묶어서 워크플로로 만드는 레이어**다. 한 문서를 1차로 DeepL로 돌리고, 후편집은 번역가가 Phrase 에디터에서 하고, 결과는 TM에 쌓인다. 다음 비슷한 문장을 만나면 TM이 자동으로 끌어쓴다.

**제품 라인**

- Phrase TMS (구 Memsource): 엔터프라이즈 번역 관리

- Phrase Strings: 개발자용 i18n 키 관리

- Phrase Analytics: 번역 KPI 추적

- Phrase Custom AI: 도메인별 LLM 번역 (2024년 출시)

**가격**

- Phrase TMS Team: 월 27 USD/사용자

- Business: 월 65 USD/사용자

- Enterprise: 견적

**Phrase Strings의 자리**

i18n 키 관리에 특화된 별도 제품. JSON · YAML · gettext · iOS · Android 파일을 한 자리에서 관리. Lokalise · POEditor와 경쟁한다. 가격은 키 수에 따라 다르고, 200키까지 무료 플랜이 있다.

**한계**

UI가 복잡하다 — 처음 들어가면 무엇을 어디서 해야 할지 헷갈린다. 학습 곡선이 가파른 게 사실이다. 그러나 한 번 내재화하면 가장 풍부한 기능을 제공한다.

9장 · Crowdin — 협업 중심의 로컬라이제이션

우크라이나 출신 Crowdin은 오픈소스 프로젝트와 스타트업에서 가장 사랑받는 TMS다. **GitHub 통합이 깊고**, 번역 메모리·용어집·머신 번역 통합·번역가 커뮤니티 관리가 한 자리에 있다.

**Crowdin의 차별점**

- **GitHub · GitLab · Bitbucket 1급 통합** — PR이 머지될 때마다 소스 문자열이 자동 업데이트되고, 번역이 끝난 결과는 자동 PR로 돌아온다

- **크라우드소싱 번역** — 오픈소스 프로젝트가 자원봉사 번역가를 모집해 관리하기 쉽다

- **In-Context Editor** — 번역가가 실제 사이트·앱 위에 번역을 미리 보면서 작업

**가격**

- Free: 60,000자 한도, 1프로젝트 (오픈소스용은 별도 무료 플랜)

- Pro: 월 50 USD부터, 30개 프로젝트

- Team: 월 200 USD부터

- Enterprise: 견적

**오픈소스 무료**

Crowdin은 인증된 OSS 프로젝트에 무료 플랜을 준다. Discord, Minecraft, Telegram, Privacy Badger, Hugging Face 같은 프로젝트가 Crowdin을 쓴다.

**Phrase vs Crowdin**

Phrase가 엔터프라이즈 거버넌스 · 컴플라이언스 중심이라면, Crowdin은 **개발자 친화 · 커뮤니티 친화**다. 스타트업 또는 OSS 프로젝트라면 Crowdin이 더 자연스러운 출발점이다.

10장 · Lokalise · Transifex · POEditor · Weblate — TMS 경쟁자들

**Lokalise**

이스라엘 출신, 모바일·웹 i18n에 강점. **iOS · Android · Flutter SDK가 강하고**, 디자이너용 Figma 플러그인이 있다. 가격은 월 120 USD부터(Start), 230 USD(Essential), Pro · Business 견적. Phrase Strings · Crowdin과 직접 경쟁한다.

**Transifex**

캘리포니아 출신, 한때 OSS의 디폴트였다. 현재 가격은 월 70 USD부터(Starter), 200 USD(Growth), Premium 견적. Drupal, Mozilla, Coursera 같은 곳이 고객. 최근 몇 년 Phrase · Crowdin · Lokalise에게 시장을 일부 내줬지만 여전히 살아 있다.

**POEditor**

루마니아 출신, **가격이 가장 저렭한** 옵션. 무료 1,000 문자열, 월 14.99 USD(Start), 49.99 USD(Pro), 119.99 USD(Business). 작은 스타트업, 인디 개발자에게 인기.

**Weblate**

체코 출신, **오픈소스(GPLv3)**. 셀프 호스트 가능. Phabricator · GitLab 통합이 깊다. Fedora, openSUSE, MariaDB, LibreOffice 같은 OSS가 쓴다. 호스팅 서비스는 월 19 USD(Basic)부터.

**선택 가이드 — 한 줄 요약**

- 엔터프라이즈 거버넌스 + 다양한 콘텐츠 → Phrase TMS

- OSS · 스타트업 · GitHub 워크플로 → Crowdin

- 모바일 앱 i18n + Figma 통합 → Lokalise

- 저비용 + 단순 → POEditor

- 셀프 호스트 + 무료 + OSS → Weblate

11장 · CAT 툴 — OmegaT · memoQ · SDL Trados · Wordfast

**CAT(Computer-Assisted Translation)**은 TMS와 비슷해 보이지만 다르다. TMS는 클라우드 협업 플랫폼이고, CAT은 번역가가 자기 PC에서 쓰는 **데스크톱 도구**다. 전문 번역가의 작업 환경.

**SDL Trados Studio (현 RWS Trados Studio)**

전문 번역가 시장의 약 70% 점유율을 가진 절대 강자. 윈도용 데스크톱. 가격은 695 EUR(Freelance, 영구 라이선스)부터. **번역 메모리 + 용어집 + 머신 번역 통합**이 모두 깊다. 학습 곡선이 가파르지만 일단 내재화하면 생산성이 결정적으로 높다.

**memoQ**

헝가리 출신. Trados의 가장 큰 경쟁자. 클라우드(memoQ cloud)와 데스크톱 모두 제공. 가격은 770 USD(translator pro, 영구 라이선스)부터. Trados보다 UI가 단순하다는 평이 일반적이고, 협업 기능이 더 좋다.

**Wordfast**

프랑스 출신. Trados의 저가형 대안. Wordfast Pro(2024년 기준 540 USD 영구 라이선스), Wordfast Anywhere(클라우드 무료). 작은 LSP · 프리랜서에 인기.

**OmegaT**

**오픈소스 (GPL)** 데스크톱 CAT. 자바 기반, 윈도 · 맥 · 리눅스 모두 가능. 무료이며 TM·용어집·머신 번역 통합 모두 지원. UI는 거칠지만 실용적이다. 사내 LSP 없이 시작하는 스타트업, 학생, 사회운동가에게 자연스러운 선택.

**CAT vs LLM**

2026년의 진짜 질문 — CAT 도구는 사라질까? 결론부터는 아니다. 전문 번역가의 정밀 작업, 번역 메모리 활용, 보안 환경(오프라인) 작업에서 CAT은 여전히 절대적이다. 그러나 양적 워크로드의 1차 번역은 NMT나 LLM이 가져가고 있어, CAT의 자리는 **사람-개입 후편집의 정밀 도구**로 좁아진 게 사실이다.

12장 · LLM 기반 번역 — Claude, GPT, Gemini, DeepSeek

2023년 GPT-4 출현 이후 LLM 번역은 빠르게 성숙했다. 2026년 5월 기준 주력 모델은 다음과 같다.

**Claude 3.7 · Claude 4 (Anthropic)**

긴 컨텍스트(200k 토큰, 1M 베타)와 톤·뉘앙스 처리에서 강점. 한국어·일본어 자연스러움에서 매우 좋은 평. 법무·의료처럼 정확성이 결정적인 도메인에서 자주 선택된다.

**GPT-4o · GPT-4.5 · GPT-5 (OpenAI)**

빠른 응답과 다국어 폭에서 강점. 130개 이상 언어를 안정적으로 처리하고, 함수 호출과 결합하면 도구로서의 번역 파이프라인을 짜기 쉽다.

**Gemini 1.5 Pro · 2.0 (Google)**

**100만~200만 토큰 컨텍스트**가 차별점. 책 한 권을 통째로 넣고 일관성 있게 번역 가능. PDF · 이미지 · 동영상 입력 처리가 강하다.

**DeepSeek V3 · R1 (DeepSeek)**

중국 출신, 가격이 매우 싸다. 백만 토큰당 0.14 USD 수준으로 GPT-4의 30분의 1. 영어-중국어 쌍이 특히 강하다.

**LLM 번역의 프롬프트 패턴 — 실전**

- 시스템 프롬프트에 도메인·톤·금지어·용어집 명시

- 사용자 메시지에 원문 + "출력 형식은 번역문만" 지시

- 긴 문서는 청크 단위로 잘라 보내되, 컨텍스트로 직전 청크의 마지막 문단을 함께 첨부

- 출력 후 별도 LLM이 QA(품질 검증)를 한 번 더 돌리는 패턴이 효과적

**LLM 번역의 한계 — 정직한 평가**

- **비용** — DeepL · 구글 NMT 대비 5~50배. 대량 워크로드에선 무거움

- **지연** — 100ms 미만의 NMT에 비해 수 초~수십 초

- **반복성** — 같은 입력에 같은 출력 보장이 어렵다(`temperature=0`이어도)

- **데이터 잔류** — 미국·중국 클라우드 경유, EU GDPR · 한국 개인정보보호법 검토 필요

대부분의 2026년 실전 워크플로는 **NMT가 양을, LLM이 품질을** 맡는 하이브리드다.

13장 · 오픈소스 NMT — NLLB, M2M-100, MADLAD, OPUS-MT, Argos

상용 제품이 못 미치는 자리 — 오프라인, 데이터 잔류, 임베디드 — 에서 오픈소스 NMT가 빛난다.

**NLLB-200 (Meta, 2022)**

**No Language Left Behind**. 200개 언어 지원, 자원이 적은 언어 — 키냐르완다어, 케추아어, 신디어 — 까지 포함. 모델 크기는 600M부터 54B까지. Hugging Face에 모두 공개. 자원 적은 언어 지원이 절대적으로 필요할 때 거의 유일한 선택.

**M2M-100 (Meta, 2020)**

**Many-to-Many** — 100개 언어 사이를 영어 경유 없이 직접 번역. 영어 우회 없이 한국어→스와힐리어 같은 쌍에서 품질이 결정적으로 좋다.

**MADLAD-400 (Google, 2023)**

**400개 언어** — 시장 최다. 10.7B 파라미터까지. Apache 2.0 라이선스로 상업 사용 가능.

**Helsinki-NLP / OPUS-MT**

헬싱키 대학교가 OPUS 코퍼스로 학습한 작은 모델들. Hugging Face에 1,000개 이상의 언어쌍 모델 공개. 모델당 100~300MB로 가벼워 **엣지 디바이스 · 임베디드 · 오프라인** 워크로드에 자주 쓰인다.

**Argos Translate**

OPUS-MT를 묶어 **데스크톱 GUI · CLI · Python 라이브러리**로 만든 오픈소스 도구. 완전 오프라인, 무료. 개인정보 절대 외부 유출 금지가 필요한 자리(법무 · 의료 · 정부)에서 매력적이다.

**선택 가이드**

- 자원 적은 언어 → NLLB-200, MADLAD-400

- 영어 우회 없는 직접 번역 → M2M-100

- 엣지 · 임베디드 → OPUS-MT

- 데스크톱 오프라인 → Argos Translate

오픈소스 NMT의 한계는 분명하다 — 품질이 DeepL · 구글에 한 단계 못 미친다. 그러나 **무료 + 오프라인 + 데이터 잔류 0**이라는 강점이 결정적인 자리가 있다.

14장 · 음성 번역 — 구글 Live, 애플 Live Translation, 갤럭시 AI

음성 번역은 두 모듈의 조합이다 — (a) 음성→텍스트(ASR, Automatic Speech Recognition), (b) 텍스트→텍스트 번역. 2024년 이후 두 모듈이 통합된 종단 모델도 나오고 있다.

**구글 번역 Live · Conversation**

구글 번역 앱의 음성 대화 모드. 두 사람이 자기 모국어로 말하면 양방향 번역. 마이크 하나로 두 화자를 자동 구분한다. 무료. 가장 성숙한 옵션이며 가장 많은 언어를 지원한다.

**애플 Live Translation (iOS 18.4, 2025)**

2025년 4월 iOS 18.4에서 정식 출시. AirPods Pro 2 · 3와 결합하면 **이어폰으로 실시간 통역**이 들린다. 영어·스페인어·프랑스어·독일어·중국어 등 8개 언어로 출발했고, 2026년 5월 기준 19개 언어로 확장. 한국어·일본어 지원.

**삼성 갤럭시 AI Live Translate**

2024년 Galaxy S24와 함께 등장. 전화 통화 중 실시간 통역. 통화 상대방의 폰이 갤럭시가 아니어도 작동. 13개 언어 지원, 2026년 기준 17개로 확장.

**Pixel Recorder transcribe + translate**

구글 Pixel 폰의 녹음 앱. 회의 녹음을 받아쓰기하고 번역까지 한 자리에서. 강점은 **온디바이스(폰 안에서)** 처리 — 데이터가 외부로 안 나간다.

**OpenAI Whisper translate**

Whisper는 ASR 모델이지만 `translate` 모드를 쓰면 입력 언어를 영어로 번역한다. 영어로만 출력하는 제약. 오픈소스 · 셀프호스트 가능. 한국어 음성 → 영어 텍스트 같은 워크플로에 자주 쓰임.

**한계 — 정직한 평가**

음성 번역은 텍스트 번역보다 본질적으로 어렵다. 화자의 의도 · 톤 · 비격식 표현 · 잡음 · 발음 변이 모두가 ASR 단계에서 오류로 들어오기 때문. 격식 발표 같은 환경에선 잘 작동하지만, 비격식 대화 · 사투리 · 군중 환경에선 여전히 한계가 크다.

15장 · 실시간 통역 — KUDO, Interprefy, AppTek

**KUDO**

2017년 출범한 가상 통역 플랫폼. Zoom · Teams · Webex 같은 화상회의에 끼워 쓴다. 사람 통역사 풀과 AI 통역 모두 제공. 2024년 AI Speaker — 한 사람의 발화를 다른 언어로 동시 통역해 청자에게 들려주는 — 를 정식 출시했다. UN, 국제기구, 글로벌 컨퍼런스가 주 고객.

**Interprefy**

스위스 출신. KUDO와 직접 경쟁. 가상 + 현장 하이브리드 통역에 강점. 다보스 포럼, FIFA 같은 큰 행사에서 채택.

**AppTek**

미국 출신, 더 깊은 기술 회사. ASR · 번역 · TTS를 한 스택으로 연결한 종단 음성 통역. 미국 정부 · 군 · 글로벌 미디어가 고객. 자체 데이터센터에 배포 가능.

**Translate.com / Mirror Pro**

일반 사용자용 통역 앱. 호텔 · 관광 · 일상 대화에 적합. 가격은 월 14.99 USD부터.

**실시간 통역의 자리**

이 시장은 텍스트 번역과 사용 사례가 완전히 다르다. **컨퍼런스 · 화상회의 · 다국적 미팅**처럼 즉시성이 결정적인 자리. 정확도와 지연이 트레이드오프인데, 2026년 기준 사람 통역사는 여전히 정확도에서 우위, AI 통역은 비용과 확장성에서 우위. 두 옵션이 공존한다.

16장 · 한국어 번역 — Papago, Kakao i 번역, Genie Talk

한국어는 어순 · 격조사 · 경어체 때문에 일반 NMT가 어려워하는 언어다. 한국 회사가 자체 NMT 엔진을 만들어 운영하는 이유.

**Naver Papago**

네이버의 NMT. 한·영 · 한·일 · 한·중에서 강점. 무료 웹 · 앱 · API. 카메라 · 음성 · 대화 모드 모두 지원. 학교 · 일상 · 관광에서 압도적 점유율. API는 NCP(Naver Cloud Platform)에 통합.

**Kakao i 번역**

카카오의 번역 엔진. 카카오톡 챗봇 · 카카오 i 스피커에 통합. 한·영에서 Papago와 경쟁. 일반 사용자 대상 단독 제품보다는 카카오 생태계의 기능으로 자리잡는다.

**Genie Talk (한컴, SYSTRAN 기반)**

SYSTRAN의 NMT 기반. 정부 · 군 · 공공기관에 자주 채택. 한국어와 영어 · 일본어 · 중국어 쌍에서 강점.

**한국어 vs DeepL · LLM**

- 일상 대화 → Papago · Kakao

- 비즈니스 문서 → DeepL Pro

- 도메인 · 톤 · 일관성 → Claude · GPT (프롬프트로 적응)

- 정부 · 보안 → Genie Talk(셀프호스트) 또는 사내 LLM

한국어는 시장 특수성이 강해, 글로벌 도구만으로는 부족한 자리가 분명히 있다.

17장 · 일본어 번역 — Mirai Translator, DeepL JP, T-4OO

일본어는 한국어와 비슷한 어순 + 한자 + 가나 + 카타카나 혼용 때문에 NMT의 또 다른 난제다. 일본 회사도 자체 엔진을 만든다.

**Mirai Translator (NTT-AT)**

NTT 어드밴스드 테크놀로지가 만든 일본 시장 1위 엔터프라이즈 NMT. 사내 배포(on-prem) 옵션이 강하다. 일본 대기업 · 정부 · 금융이 주 고객.

**DeepL Japan**

DeepL은 일본어 자연스러움에서 평이 매우 좋다. 일본 도쿄에 지사를 운영하고, **DeepL Voice** 등 일본 시장 특화 기능도 출시했다.

**T-4OO (Rozetta)**

Rozetta가 만든 일본 NMT. 의료 · 법무 · 금융 도메인에 강점.

**Google · Microsoft · Amazon vs 일본 엔진**

공개 BLEU 평가에서 일본어→영어 쌍은 DeepL이 일반적으로 최고이고, 일본어→중국어 같은 동아시아 쌍에선 Mirai · T-4OO 같은 일본 엔진이 도메인에서 강점.

**선택 가이드**

- 일상 · 학교 → 구글 · DeepL 무료

- 비즈니스 일반 → DeepL Pro

- 일본 사내 시스템 통합 → Mirai Translator(on-prem)

- 의료 · 법무 · 금융 → T-4OO

일본 시장의 특징은 **사내 배포 · 데이터 잔류 요구가 강하다**는 점. 클라우드 SaaS를 못 쓰는 자리가 한국보다 많아, on-prem 옵션이 결정 인자가 된다.

18장 · i18n 프레임워크 — i18next, react-intl, Next.js i18n

도구 다음 — **개발 프레임워크 자리**다. 번역된 문자열을 어떻게 코드에 끼우는가.

**i18next**

JavaScript 생태계의 사실상 표준. 2011년부터 살아남았다. 200만+ 다운로드/주. React · Vue · Angular · Svelte 모두에 어댑터. JSON · YAML 키 파일 + `t('key')` 호출이 기본 패턴. ICU MessageFormat · 복수형 · 성별 · 컨텍스트 모두 지원.

**react-intl (FormatJS)**

야후가 만들고 FormatJS로 옮긴 React 전용 라이브러리. ICU MessageFormat 1급 지원. i18next보다 가볍지만 React에만 묶인다.

**Next.js i18n Routing**

Next.js 자체의 라우팅 i18n. App Router에서는 미들웨어 + `[locale]` 세그먼트로 라우팅. 콘텐츠 자체는 i18next · react-intl 또는 next-intl로 처리.

**next-intl**

Next.js App Router에 특화된 i18n 라이브러리. 서버 컴포넌트와 자연스럽게 결합. 2024년 이후 next-intl이 Next.js 프로젝트의 디폴트 선택이 되어가는 추세.

**Vue: vue-i18n · nuxt-i18n**

Vue / Nuxt 생태계의 i18n. i18next와 비슷한 API.

**모바일: iOS Localizable.strings, Android strings.xml**

플랫폼 표준. iOS는 `.xliff` 익스포트, Android는 `strings.xml`. Crowdin · Lokalise · Phrase Strings 모두 직접 지원.

**선택 가이드 — 단순화**

- React · Vue · Angular 일반 → i18next

- React 단독 + ICU 헤비 → react-intl

- Next.js App Router → next-intl

- Vue / Nuxt → vue-i18n / nuxt-i18n

- 모바일 → 플랫폼 표준 + Lokalise

19장 · ICU MessageFormat — 복수형 · 성별 · 컨텍스트

ICU(International Components for Unicode) MessageFormat은 메시지 안에 **복수형, 성별, 선택지**를 표현하는 표준이다. 거의 모든 진지한 i18n 라이브러리가 이걸 지원한다.

**기본 형태**

복수형 예 — "1 message" vs "5 messages" — 는 영어에서는 단/복수 둘만 있지만, 폴란드어 · 러시아어 · 아랍어처럼 4~6 형태가 있는 언어가 있다. ICU는 이걸 `one`, `few`, `many`, `other` 같은 카테고리로 추상화한다.

**예 — i18next의 키 파일에서**

한 메시지를 영어로는 단/복수 두 가지로, 폴란드어로는 `one`, `few`, `many`, `other` 네 가지로 따로 적어 둔다. 라이브러리가 카운트 값을 받아 자동으로 알맞은 형태를 고른다.

**성별 처리**

독일어 · 프랑스어 · 스페인어에선 명사 · 형용사의 성별 일치가 필요하다. ICU `select` 구문으로 처리 — "그는 갔다" vs "그녀는 갔다"를 한 키 안에 묶어 두고 컨텍스트로 선택.

**날짜 · 숫자 · 통화 포맷**

`{date, date, long}`, `{amount, number, currency}` 같은 구문으로 로케일별 자동 포맷. 한국어는 "2026년 5월 18일", 영어는 "May 18, 2026" 자동.

**ICU의 한계**

문법이 복잡해서 번역가가 직접 편집하면 실수가 잦다. 그래서 Phrase Strings · Lokalise · Crowdin은 ICU 메시지를 **시각적 에디터**로 보여준다 — 번역가는 카드 형태의 UI로 변형을 채우고, 라이브러리는 ICU 문법을 자동 생성.

**왜 중요한가**

"메시지 5개"를 단순 문자열로 처리하면 "메시지 1개"가 어색해진다. ICU 없이 i18n을 진지하게 하면 결국 문법적 어색함이 누적되어 사용자 경험을 깎는다.

20장 · TMX, TBX, XLIFF — 산업 표준 포맷

번역 워크플로에서 도구 사이에 데이터를 주고받는 표준 포맷이 셋이다.

**TMX (Translation Memory eXchange)**

번역 메모리 교환 포맷. XML 기반. Trados 메모리를 memoQ로 옮길 때, Phrase에서 Lilt로 옮길 때 모두 TMX가 다리가 된다. LISA(Localization Industry Standards Association)가 1998년 표준화. 2026년 현재 1.4가 가장 널리 쓰인다.

**TBX (TermBase eXchange)**

용어집 교환 포맷. ISO 30042 표준. 사내 용어집을 한 도구에서 다른 도구로 옮길 때. TMX가 문장 단위라면 TBX는 용어 단위.

**XLIFF (XML Localization Interchange File Format)**

**진행 중인 번역 작업 자체를 옮기는 포맷**. OASIS 표준. 원문 + 번역문 + 메타데이터 + 워크플로 상태 모두 한 파일에 담는다. Trados · memoQ · Phrase · Crowdin이 모두 임포트/익스포트 지원. iOS의 `.xliff` 익스포트도 같은 표준.

**왜 이 포맷들이 중요한가**

도구 잠금(vendor lock-in) 방지. 회사가 5년 뒤 Trados에서 memoQ로 바꿀 수 있는 이유. 또 사내 데이터(번역 메모리)는 회사의 자산 — 도구가 바뀌어도 자산은 유지되어야 한다.

**현실 — 정직한 평가**

표준이라 해도 도구마다 구현 차이가 있다. TMX 익스포트→다른 도구로 임포트가 100% 매끄러운 경우는 드물고, 메타데이터 일부 손실은 일반적이다. 그래서 큰 마이그레이션은 사전 검증이 필요하다.

21장 · 품질 평가 — BLEU, chrF, COMET, BLEURT, MQM

번역 품질을 어떻게 측정하는가. 자동 평가 메트릭과 사람 평가 모두 존재한다.

**BLEU (BiLingual Evaluation Understudy)**

2002년 IBM이 만든 최초의 표준. n-gram 겹침을 측정. 빠르고 재현 가능하지만, **의미 같지만 단어 다른 번역**을 페널티한다. 2026년에도 여전히 가장 흔히 쓰이지만 한계가 분명.

**chrF**

문자 단위 F-score. BLEU의 단어 의존성을 완화. 한국어 · 일본어처럼 단어 경계가 모호한 언어에 더 적합.

**TER (Translation Edit Rate)**

번역가가 결과를 수정하는 데 필요한 편집 수. 낮을수록 좋음. 후편집 비용을 직접 추정할 수 있어 산업계에서 자주 쓰임.

**COMET**

2020년 Unbabel이 발표한 신경망 기반 평가 메트릭. 원문 · 참조 · 후보를 모두 받아 사람 평가와 높은 상관을 보인다. BLEU보다 사람 평가에 가깝다.

**BLEURT**

구글이 발표한 BERT 기반 평가. COMET과 비슷한 철학.

**MQM (Multidimensional Quality Metrics)**

사람 평가의 산업 표준. 오류를 종류별(정확성 · 유창성 · 스타일 · 기술적)로 분류하고 가중치를 둔다. ASTM F2575 표준. 큰 LSP가 거의 표준으로 채택.

**실전 — 어떻게 조합하는가**

- 모델 개발 단계 → BLEU · chrF (빠르고 재현 가능)

- 모델 선택 단계 → COMET (사람 평가에 가깝다)

- 프로덕션 QA → MQM (사람이 직접 평가, 비용 큼)

- 후편집 효율 → TER

LLM이 등장한 후 **LLM을 평가자로 쓰는 패턴**도 늘었다. Claude · GPT에게 두 번역을 보여주고 더 좋은 쪽을 고르게 한다. 빠르고 사람 평가에 가깝지만, 평가자 LLM의 편향이 결과에 들어간다는 단점.

22장 · 도메인 적응 — 법무, 의료, 기술, 마케팅

같은 NMT 모델이라도 도메인에 따라 품질이 크게 달라진다. 도메인 적응의 네 가지 패턴.

**1) 글로사리 / 용어집 (가장 가벼움)**

모든 주요 NMT가 지원. "이 용어는 이렇게 번역해야 한다"는 매핑을 NMT에 넘기면 결과에 반영. DeepL Pro · 구글 Cloud Translation · MS Translator 모두 글로사리 1급 지원.

**2) Custom Translator 모델 (중간)**

Microsoft Custom Translator, Google AutoML Translation, Amazon Active Custom Translation. 사내 코퍼스(병렬 문장 1만쌍 이상)를 업로드해 사내 모델을 만든다. 학습 비용 · 시간이 들지만 일반 NMT보다 도메인 정확성이 분명히 높다.

**3) 적응형 NMT (Lilt · ModernMT)**

번역가의 후편집이 즉시 모델에 피드백되어 세션 안에서 점점 적응. 도메인 적응 비용이 0에 가깝다는 게 장점. 그러나 사람-개입이 필요해 양적 워크로드엔 부적합.

**4) LLM 프롬프트 적응 (가장 유연)**

LLM의 시스템 프롬프트에 도메인 · 톤 · 금지어 · 용어집을 다 넣는다. 별도 학습 없이 즉시 적응. 단점은 비용 · 지연.

**도메인별 추천 조합**

- **법무** — Custom Translator 또는 LLM(높은 정확도 우선)

- **의료** — Custom Translator + 사람 후편집(생명 직결, 페일 세이프)

- **기술 매뉴얼** — DeepL Pro + Phrase TMS + 글로사리(반복 많음, TM이 큰 자산)

- **마케팅** — LLM(톤과 창의성이 결정적)

- **UI · 마이크로카피** — LLM + 사람 후편집(짧지만 정밀)

- **법률 · 정부** — on-prem NMT + 사람(데이터 잔류 + 정확도)

23장 · 가격 · ROI — 100만 단어를 번역할 때 비용 비교

가상의 시나리오 — 영어 100만 단어(약 500만 문자)를 한국어로 번역해야 한다. 옵션별 비용 견적.

**옵션 A — DeepL Pro API**

500만 문자 × 25 USD/백만문자 = **125 USD**. 가장 싸다. 단, 톤 일관성과 도메인 적응은 약함.

**옵션 B — 구글 Cloud Translation**

500만 문자 × 20 USD/백만문자 = **100 USD**. DeepL보다 약간 싸지만 한국어 품질은 한 단계 아래라는 평.

**옵션 C — Claude (LLM)**

입력 약 130만 토큰 · 출력 약 130만 토큰 = 3.25 USD + 19.5 USD ≈ **23 USD**. 매우 싸다(2026년 5월 기준). 톤 · 도메인 적응 가능. 그러나 지연이 크고 일관성 검증이 별도 필요.

**옵션 D — GPT-4o (LLM)**

입력 1.30M × 2.5 USD/M + 출력 1.30M × 10 USD/M ≈ **16 USD**. 더 싸고 빠르다.

**옵션 E — Phrase TMS + DeepL Pro + 사람 후편집**

DeepL 125 USD + Phrase 사용료 + 사람 후편집 5,000~15,000 USD = **5,000~15,000 USD**. 두 자리 수가 비싸지만 품질이 결정적으로 높다.

**옵션 F — Lilt(사람-개입 적응형)**

플랫폼 + 번역가 = **단어당 0.15~0.25 USD** × 100만 = **150,000~250,000 USD**. 가장 비싸지만 가장 정밀.

**결론 — 비용 vs 품질 곡선**

- 일회성 · 내부용 → LLM 직접(20 USD)

- 양적 · 정형 → DeepL Pro · 구글(100~125 USD)

- 정밀 외부 공개 → DeepL + TMS + 사람(5,000~15,000 USD)

- 미션 크리티컬(법무 · 의료 · 브랜드) → Lilt · 전문 LSP(15만 USD+)

**숨은 비용**

도구 선택 비용보다 **TM 마이그레이션, 워크플로 재설계, 번역가 교육**이 사실 더 큰 비용이다. 1년에 한 번 하는 일회성 작업이 아니라 5년 누적 비용으로 보면, 초기에 비싸도 자동화 깊은 도구가 결국 싸지는 경우가 많다.

24장 · 프라이버시 · 데이터 잔류 — GDPR, K-PIPA, on-prem

기업 번역에서 점점 무거워지는 축이 데이터 잔류다.

**GDPR (EU)**

EU 시민 데이터는 EU 안에 머물러야 한다. 미국 클라우드 경유 NMT는 SCC(Standard Contractual Clauses) 또는 Data Privacy Framework로 처리 가능하지만, **개인 식별 정보가 포함된 텍스트**는 추가 검토 필요.

**한국 개인정보보호법 (PIPA)**

2024년 개정으로 해외 이전 규제가 강화. EU와 유사한 표준. 의료 · 금융 도메인은 특히 엄격.

**일본 APPI**

EU와 유사. 일본 시장이 on-prem 옵션을 강하게 선호하는 이유 중 하나.

**옵션별 데이터 잔류**

- **DeepL** — EU 호스팅, 미국 데이터센터 옵션. on-prem(DeepL Enterprise) 가능

- **Microsoft Azure Translator** — 60+ 리전, 데이터 잔류 옵션 강함

- **Google Cloud Translation** — 리전 선택 가능

- **Amazon Translate** — 리전 선택 가능

- **OpenAI · Anthropic · Google AI** — 데이터 잔류 옵션 제한적, 엔터프라이즈 협약 필요

- **사내 NMT(NLLB · OPUS-MT)** — 100% 사내, 데이터 외부 유출 0

- **Argos Translate** — 데스크톱 오프라인, 외부 유출 0

**Enterprise LLM의 자리**

2025년 이후 Anthropic · OpenAI · Google이 엔터프라이즈 협약으로 **고객 데이터를 학습에 쓰지 않음 + 보유 기간 0(zero retention)**을 보장하는 옵션을 정식화. 한국 · 일본 · EU 기업이 LLM을 도입할 수 있는 길이 열렸다.

**현실 — 어떻게 결정하는가**

- 일반 콘텐츠(마케팅 · 블로그) → 클라우드 NMT/LLM 자유롭게

- 개인정보 포함 → on-prem 또는 zero retention 엔터프라이즈 LLM

- 의료 · 금융 · 법무 · 정부 → on-prem NMT 또는 사내 LLM 1순위

- 군 · 정보 → Argos · NLLB 사내 배포

25장 · 의사결정 트리 — 어떤 도구를 어디에

마지막으로 한 장에 정리하는 결정 가이드.

**시나리오 1 — 개인 · 학생**

무료 한도로 끝. Papago · 구글 번역 · DeepL Free + ChatGPT/Claude 무료. 비용 0.

**시나리오 2 — 인디 개발자 · 작은 SaaS의 i18n**

- 도구 → POEditor 또는 Crowdin 무료 플랜

- 엔진 → DeepL Pro Starter(9 USD) 또는 LLM 직접 호출

- 프레임워크 → next-intl / i18next

- 비용 → 월 10~50 USD

**시나리오 3 — 스타트업 · 중간 규모 SaaS**

- 도구 → Crowdin Pro 또는 Phrase Strings

- 엔진 → DeepL Pro + LLM 후편집

- 프레임워크 → next-intl + Phrase Strings 통합

- 비용 → 월 100~500 USD

**시나리오 4 — 엔터프라이즈 · 글로벌 콘텐츠 헤비**

- 도구 → Phrase TMS 또는 Smartling

- 엔진 → DeepL Pro · 구글 · MS + 사람 후편집

- 적응 → 글로사리 + Custom Translator

- 비용 → 연 10만 USD+

**시나리오 5 — 도메인 정밀 (의료 · 법무 · 기술)**

- 도구 → Lilt 또는 사내 TMS

- 엔진 → ModernMT/Lara 또는 Custom Translator

- 사람 → LSP 또는 사내 전문 번역가

- 비용 → 연 수만~수십만 USD

**시나리오 6 — 정부 · 군 · 보안 (on-prem)**

- 도구 → 사내 워크플로

- 엔진 → NLLB / OPUS-MT / Mirai on-prem / DeepL Enterprise on-prem

- LLM → 사내 호스팅 Llama · DeepSeek

- 비용 → 자체 인프라

**시나리오 7 — 실시간 음성 · 통역**

- 일상 → 구글 번역 Conversation, 애플 Live Translation

- 비즈니스 → 갤럭시 Live Translate, Whisper

- 컨퍼런스 · 미팅 → KUDO, Interprefy

- 정부 → AppTek 사내

**원칙**

어느 도구도 모든 자리를 다 잘하지 못한다. **하이브리드가 정답**이다 — NMT가 양을, LLM이 품질을, TMS가 워크플로를, 사람이 마지막을 맡는다.

26장 · 에필로그 — 2026년의 번역가, 2030년의 번역가

마지막으로 사람의 자리에 대해. 2014년 NMT 등장 직후 "번역가가 사라진다"는 패닉이 한 번 왔다. 사라지지 않았다. 2023년 LLM 등장 직후 같은 패닉이 다시 왔다. 사라지지 않을 거다. 그러나 직업의 모양은 분명히 바뀐다.

**2016년의 번역가**

모든 문장을 손으로 적었다. CAT 도구로 메모리를 활용했지만 NMT는 보조였다. 시간당 250~400 단어가 표준.

**2026년의 번역가**

MT가 1차 번역을 끝낸다. 번역가는 **후편집(MTPE, Machine Translation Post-Editing)**을 한다. 시간당 500~1,000 단어로 처리량은 2~3배. 단가는 단어당 30~50% 하락. 결과적으로 시간당 수입은 비슷하거나 약간 늘었다.

**2030년의 번역가 — 예상**

직접 번역하는 시간은 거의 0이 되고, **언어 컨설팅 · 톤 검수 · 도메인 전문성 · 문화 적응**이 주 업무가 된다. 양적 번역 일은 줄어드는 대신, 콘텐츠 양 자체가 폭증해 절대 일자리는 유지된다는 게 LSP 협회의 예상.

**창작 번역(시 · 문학 · 마케팅)**은 여전히 사람의 자리다. AI가 의미는 옮기지만 문화 · 운율 · 함의는 못 옮긴다. 한강 작가의 노벨문학상 수상 때 데보라 스미스의 번역이 핵심이었다는 사실 — 그건 AI가 못한다.

**개발자 입장의 결론**

- 일반 콘텐츠 → 자동화로 비용을 내린다

- 도메인 정밀 → 도구 + 사람 하이브리드

- 문화 · 창작 → 사람에게 위임

- 컴플라이언스 → on-prem

- 한 도구를 신앙으로 삼지 말 것. 6개월마다 풍경이 바뀐다

번역은 이제 단일 모델의 싸움이 아니다. **워크플로의 싸움**이다. 어느 자리에 어떤 도구를 끼우느냐가 품질과 비용 모두를 결정한다. 이 글이 그 결정의 출발점이 되기를.

참고 자료 — 2026년 번역 · 로컬라이제이션 레퍼런스

**기계번역 일반**

- [Google Neural Machine Translation 논문 (2016)](https://arxiv.org/abs/1609.08144)

- [Attention Is All You Need - Transformer 논문 (2017)](https://arxiv.org/abs/1706.03762)

- [No Language Left Behind - NLLB 논문 (Meta, 2022)](https://arxiv.org/abs/2207.04672)

- [MADLAD-400 논문 (Google, 2023)](https://arxiv.org/abs/2309.04662)

**상용 도구 공식**

- [DeepL 공식](https://www.deepl.com/)

- [Google Cloud Translation](https://cloud.google.com/translate)

- [Microsoft Azure AI Translator](https://azure.microsoft.com/en-us/products/ai-services/ai-translator)

- [Amazon Translate](https://aws.amazon.com/translate/)

- [ModernMT](https://www.modernmt.com/)

- [Lilt](https://lilt.com/)

- [Smartling](https://www.smartling.com/)

- [Phrase](https://phrase.com/)

- [Crowdin](https://crowdin.com/)

- [Lokalise](https://lokalise.com/)

- [Transifex](https://www.transifex.com/)

**오픈소스 NMT**

- [Hugging Face NLLB-200](https://huggingface.co/facebook/nllb-200-distilled-600M)

- [Helsinki-NLP OPUS-MT](https://huggingface.co/Helsinki-NLP)

- [Argos Translate](https://www.argosopentech.com/)

**LLM 번역 가이드**

- [OpenAI Translation Best Practices](https://platform.openai.com/docs/guides/prompt-engineering)

- [Anthropic Claude Translation](https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering)

- [Google Gemini Multilingual](https://ai.google.dev/gemini-api/docs/models)

**i18n 프레임워크**

- [i18next 공식 문서](https://www.i18next.com/)

- [FormatJS / react-intl](https://formatjs.io/)

- [next-intl](https://next-intl-docs.vercel.app/)

- [ICU MessageFormat](https://unicode-org.github.io/icu/userguide/format_parse/messages/)

**표준 포맷**

- [TMX 표준 (LISA)](https://www.gala-global.org/lisa-oscar-standards)

- [XLIFF OASIS 표준](https://www.oasis-open.org/committees/xliff/)

- [TBX ISO 30042](https://www.iso.org/standard/62510.html)

**품질 평가 메트릭**

- [COMET 메트릭](https://github.com/Unbabel/COMET)

- [BLEU 원논문 (Papineni et al., 2002)](https://aclanthology.org/P02-1040/)

- [MQM 가이드라인](https://themqm.org/)

**산업 동향**

- [GALA - Globalization and Localization Association](https://www.gala-global.org/)

- [TAUS Industry Reports](https://www.taus.net/)

- [Slator Language Industry News](https://slator.com/)