- Published on
AI 모션 캡처 & 애니메이션 2026 완벽 가이드 - Move.AI · Cascadeur · DeepMotion · Wonder Dynamics · Rokoko AI · Plask · AnimateDiff · Runway Act-One 심층 분석
- Authors

- Name
- Youngju Kim
- @fjvbn20031
프롤로그 — 2026년, 모캡 스튜디오가 사라졌다
2020년대 초반까지 모션 캡처의 기본은 "큰 방, 비싼 카메라, 슈트, 마커, 정확한 캘리브레이션"이었다. Vicon 카메라 24대로 둘러싼 스테이지, Xsens 슈트, 후처리 며칠. 영화·게임·VR 회사들은 그 비용을 감수했고, 인디 개발자들은 모캡을 거의 포기했다.
2026년에는 그 그림이 두 갈래로 갈라졌다.
- 하이엔드 스테이지: Vicon · OptiTrack · Xsens가 여전히 영화·AAA 게임에서 표준이다. 정확도가 1mm 단위로 필요할 때, 다중 캐릭터를 동시에 잡을 때.
- AI 마커리스: Move.AI · Plask · DeepMotion · RADiCAL · Rokoko Vision이 영상 한 편에서 풀바디 모션을 뽑아낸다. 스튜디오도 슈트도 없이.
그 사이에 AI 보조 애니메이션 도구들이 들어왔다. Cascadeur는 물리 기반으로 포즈를 자동 보간하고, Wonder Dynamics는 영상 속 사람을 CG 캐릭터로 바꾸고, Runway Act-One은 표정 한 컷에서 캐릭터 연기를 만든다.
이 글은 2026년의 AI 모션 캡처와 애니메이션 스택을 처음부터 끝까지 정리한다. 마커리스 모캡 · 페이셜 캡처 · 립싱크 · 아바타 생성 · 그리고 모캡을 LLM·TTS와 묶는 흐름까지.
1장 · 모캡의 전체 지형 — 어떤 도구가 어디에 끼는가
도구를 보기 전에, "모션 캡처"라는 단어가 2026년에는 최소한 네 갈래로 갈라진다.
[모션 캡처 분류]
|
+-- 마커 기반 (Optical)
| Vicon, OptiTrack, Qualisys, ART
|
+-- IMU 슈트 (Inertial)
| Xsens MVN, Rokoko Smartsuit Pro II, Perception Neuron
|
+-- 마커리스 영상 (Vision-based AI)
| Move.AI, Plask, DeepMotion, RADiCAL, Rokoko Vision
|
+-- 페이셜 캡처
ARKit Face Tracking, Live Link Face, Faceware,
MetaHuman Animator, Cubic Motion
각 갈래는 정확도 · 비용 · 셋업 시간 · 캡처 환경 제약이 모두 다르다. 영화 VFX는 보통 두세 개를 섞는다. Vicon으로 몸을 잡고, Faceware로 얼굴을 잡고, 후처리에서 합친다. 인디는 한 개만 쓴다 — iPhone 한 대로 다.
기억할 한 줄: "마커리스가 정확도에서 마커 기반을 따라잡고 있다. 다만 다중 캐릭터·가림에서는 아직 못 이긴다."
2장 · Move.AI — 마커리스 모캡의 영국발 표준
영국 런던에 본사를 둔 Move AI는 2020년 창업, 2024년에 시리즈 A로 약 1,250만 달러를 모았다. 2026년 기준 마커리스 모캡의 사실상 표준 — 영화 · AAA 게임 · 스포츠 분석 · 헬스케어까지 들어간다.
Move.AI의 핵심은 "1~8대의 일반 카메라(iPhone 포함)로 풀바디 + 손 + 얼굴을 캡처"한다는 것이다. 마커도 슈트도 없다. iPhone 두 대만 있어도 작동한다.
2026년 기능:
- Move One (소비자) — iPhone 한 대로 풀바디 모캡.
- Move Pro (스튜디오) — 4~8대 카메라, 다중 캐릭터, 손가락 캡처.
- Move Live — 실시간 스트리밍 모캡 (VTuber · 라이브 공연).
- Output 포맷 —
FBX,BVH,USD,glTF, Maya · Blender · Unreal · Unity 호환.
기본 워크플로(개념):
1. iPhone 1~2대로 영상 촬영 (15~60초)
2. Move.AI 앱에 업로드
3. 클라우드에서 추론 (보통 5~15분)
4. FBX 또는 BVH로 다운로드
5. Blender · Maya · Unreal로 임포트해 캐릭터에 리타게팅
가격(2026년): Move One은 월 15달러, Move Pro는 분당 또는 프로젝트 단위. 사용 사례:
- Apple Studios Final Cut으로 만든 단편에서 사용
- Sony PlayStation 일부 인디 타이틀의 컷신
- NBA · NFL — 선수 동작 분석
대안 — Move.AI를 못 쓸 때:
- 다중 인물 동시 캡처(8명 이상) → Vicon Shōgun
- 손가락 마이크로 모션 → StretchSense Glove
- 1mm 단위 정확도가 필요한 의료 · 바이오메카닉스 → Qualisys
3장 · Plask Motion — 한국발 브라우저 모캡
한국 스타트업 Plask는 2020년 창업, 브라우저 기반 마커리스 모캡으로 시작해서 2026년에는 풀스택 AI 애니메이션 도구가 됐다.
특징:
- 브라우저에서 바로 작동 — 설치 없이 영상 업로드만 하면 모캡이 나온다.
- 무료 티어 — 월 60초까지 무료, 학생·인디에 친화적.
FBX,BVH,glTFexport.- AI Retargeting — 캡처한 모션을 다른 캐릭터 리그에 자동 적용.
- 모션 라이브러리 — 미리 잡힌 모션 클립 수천 개.
Plask는 Move.AI보다 정확도는 약간 낮지만, 가격과 접근성에서 압도적이다. 한국 인디 게임 스튜디오 · VTuber · 1인 애니메이터들이 많이 쓴다. 2026년에 NCsoft · Smilegate 같은 한국 대형 게임사도 일부 프로토타이핑 단계에서 Plask를 쓴다고 알려졌다.
4장 · DeepMotion Animate 3D — 비디오에서 3D 캐릭터로
DeepMotion(미국, 캘리포니아)의 Animate 3D는 비디오 한 편을 업로드하면 3D 캐릭터 애니메이션(FBX · BVH · glTF)을 뽑아주는 SaaS다. 2017년부터 개발, 2026년에는 7세대 모델까지 왔다.
핵심 차이점은 물리 기반 시뮬레이션을 결합한 모션 정제다. 단순히 키프레임을 뽑는 게 아니라, 발이 땅을 뚫지 않게 · 손이 객체와 충돌하지 않게 · 중력에 맞게 — 후처리를 자동으로 한다.
DeepMotion 워크플로:
- 비디오 업로드 (최대 60초 / 무료, 더 길면 유료)
- AI 모델이 풀바디 추적
- 물리 시뮬레이션으로 정제
- FBX · BVH · glTF로 export
- Unreal · Unity · Blender · Maya로 import
가격은 분당 크레딧 모델. 인디 게임 개발자들에게 인기.
5장 · RADiCAL — 단일 카메라 마커리스
RADiCAL(뉴욕)은 "단일 카메라 한 대"로 풀바디 3D 모캡을 한다. iPhone 한 대 · 웹캠 · 액션캠 어떤 것이든 OK다.
2026년 RADiCAL 4의 특징:
- 모바일 앱으로 그 자리에서 캡처 → 클라우드에서 처리
- 실시간 미리보기
- AI 보조 손 트래킹 — 손가락도 (베타)
- VR 호환 — Quest 3와 연동해서 VR 안에서 캐릭터 컨트롤
RADiCAL은 Move.AI와 직접 경쟁한다. 1대 카메라 사용 사례에서 두 회사가 양강이다.
6장 · Rokoko — 슈트와 Vision의 양손잡이
덴마크 Rokoko는 IMU 슈트(Smartsuit Pro II)와 마커리스 비전(Rokoko Vision) 둘 다 한다. 슈트는 약 2,500달러부터 시작 — Xsens MVN보다 5~10배 싸고 정확도도 충분하다.
2026년 Rokoko 라인업:
- Smartsuit Pro II — 19개 IMU 센서, 무선, 풀바디
- Smartgloves — 손가락 16개 센서
- Coil Pro — 자기장 베이스, 드리프트 보정 (실내에서 GPS 같은 역할)
- Face Capture — iPhone Live Link 통합
- Rokoko Vision — 무료 마커리스 비전 모캡 (2~3대 카메라)
- Studio — 통합 소프트웨어 (모션 클린업, 리타게팅, FBX export)
Coil Pro는 2025년에 나왔는데, IMU 모캡의 가장 큰 약점인 드리프트(시간이 지나면 위치가 어긋남) 를 자기장 베이스 스테이션으로 잡는다. 한 시간 잡아도 위치 오차가 거의 없다.
인디 게임 · 인디 영화 · YouTube 크리에이터에게 사실상 표준. Rokoko는 가격대비 정확도가 가장 좋다.
7장 · 마커 기반 모캡 — Vicon · OptiTrack · Xsens
여전히 영화 · AAA 게임 · 의료에서는 마커 기반이 표준이다. 정확도가 1mm 단위로 필요하거나, 다중 캐릭터를 동시에 잡을 때.
Vicon(영국) — 광학 마커리스의 절대 강자. Shōgun 소프트웨어, Vantage · Vero · Valkyrie 카메라. 영화 VFX 스튜디오 90% 이상이 Vicon. 한 스테이지 구축에 수십만~수억 원.
OptiTrack(미국) — 더 저렴한 옵션. Motive 소프트웨어. 인디 스튜디오 · 대학 · R&D 랩에서 인기. PrimeX 카메라.
Xsens MVN(네덜란드, Movella 자회사) — IMU 슈트의 원조. Xsens MVN Animate / Analyze. 실외 · 야외 · 액션 신에 강하다.
Perception Neuron — Noitom(중국)의 IMU 슈트. 가성비 최고. 입문용으로 좋다.
2026년 트렌드: 마커 기반과 AI 마커리스를 섞어 쓴다. Vicon으로 베이스를 잡고, Move.AI로 추가 앵글 · 군중 신을 메우는 식.
8장 · Wonder Dynamics — 영상 속 사람을 CG로 (Autodesk 인수)
Wonder Dynamics는 2017년 LA에서 창업, 영상 속 실제 배우를 자동으로 CG 캐릭터로 교체하는 SaaS를 만들었다. 2024년 Autodesk가 인수.
Wonder Studio의 핵심:
- 영상 한 편 업로드
- 사람을 자동 추적
- 클릭 한 번에 CG 캐릭터로 교체
- 카메라 트래킹 · 라이팅 매칭 · 그림자까지 자동
2025~26년 기능:
- 클라우드 렌더링 — 자동으로 라이팅 매칭, 합성
- Maya · Blender · Unreal export — CG 캐릭터 + 모캡 + 카메라 데이터를 그대로 가져온다
- Live Action Advanced — 영화 품질 출력
- AI Motion Capture — 영상에서 모캡만 추출 (캐릭터 교체 없이)
2024년에 Autodesk가 인수하면서, Maya · 3ds Max에 점진적으로 통합되고 있다. 인디 영화 · YouTube · TikTok 크리에이터에게 게임 체인저.
9장 · Cascadeur — 물리 기반 AI 애니메이션
Cascadeur(Banzai Games, 러시아 → 키프로스로 본사 이전)는 키프레임 애니메이션 소프트웨어인데, AI가 물리 기반 포즈를 자동으로 보간해 준다.
핵심 아이디어: 애니메이터가 메인 키프레임 두세 개만 잡으면, AI가 중간 프레임을 인체 물리에 맞게 자동으로 채운다. "공을 던지는 동작"의 시작과 끝 포즈만 그리면, 나머지는 AI가 한다.
2026년 Cascadeur 2026.1 기능:
- AutoPosing — 한 손가락을 움직이면 전신이 자연스럽게 따라온다
- Physics-based interpolation — 중력, 관성, 무게중심을 고려한 보간
- Quick Rigging — 인간 캐릭터에 자동 리깅
- AnimationCopilot — AI가 모션을 제안 (베타)
- Blender · Maya · Unreal export —
FBX정식 지원
가격: 인디는 무료, Pro는 월 17달러. AAA 게임 스튜디오들도 점점 도입한다. 격투 게임 · 액션 게임의 보조 도구로 강력하다.
10장 · Reallusion iClone — 1인 영화의 만능 도구
Reallusion(대만)의 iClone 8 + Character Creator 4는 1인 영화 · YouTube 애니메이션의 표준이다. 캐릭터 생성 · 리깅 · 애니메이션 · 페이셜 캡처 · 렌더링을 한 도구에서 다 한다.
2026년 iClone Motion AI 기능:
- Motion Director — 텍스트 한 줄로 모션 생성
- AccuFACE — 웹캠으로 페이셜 캡처
- AccuLIPS — 오디오에서 립싱크 자동 생성
- MetaHuman Live Link — Unreal MetaHuman과 직접 연동
- Blender Pipeline — Blender로 export · import 양방향
iClone은 "코딩 없이 1인이 풀스택 3D 애니메이션을 만들 수 있는" 가장 빠른 길이다. 단점은 캐릭터가 비슷한 룩을 가진다는 것 — 익숙해 보인다.
11장 · CMU Mocap & AMASS — 학술 데이터셋
연구 · 교육 · ML 학습용으로는 공개 데이터셋이 표준이다.
CMU Mocap Database — 카네기 멜런 대학이 2003~2007년에 잡은 약 2,605개 클립. BVH · ASF/AMC 포맷. 무료. 사실상 모든 모캡 ML 논문의 베이스라인.
AMASS(Archive of Motion Capture as Surface Shapes) — 다양한 데이터셋(CMU · HumanEva · KIT)을 SMPL 메시 포맷으로 통합. Max Planck Institute. 2019년 공개.
BABEL — AMASS에 자연어 라벨을 붙인 데이터셋. Text-to-Motion 학습용.
이런 데이터셋이 없었다면 Move.AI · Plask · DeepMotion 같은 도구도 못 나왔을 것이다.
12장 · AnimateDiff & MotionDirector — 디퓨전 기반 애니메이션
이미지 생성 AI(Stable Diffusion · SDXL)는 정지 이미지였다. 2023년부터 AnimateDiff · MotionDirector 같은 오픈소스 프로젝트가 이 모델 위에 "모션 모듈"을 얹어서, 텍스트 한 줄로 짧은 비디오 클립을 만든다.
AnimateDiff — 2023년 상하이 AI Lab 공개. Stable Diffusion에 시간 차원을 추가한 LoRA. ComfyUI · Automatic1111에서 돌아간다. 16프레임 클립이 표준.
MotionDirector — Show Lab(싱가포르 국립대) 2023. 특정 모션 패턴을 학습해서 재사용.
Tora(Alibaba 2024) — 궤적 기반 비디오 생성. 사용자가 그린 경로를 따라 객체가 움직인다.
이런 도구는 "실제 모션 데이터를 추출하지 않는다" — 픽셀을 직접 생성한다. 따라서 3D 모델에 적용하기 어렵다. 다만 컨셉 시각화 · 스토리보드 · 짧은 광고에는 충분하다.
13장 · 텍스트-투-모션 연구 (T2M-GPT · MoMask · MotionLLM)
학술 영역에서는 텍스트에서 3D 모션 시퀀스를 직접 생성하는 모델이 빠르게 발전 중이다.
T2M-GPT(2023) — GPT 아키텍처를 SMPL 모션에 적용. "사람이 걸어가다가 점프한다" 같은 문장에서 BVH가 나온다.
MoMask(2024) — Mask transformer로 모션 생성. 더 자연스럽고 일관된 결과.
MotionLLM(2024) — LLM이 모션을 이해하고 생성. 대화형으로 "더 빠르게 걸어" 같은 수정이 가능.
MotionGPT, MDM(Motion Diffusion Model) — 디퓨전 기반 모션 생성.
이 연구들은 아직 SaaS 제품으로는 안 나왔다. 다만 Move.AI · Plask 같은 회사들이 차세대 기능으로 준비 중이다.
14장 · Runway Act-One — 표정에서 캐릭터 연기로
Runway(뉴욕)의 Act-One은 2024년 10월에 공개됐다. 입력은 "배우가 카메라 앞에서 연기하는 영상 + 캐릭터 이미지", 출력은 "그 캐릭터가 배우의 표정 · 입 모양 · 머리 움직임을 그대로 따라하는 영상".
기존 페이셜 모캡과 다른 점:
- 별도 하드웨어 없음 — 웹캠 한 대로 충분
- 머신러닝 기반 — 표정의 미묘한 뉘앙스 보존
- 짧은 클립(10~30초)에 최적화
Runway Act-One은 영화 VFX 수준의 페이셜 캡처를 인디 크리에이터에게 열어줬다. 2026년에는 풀바디까지 확장됐다(Act-Two 베타).
15장 · 페이셜 캡처 — ARKit · MetaHuman Animator · Faceware
페이셜 캡처는 모캡과 별도 카테고리로 본다. 정확도 요구가 다르고, 캡처 환경도 다르다.
Apple ARKit Face Tracking — iPhone 12 이후 모든 기기에 내장. 52개 블렌드셰이프(ARKit Blend Shapes). Live Link Face 앱으로 Unreal에 실시간 스트리밍 가능. 무료.
Live Link Face(Epic Games) — iPhone에서 Unreal MetaHuman으로 페이셜 모캡을 실시간 전송. ARKit 기반. 무료.
MetaHuman Animator(Epic 2023) — Unreal Engine 안에서 페이셜 캡처를 정제. iPhone에서 잡은 데이터를 MetaHuman 캐릭터의 미세 표정까지 정확히 옮긴다.
Faceware Studio — 1996년부터 영화 VFX에서 쓰인 페이셜 캡처 표준. 헬멧 카메라 · 마커 · 머신러닝 다 지원.
Cubic Motion(Epic 인수) — 게임 · 영화의 페이셜 애니메이션. Unreal에 통합.
iPhone + Live Link Face + MetaHuman Animator 조합이 2026년의 인디 표준이다. 영화 수준 페이셜 캡처가 사실상 무료가 됐다.
16장 · AI 립싱크 — Wav2Lip · MuseTalk · SadTalker · EMO
립싱크는 페이셜 캡처의 부분 집합인데, 별도 도구가 풍부하다. 오디오에서 입 모양만 생성한다.
Wav2Lip(2020) — 인도 IIIT-Hyderabad. 오디오에서 입술 동기화. 오픈소스, 가장 많이 쓰인다.
SadTalker(2023) — 정지 이미지 + 오디오 → 말하는 영상.
MuseTalk(Tencent 2024) — 실시간 립싱크, 더 자연스러운 입 모양.
EMO(Alibaba 2024) — Emote Portrait Alive. 단순한 입싱크가 아니라 감정 · 머리 움직임 · 표정 변화까지. 사진 한 장과 음성으로 영화 같은 영상이 나온다.
Hedra(2024) — Character-1, Character-2 모델. 캐릭터 + 음성으로 풀바디 + 페이셜 애니메이션. SaaS.
이런 도구들이 등장하면서 VTuber · 가상 인플루언서 · AI 더빙 시장이 폭발했다.
17장 · 아바타 생성 — Ready Player Me · ZEPETO · VRoid
모캡을 입힐 캐릭터가 필요하다. 2026년에는 캐릭터 생성도 거의 다 자동화됐다.
Ready Player Me(에스토니아) — 셀카 한 장에서 3D 아바타 생성. 9,000개 이상 앱과 연동. VR · 메타버스 · 게임의 사실상 표준. glTF export.
ZEPETO(한국, NAVER Z) — Z세대용 아바타 메타버스. 동남아 · 한국 · 일본에서 4억 사용자. 아바타가 귀엽고, 패션 아이템 시장이 크다.
VRoid Studio(일본, Pixiv) — 애니메 스타일 캐릭터 생성. 무료. VRM 포맷 표준. VTuber의 표준 도구다.
Wolf3D — Ready Player Me의 모기업.
Meta Codec Avatars — Meta Reality Labs의 연구 프로젝트. 사진 사실주의 수준 아바타. 아직 연구 단계지만 Quest 3 페르소나로 일부 상용화.
Apple Vision Pro Persona — Vision Pro로 얼굴을 스캔하면 페이스타임에서 본인 닮은 아바타. 2024년 출시 후 점진적으로 개선.
18장 · 모캡 + LLM = NVIDIA Audio2Face & ACE
NVIDIA가 2026년에 가장 공격적으로 미는 분야가 "AI 캐릭터" — 모캡 · 음성 · LLM을 하나로 묶는다.
Audio2Face — 오디오에서 페이셜 애니메이션 자동 생성. 무료, Omniverse에 통합. 한국어 · 일본어 · 영어 다 지원.
Riva — 음성 인식 + TTS. 다국어.
ACE(Avatar Cloud Engine) — Audio2Face + Riva + LLM + 렌더링을 통합. 게임 NPC가 실시간 대화 가능. 2024년 GDC에서 발표, 2026년에 본격 출시.
NeMo — LLM 학습 프레임워크. 게임 NPC 페르소나 학습용.
이 스택 위에 만든 데모(예: Convai)들이 "진짜 살아있는 NPC"를 보여줬다. 2026년에는 한두 게임에서 실제로 출시된다.
19장 · 3D 엔진과의 연동 — Blender · Maya · Unreal · Unity
캡처한 모션을 어디에 쓰는가. 다섯 개 엔진이 사실상 표준이다.
Blender + Auto-Rig Pro / Rigify — Auto-Rig Pro는 자동 리깅 · 리타게팅 애드온. FBX · BVH import가 표준. Rokoko Studio Live · Plask · Move.AI 다 Blender 익스포트 지원.
Maya + HumanIK — 영화 VFX의 표준 리깅 시스템. HumanIK이 모캡 리타게팅의 기준. Vicon · OptiTrack 다 Maya를 1급 시민으로 지원.
Cinema 4D + Cinemachine — 모션 그래픽에 강함. Mixamo 통합.
Unreal Engine 5 + ControlRig — MetaHuman + Live Link + Control Rig 조합으로 실시간 모캡 · 리타게팅. 2026년 게임 · 가상 프로덕션의 표준.
Unity + Animation Rigging — Mecanim Humanoid가 모캡의 표준 받침대. Unity Muse가 텍스트로 모션 생성(2026 베타).
FBX가 여전히 모캡 교환의 표준 포맷. USD가 점점 추가된다. glTF는 웹 · 메타버스용.
20장 · 산업별 사용 사례 — 영화 · 게임 · VTuber · 스포츠
영화 · TV VFX — Move.AI + Wonder Dynamics + Vicon. 헤로 캐릭터는 Vicon으로, 단역 · 군중은 Move.AI로. 후처리에서 Maya · Houdini · Nuke.
AAA 게임 — Vicon · OptiTrack + Xsens. 한 게임당 모캡 클립 수천 개. Final Fantasy(Square Enix), Resident Evil(Capcom), God of War(Sony Santa Monica), Cyberpunk 2077(CD Projekt Red) 다 Vicon 기반.
인디 게임 — Plask · Rokoko · Cascadeur. 한국 인디 게임 신에서 특히 활발.
VTuber · 버추얼 인플루언서 — VRoid + iPhone Live Link + VSeeFace · NeosVR · VRChat. Hedra · ZEPETO도 신규 유입 많다.
스포츠 분석 — Move.AI가 NBA · NFL · 프리미어리그에 들어갔다. 선수 동작을 영상에서 추출 → 부상 예방 · 폼 분석.
의료 · 재활 — Vicon · Qualisys + 마커. 보행 분석 · 재활 모니터링.
AR · VR — Apple Vision Pro Persona, Meta Codec Avatars(Quest 3). 실시간 페이셜 캡처.
21장 · 한국 모션 캡처 산업 — NCsoft · Smilegate · Krafton
한국 게임 · 애니메이션 업계의 모캡 현장.
NCsoft NCROBOT — NCsoft 자체 모캡 스튜디오. 리니지 · 블레이드앤소울 · 쓰론앤리버티의 캐릭터 액션이 여기서 나온다. Vicon · Xsens 보유.
Smilegate — 로스트 아크 · 크로스파이어 · 에픽세븐의 시네마틱. 사내 VFX 팀.
Krafton (PUBG) — 인생 게임 PUBG의 모캡 · 페이셜 캡처. 외부 스튜디오 + 사내 결합.
DigitalDoongi, Anipen — 한국 애니메이션 · 어린이 콘텐츠 스튜디오. 자체 모캡.
Studio Mir, Studio Dragon — 한국 OTT 드라마 · 애니메이션. Move.AI 같은 AI 도구 도입 가속.
한국은 게임 · K-pop 뮤직비디오 · 웹툰 IP 영상화로 모캡 수요가 폭발 중이다. 2026년 인디 신은 Plask · Move.AI · Rokoko 중심.
22장 · 일본 모션 캡처 산업 — Square Enix · Capcom · Bandai Namco
일본은 게임과 애니메이션 둘 다 큰 시장.
Square Enix — Final Fantasy 16 · Forspoken · Visions of Mana. Vicon 기반 사내 스튜디오.
Capcom — Resident Evil 4 Remake · Dragon's Dogma 2 · Monster Hunter Wilds. RE Engine 내부에 모캡 도구 통합.
Bandai Namco — 철권 · 엘든 링 · 건담 게임. 격투 게임 모캡에서 세계 톱.
Polygon Pictures, Sublimation, OLM, Production I.G — 3D 애니메이션 스튜디오. Vicon · Xsens · Plask 다 사용.
MakingBox, Frontale — 도쿄의 모캡 전문 스튜디오. 외주 받는다.
일본은 페이셜 캡처 · 립싱크가 특히 발달했다. 애니메 캐릭터의 미세 표정을 잡으려면 MetaHuman Animator · Faceware 수준이 필요하다.
23장 · 하드웨어 셋업 — iPhone부터 Vicon 스테이지까지
1인 인디 — iPhone 한 대
- iPhone 15 Pro / 16 Pro + Move.AI 앱 + Live Link Face
- 비용: 약 150만 원
- 처리: 클라우드, 5~15분
- 결과물: 풀바디 모캡 + 페이셜 캡처
소규모 스튜디오 — 1,000만 원 셋업
- Rokoko Smartsuit Pro II + Smartgloves: 약 500만 원
- iPhone × 2(Live Link Face): 약 300만 원
- PC(GPU) + Blender + Unreal: 약 200만 원
- 결과물: 영화/게임 수준 모캡
중급 — 5,000만 원 셋업
- OptiTrack PrimeX 13 × 8대: 약 4,000만 원
- 소프트웨어 Motive: 약 500만 원
- Faceware: 약 500만 원
- 결과물: 다중 캐릭터, 1mm 정확도
하이엔드 — 수억 원 스테이지
- Vicon Vantage 16 카메라 × 24대
- Shōgun Live + Post
- 헬멧 카메라(Faceware)
- 결과물: AAA 게임 · 할리우드 영화 표준
2026년 트렌드: 1,000만 원 셋업이면 충분히 인디 게임 · 단편 영화를 만들 수 있다. 마커리스 AI 덕분이다.
24장 · 워크플로 비교 — 예전 vs 2026년
같은 5분짜리 단편 영화를 만든다고 가정.
2018년 워크플로(스튜디오):
- 모캡 스테이지 대관(하루 200만 원)
- 슈트 입고 마커 부착(2시간)
- 캘리브레이션(1시간)
- 촬영(3시간)
- Vicon Shōgun으로 후처리(2일)
- Maya로 리타게팅(3일)
- 페이셜 캡처 별도 세션(이틀)
- 합쳐서 약 2주, 3,000만 원
2026년 워크플로(1인):
- iPhone 15 Pro로 본인이 연기(30분)
- Move.AI 앱에 업로드(5분)
- 클라우드 처리 대기(15분)
- FBX 다운로드 → Blender import(10분)
- 페이셜은 Live Link Face로 별도 캡처(20분)
- Auto-Rig Pro로 리타게팅(30분)
- 합쳐서 약 2시간, 월 15달러
이 격차가 2026년 인디 영화 · 1인 애니메이션 폭발의 이유다.
25장 · AI 모캡의 한계와 함정
마지막으로, 마케팅에서 안 보여주는 부분.
가림(Occlusion) — 옷이 두꺼우면, 다른 캐릭터에 가려지면, 마커리스 모캡 정확도가 급격히 떨어진다. 격투 신 · 댄스 듀엣은 여전히 마커 기반이 안전하다.
손가락 — 마커리스에서 손가락 디테일이 가장 약하다. Move.AI · DeepMotion이 손가락 트래킹을 키워가지만, StretchSense Glove 같은 전용 글러브가 더 정확하다.
빠른 모션 — 격투 · 체조 · 스포츠의 30Hz 이상 모션은 영상 프레임 레이트에 한계. 고프레임 카메라 필요.
다중 인물 — Move.AI Pro도 8명이 한계. 군중 신은 여전히 다중 마커 기반이 필요.
라이팅 — 영상 품질이 나쁘면(어둡거나, 역광이거나) 정확도가 떨어진다.
드리프트 — IMU는 시간이 지나면 위치가 어긋난다. Rokoko Coil Pro로 보정하거나, 자주 캘리브레이션 필요.
환각 — AI 모캡이 가끔 "있지도 않은 동작"을 만든다. 후처리 검수 필수.
기억할 한 줄: "AI 모캡은 인디·중소를 풀었다. 다만 영화 · AAA에서 마커 기반을 완전히 대체하진 않는다 — 2026년에도."
26장 · 에필로그 — 모션 캡처의 민주화
2026년에 한 가지 사실이 확실하다. 모션 캡처가 더 이상 진입 장벽이 아니다. iPhone 한 대와 월 15달러면 누구나 모캡을 한다. 1인 영화 · 인디 게임 · VTuber · YouTube 애니메이션이 폭발한 이유다.
남은 질문은 도구가 아니라 무엇을 캡처하느냐, 어떤 이야기를 하느냐다. 도구가 평등해진 만큼, 콘텐츠 · 연기 · 연출의 차이가 더 크게 보인다.
마커가 사라진 자리에, 이야기가 들어선다.
참고 자료
- Move AI: https://www.move.ai/
- Plask Motion: https://plask.ai/
- DeepMotion Animate 3D: https://www.deepmotion.com/
- RADiCAL Motion: https://www.radicalmotion.com/
- Rokoko Smartsuit Pro II & Vision: https://www.rokoko.com/
- Vicon: https://www.vicon.com/
- OptiTrack: https://optitrack.com/
- Xsens MVN (Movella): https://www.movella.com/products/xsens
- Wonder Dynamics (Autodesk): https://wonderdynamics.com/
- Cascadeur: https://cascadeur.com/
- Reallusion iClone: https://www.reallusion.com/iclone/
- CMU Mocap Database: http://mocap.cs.cmu.edu/
- AMASS Dataset: https://amass.is.tue.mpg.de/
- AnimateDiff: https://github.com/guoyww/AnimateDiff
- Runway Act-One: https://runwayml.com/research/introducing-act-one
- MetaHuman Animator (Epic): https://www.unrealengine.com/en-US/metahuman
- Faceware Studio: https://facewaretech.com/
- Apple ARKit Face Tracking: https://developer.apple.com/documentation/arkit/content_anchors/tracking_and_visualizing_faces
- Live Link Face (Epic): https://apps.apple.com/us/app/live-link-face/id1495370836
- NVIDIA Audio2Face / ACE: https://www.nvidia.com/en-us/ai-data-science/audio2face/
- Hedra Character: https://www.hedra.com/
- Ready Player Me: https://readyplayer.me/
- VRoid Studio: https://vroid.com/en/studio
- ZEPETO: https://zepeto.me/
- Wav2Lip: https://github.com/Rudrabha/Wav2Lip
- EMO (Alibaba): https://humanaigc.github.io/emote-portrait-alive/