- Published on
AI 이미지 업스케일링 & 복원 2026 완벽 가이드 - Topaz Photo AI · SUPIR · GFPGAN · Real-ESRGAN · CodeFormer · Magnific · Krea Upscaler 심층 분석
- Authors

- Name
- Youngju Kim
- @fjvbn20031
프롤로그 — 작은 사진을 크게, 흐린 사진을 또렷하게
옛날 가족 앨범의 800x600 사진을 4K TV에 띄우려 했더니 픽셀이 깨져 보였던 경험, 한 번쯤은 있을 것이다. e커머스 셀러는 1024px 제품 사진을 인쇄용 4000px로 키우고 싶어 한다. 영상 편집자는 90년대 SD 영상을 4K로 마스터링하고 싶어 한다.
전통적인 bicubic·Lanczos 보간은 정보를 새로 만들지 않는다 — 그저 있는 픽셀을 부드럽게 늘릴 뿐이다. AI 업스케일러는 다르다. 수백만 장의 고해상도/저해상도 쌍을 학습한 신경망이 그럴듯한 디테일을 합성한다.
2026년 현재 이 분야는 폭발적으로 성장했다 — 상업용 Topaz Photo AI v3·Magnific·Krea가 한쪽에, 오픈소스 Real-ESRGAN·SUPIR·CodeFormer가 다른 쪽에 있고, 그 사이를 ComfyUI 워크플로우가 잇는다.
이 글은 그 전체 지형을 한 번에 정리한다.
1장 · 왜 이미지 업스케일링이 중요한가
업스케일링이 필요한 시나리오:
- 오래된 가족 사진 — 1990년대 디지털 카메라(VGA, 0.3MP)나 스캔된 필름의 노이즈와 흐릿함을 복원
- 저해상도 입력 — 모바일 스크린샷, 웹에서 다운받은 작은 썸네일, 옛 게임 캡처
- 인쇄 스케일링 — A4 인쇄에는 300dpi 기준 약 2480x3508px가 필요한데, 원본이 그보다 작을 때
- 영상 스틸 추출 — 1080p 영상에서 캡처한 프레임을 포스터로 활용
- e커머스/부동산 — 상품 썸네일을 메인 배너 크기로 확대
- 만화/일러스트 리마스터 — 90~2000년대 저해상도 일러스트레이션을 4K 디스플레이용으로
핵심은 단순한 확대가 아니다. 노이즈 제거, 압축 아티팩트 복원, 색 보정, 얼굴 디테일 강화까지 한 파이프라인으로 처리하는 것이 2026년 표준이다.
2장 · 상업용 AI 업스케일러
Topaz Photo AI v3
Topaz Labs의 통합 제품. 과거 별도 제품이었던 Gigapixel(업스케일), Sharpen(샤프닝), DeNoise(노이즈 제거)를 하나의 UI로 합쳤다.
- 가격: 약 199달러 일회성 (영구 라이선스 + 1년 업데이트)
- 모델: High Fidelity, Standard, Low Resolution, CGI, Lines, Art & CG, Recover 등 케이스별 모델 다수
- 장점: GUI가 깔끔하고 배치 처리·로컬 GPU 가속·Photoshop 플러그인 지원
- 단점: 디퓨전 기반 SUPIR보다 디테일 합성이 보수적 — 인물 사진에서 종종 "AI 같음" 느낌
Topaz Gigapixel 8
업스케일 전용 스탠드얼론. 2024~2025년 사이 8.x 버전대로 올라오면서 Recovery v2, Redefine 같은 디퓨전 강화 모드가 추가됐다.
- Recovery 모드 — 매우 낮은 해상도에서도 얼굴/텍스트 복원
- Redefine — 디퓨전 기반의 "재상상" 모드, 창의적 자유도 높음
Magnific
2024년 등장 이후 SNS에서 폭발한 디퓨전 기반 상업 업스케일러. "이미지를 단지 키우는 게 아니라 재해석한다"는 포지셔닝.
- Magnific Sharpen (2024) — 샤프닝 전용
- 창의성 슬라이더가 핵심 — 0이면 보수적, 10이면 완전 새 디테일을 그려넣음
- HDR·Resemblance 같은 파라미터로 톤·원본 충실도 조절
- 가격은 월 구독제(Pro 약 39달러 ~ Premium 99달러)
Krea Upscaler / Krea Enhancer
Krea AI 플랫폼의 업스케일 기능. Magnific보다 빠르고 가볍다는 점이 매력. 실시간 미리보기와 워크플로우 통합이 뛰어남.
Adobe Photoshop Super Resolution
Camera RAW의 Enhance 기능. 픽셀 수를 2배(면적 4배)로 늘리는 ML 모델. 무료(Creative Cloud 구독자 한정)고 일관된 결과가 장점.
Luminar Neo Upscale AI
Skylum의 사진 편집기 Luminar Neo의 업스케일 확장. 풍경·인물 사진 자동 보정과 결합된 워크플로우.
ON1 Resize AI
오랫동안 인쇄 시장에서 쓰인 ON1 Resize의 AI 버전. 큰 크기 출력 시 디테일 보존이 강점.
Pixelmator Pro ML Super Resolution
Apple Silicon 네이티브. macOS 사용자라면 추가 비용 없이(기본 앱 가격 내) 가장 빠르게 쓸 수 있는 AI 업스케일러. Core ML 가속.
Bigjpg / Let's Enhance
웹 기반 서비스. 설치 없이 브라우저에서 업로드 → 결과 다운로드. 가벼운 사용에 적합하지만 대용량/대량 처리는 비효율.
3장 · 오픈소스 슈퍼 레졸루션 모델
Real-ESRGAN
Tencent ARC 랩의 Xintao Wang이 만든 사실상의 표준. practical degradation(실제 카메라의 노이즈/JPEG/블러를 합성한 학습 데이터)로 학습돼 실사 이미지에서 잘 동작한다.
- 모델 변형: RealESRGAN_x4plus(범용), RealESRGAN_x4plus_anime_6B(만화), RealESRNet(노이즈 적음)
- ncnn Vulkan 백엔드로 CPU·GPU·Apple Silicon에서 모두 동작
- 가중치 라이선스: BSD 3-Clause (상업 사용 가능, 단 모델 카드 확인 필수)
Real-CUGAN
Bilibili가 공개한, 만화/애니메이션에 특화된 Real-ESRGAN의 사촌. 일러스트 라인을 더 깨끗하게 보존.
SwinIR
Swin Transformer 기반 슈퍼 레졸루션. PSNR·SSIM 같은 정량 지표가 매우 높음. 사실적인 디테일보다 정확한 픽셀 복원이 목적이면 적합.
HAT (Hybrid Attention Transformer)
Chen et al, CVPR 2023. SwinIR을 뛰어넘는 채널·공간 어텐션 결합 모델. 학술계의 최신 베이스라인.
DAT (Dual Aggregation Transformer)
ICCV 2023. 공간·채널 두 축으로 어텐션을 묶어 효율 향상.
DRCT (Dense-Residual-Connected Transformer)
CVPR 2024 워크숍. 정보 흐름 손실 문제(SwinIR의 알려진 단점)를 dense connection으로 해결.
CCSR (Controllable Conditional Super-Resolution)
생성 자유도를 슬라이더로 통제 가능한 모델. SUPIR 계열의 ComfyUI 워크플로우에서 자주 함께 쓰임.
4장 · 디퓨전 기반 복원 — 진짜 디테일을 합성한다
SUPIR (Scaling-UP Image Restoration)
Yu, Lin, Zhang et al, ECCV 2024. 본질적으로 Stable Diffusion XL을 백본으로 한 복원 모델. 텍스트 프롬프트로 의미적 가이드를 줄 수 있어 "이게 사람 얼굴인지 풍경인지" 모델이 알게 된다.
- 매우 큰 VRAM 요구(권장 24GB, 최소 16GB)
- 결과 품질은 2026년 현재 오픈소스 중 사실상 최상위
- ComfyUI에 잘 통합돼 있어 실무에서 많이 쓰임
StableSR
Wang et al, IJCV 2024. Stable Diffusion을 슈퍼 레졸루션 사전(prior)으로 활용. SUPIR보다 가볍지만 디테일은 조금 떨어진다.
ResShift
Yue Z. et al, NeurIPS 2023. 디퓨전 스텝을 대폭 줄여(보통 15~20스텝) 속도를 끌어올린 효율 중심 모델.
SeeSR
Wu et al, CVPR 2024. Semantic-aware 디퓨전 SR. 학습 시 semantic prompt를 함께 주입해 객체 인식 정확도를 높임.
DiffBIR
Lin et al, ECCV 2024. Blind Image Restoration — 어떤 종류의 손상인지 모르는 상태에서 복원. 2단계 파이프라인(IR 모듈 + 디퓨전 정제)이 특징.
PASD (Pixel-Aware Stable Diffusion)
Yang et al, ECCV 2024. 픽셀-레벨 정합을 강화한 디퓨전 SR. 텍스트가 많은 이미지(문서·간판)에서 강함.
Topaz Bloom AI
Topaz가 2025년 출시한 디퓨전 기반 모듈. SUPIR/Magnific 노선에 상업적으로 맞선 제품.
5장 · 얼굴 복원에 특화된 모델
업스케일과는 별도로, 얼굴만 따로 복원하는 모델군이 발달했다. 사람 얼굴은 우리 눈이 가장 민감하게 보는 영역이라, 전용 모델이 더 잘 동작한다.
GFPGAN
Xintao Wang et al, CVPR 2021. Real-ESRGAN과 같은 팀의 작품. 매우 흐릿하거나 손상된 얼굴을 사실적으로 복원. 옛 사진 복원에 거의 표준.
- 모델 버전: v1.3, v1.4 (가장 많이 쓰임)
- StyleGAN2 사전을 활용한 GAN 구조
CodeFormer
Shangchen Zhou et al, NeurIPS 2022. 코드북 학습으로 얼굴 정체성 보존과 충실도를 슬라이더(w 파라미터, 0~1)로 조절 가능.
- w=0: 충실도 우선(원본에 가까움, 디테일 적음)
- w=1: 품질 우선(매끈하지만 가끔 얼굴이 살짝 달라짐)
- 옛 사진/감시 카메라/저해상도 화상회의 캡처 복원에 강함
RestoreFormer / RestoreFormer++
Wang et al, CVPR 2022. Multi-scale cross-attention으로 얼굴 디테일 복원.
GPEN
Yang et al, CVPR 2021. GAN Prior Embedded Network. 매우 손상이 큰 입력에서도 작동.
실전 팁: 보통 Real-ESRGAN으로 전체 이미지 업스케일 → CodeFormer/GFPGAN으로 얼굴만 재처리하는 2단 파이프라인이 표준이다. ComfyUI 워크플로우, Stable Diffusion WebUI Extras 탭, 그리고 Topaz Photo AI의 Face Recovery 토글 모두 이 패턴이다.
6장 · 애니메이션·일러스트 전용 업스케일러
실사 사진과 만화는 통계적 분포가 다르다 — 만화는 명확한 라인, 평탄한 색 영역, 노이즈 거의 없음. 그래서 전용 모델이 필요하다.
waifu2x
2015년부터 존재한 클래식. CNN 기반의 단순한 모델이지만 만화 노이즈/디테일 복원에 여전히 쓸 만함. ncnn Vulkan 빌드가 macOS/Windows/Linux 모두 지원.
Real-ESRGAN Anime (RealESRGAN_x4plus_anime_6B)
Real-ESRGAN의 만화 특화 변종. 2026년 현재 만화 업스케일의 사실상 표준.
Real-CUGAN
Bilibili가 공개. 일러스트레이션의 컬러·라인 보존이 매우 좋음.
Anime4K
실시간 GPU 셰이더 기반. 영상 플레이어(mpv, MPC-HC) 안에 끼워 재생 중 실시간 업스케일이 가능. 품질은 모델 기반보다 낮지만 비용이 0.
7장 · 영상 업스케일러
정지 이미지가 아닌 영상은 시간적 일관성(temporal consistency)이 핵심 — 프레임마다 다른 모델 출력이 나오면 깜빡거림이 생긴다.
Topaz Video AI
옛 이름 Video Enhance AI. 영상 업스케일·디인터레이스·노이즈 제거·프레임 보간을 하나로. Proteus, Artemis, Iris, Rhea 등 모델 종류별 특화.
- 8K 출력까지 지원
- 가격: 약 299달러 일회성
- NVIDIA/Apple Silicon 가속
NVIDIA RTX VSR (Video Super Resolution)
드라이버 레벨에서 브라우저 영상 재생을 실시간 업스케일. Chrome/Edge에서 자동 동작. RTX 30/40/50 시리즈 필요.
Microsoft Auto SR
2024년 Snapdragon X 기반 Copilot+ PC에 도입된 OS-레벨 업스케일링. HDR 톤 매핑과 결합. Windows 11에 통합.
AMD FidelityFX Super Resolution (FSR) / NVIDIA DLSS
게임용 SR. 게임 엔진이 저해상도로 렌더 후 SR로 풀해상도로 확대 — 프레임률↑. DLSS는 RTX 전용, FSR은 모든 GPU 지원.
Real-ESRGAN ncnn Vulkan + 영상 스크립트
오픈소스 워크플로우: 영상을 프레임으로 분해 → 각 프레임 업스케일 → 재인코딩. ffmpeg + realesrgan-ncnn-vulkan 조합. 무료지만 시간 소모.
FlowFrames
프레임 보간 전용(24fps → 60fps). 업스케일과 결합하면 옛 영상이 영화처럼 부드러워진다.
DaVinci Resolve Super Scale + AI Magic Mask
Resolve Studio의 기본 기능. 인터페이스가 익숙하면 영상 작업의 자연스러운 확장.
8장 · 스마트폰/카메라 내장 AI 보정
Samsung Galaxy AI Photo Edit
갤럭시 S24/S25 시리즈. "사진 편집기" 안의 AI 지우개·확장·해상도 보정. 클라우드와 온디바이스 혼합 처리.
Apple Photo Cleanup + Image Playground
iOS 18 이후 Photos 앱의 Cleanup(불필요 물체 제거). Image Playground는 생성형이지만 사진 향상과 연결.
Google Pixel Magic Eraser / Best Take / Magic Editor
Pixel 8/9 라인. Magic Editor의 "Reimagine"은 부분 영역을 디퓨전으로 다시 그리는 기능 — 사실상 미니 업스케일/복원.
이 내장 도구들의 공통점: 결과가 빠르고 자연스럽지만 통제는 적다. 전문 작업에는 Topaz·Magnific·SUPIR가 더 적합.
9장 · 오래된 사진 복원 — 종합 파이프라인
Bringing Old Photos Back to Life (Microsoft)
Wan et al, CVPR 2020. 빛바램·스크래치·종이 손상까지 처리하는 통합 파이프라인. 오픈소스(MIT).
CodeFormer 기반 파이프라인
face_restore=True, background_enhance=True, face_upsample=True 옵션을 켜면 얼굴 복원 + 배경 업스케일이 한 번에. 옛 사진 복원에 가장 자주 쓰임.
GFPGAN + Colorization
흑백 사진은 GFPGAN으로 얼굴 복원 → DeOldify 같은 컬러화 모델로 색 복원의 2단 파이프라인이 일반적.
Photoshop Neural Filters
Adobe Sensei의 ML 필터들 — Photo Restoration, Colorize, Smart Portrait. UI가 쉽고 결과를 즉시 본다는 점이 매력.
실전 워크플로우 권장
- 스캔 시 600dpi 이상으로 (입력이 좋아야 결과가 좋다)
- Photoshop Neural Filter Photo Restoration으로 스크래치/먼지 제거
- CodeFormer 또는 GFPGAN으로 얼굴 복원
- SUPIR 또는 Topaz Photo AI로 전체 업스케일
- 필요 시 DeOldify로 컬러화
- 톤·색 미세 조정
10장 · ComfyUI 워크플로우 — 오픈소스의 실전 플랫폼
2026년 오픈소스 진영의 사실상 표준 GUI는 ComfyUI다. 노드 기반 그래프로 SUPIR·CCSR·Real-ESRGAN·GFPGAN을 연결한다.
대표적인 워크플로우:
LoadImage
→ ImageScale (1차 보간)
→ SUPIR Sampler (디퓨전 복원, 4x)
→ Face Restore (CodeFormer)
→ SaveImage
장점: 완전 무료, 모든 파라미터 노출, 배치 처리 가능, 커뮤니티 워크플로우 .json 공유.
단점: 학습 곡선이 있다. 좋은 워크플로우를 찾을 때까지 시행착오가 필요.
Stable Diffusion WebUI / Forge
A1111 또는 Forge UI의 "Extras" 탭에서 Real-ESRGAN·GFPGAN을 슬라이더로 사용. 가장 빠르게 시작 가능한 진입점.
11장 · 평가 지표 — 어떻게 "좋다"를 측정할까
업스케일 결과를 정량적으로 비교하는 지표들:
- PSNR (Peak Signal-to-Noise Ratio) — 픽셀 차이 기반. 높을수록 원본에 가까움. 하지만 시각적 품질과 약하게 상관.
- SSIM (Structural Similarity) — 구조적 유사도. PSNR보다 사람 인식에 가까움.
- LPIPS (Learned Perceptual Image Patch Similarity) — 사전학습 신경망 feature 거리. 사람 인식과 잘 맞음. 낮을수록 좋음.
- FID (Frechet Inception Distance) — 생성 모델 평가용. 분포 거리.
- MUSIQ (Multi-scale Image Quality Transformer) — No-reference 품질 평가(원본 없이 측정).
- NIQE (Natural Image Quality Evaluator) — 비참조 통계적 자연성.
실무 팁: PSNR/SSIM이 높다고 항상 좋아 보이지 않는다. 디퓨전 모델은 종종 PSNR이 낮지만 LPIPS·MUSIQ는 더 좋다 — 즉 사람 눈에는 더 예뻐 보이지만 픽셀 단위로는 원본과 다르다는 뜻.
12장 · 하드웨어 요구사항
| 모델군 | 권장 VRAM | 권장 GPU | Apple Silicon |
|---|---|---|---|
| Real-ESRGAN ncnn | 2~4GB | 어떤 GPU도 OK | M1 이상 OK |
| GFPGAN/CodeFormer | 4~6GB | RTX 3060 이상 | M2 이상 권장 |
| SwinIR/HAT/DAT | 6~8GB | RTX 3070 이상 | M2 Pro 이상 |
| SUPIR | 16GB 이상 | RTX 4090 권장 | M3 Max/Ultra |
| Topaz Photo AI | 8GB GPU 권장 | RTX 3070 이상 | M1 이상 OK (Core ML) |
CPU 폴백은 가능하지만 SUPIR 한 장에 수십 분이 걸릴 수 있다. Apple Silicon은 통합 메모리 덕에 큰 모델을 돌리기 의외로 좋다 — M3 Max 64GB는 SUPIR 무난.
13장 · 상업용 vs 오픈소스 — 어떻게 선택할까
| 축 | 상업용 (Topaz/Magnific) | 오픈소스 (SUPIR/Real-ESRGAN) |
|---|---|---|
| UX | 깔끔하고 즉시 사용 | ComfyUI 학습 필요 |
| 품질 상한 | 좋음 (Topaz 보수적, Magnific 창의적) | SUPIR가 최상위 |
| 비용 | 일회성 ~200달러 또는 월 구독 | 무료 (GPU 비용만) |
| 통제 | 슬라이더 몇 개 | 모든 파라미터 |
| 배치 처리 | 지원 (라이선스 내) | 무제한 |
| 업데이트 | 자동 | 직접 추적 |
추천:
- 개인이 가족 사진 복원만 가끔 → Topaz Photo AI 또는 Pixelmator Pro
- 사진작가/디자이너의 일상 워크플로우 → Topaz Photo AI + Magnific
- 연구·실험·완벽한 통제 → ComfyUI + SUPIR
- 대량 자동 처리 → Real-ESRGAN ncnn 스크립트
- 만화·일러스트 → Real-CUGAN 또는 Real-ESRGAN Anime
- 얼굴 중심 복원 → CodeFormer 또는 GFPGAN
14장 · 한국·일본의 특화 서비스
한국
- 카카오톡 사진 보정 — 톡 안의 "선명하게" 기능, 모바일에서 가볍게
- NAVER 사진 편집 — 네이버 클로바 기반 보정 도구
- 올리브 스튜디오 (Olive Studio) — 사진관 체인의 AI 복원 서비스
- 카메라 앱 SNOW·Soda·B612 — 얼굴 보정 위주지만 해상도 향상도 포함
일본
- 富士フイルム X-Ray AI — 후지필름의 사진 복원 서비스
- Sony Imaging Edge — Sony 카메라 RAW 워크플로우 + AI 노이즈 제거
- Adobe Photoshop 일본판 — 동일 기능, 한자 UI
- 카메라 메이커 자체 도구: Nikon NX Studio, Canon DPP 모두 ML 노이즈 제거 탑재
지역 특화 서비스의 장점은 현지 결제·고객지원·증명사진 등 문화 특화 기능이고, 단점은 글로벌 도구만큼 모델이 자주 갱신되지 않을 수 있다는 점.
15장 · 실전 사용 사례
가족 사진 디지털화
500여 장의 인화 사진을 600dpi로 스캔 → Photoshop Neural Filter로 먼지 제거 → CodeFormer로 얼굴 복원 → Topaz Gigapixel로 4배 업스케일 → DeOldify로 흑백 사진 컬러화. 한 장당 2~3분.
e커머스 셀러
자사몰 상품 이미지 1000x1000 → 4000x4000으로 키워 인쇄 카탈로그 + 풀스크린 배너 동시 활용. Topaz Photo AI 배치 처리가 워크플로우 표준.
부동산 리스팅
매물 사진의 해상도가 휴대폰마다 다름 → Real-ESRGAN 또는 Topaz로 일관된 해상도로 정규화. 노출·색 보정과 함께 자동화.
만화/웹툰 리마스터
2000년대 초 일러스트(보통 1024x1536) → Real-CUGAN 4배 → 4096x6144. 라인이 깔끔하게 유지되면서도 색 영역이 매끈해짐.
영상 리마스터
옛 결혼식 비디오(480i SD) → Topaz Video AI의 Proteus 모델 → 1080p 또는 4K. 시간적 일관성을 위해 모델 내장 옵션 활용.
감시 카메라/CCTV 복원
저해상도 CCTV 캡처에서 얼굴 식별 시도 → CodeFormer(w=0으로 충실도 우선). 단, 법정 증거로 쓸 수 없다 — 디퓨전이 만든 디테일은 "가짜"일 수 있다.
16장 · 윤리·법적 고려사항
업스케일은 정보를 합성한다. 본 적 없는 디테일을 만든다. 그래서 몇 가지 주의가 필요하다:
- 법정 증거 가치 없음 — CCTV/감시 영상의 업스케일 결과는 식별 단서일 뿐, 증거로 인정되지 않음
- 인물 사진의 정체성 보존 — CodeFormer의 w 슬라이더가 낮을수록 원본에 가깝지만, 디퓨전이 살짝 다른 얼굴을 그릴 위험은 항상 존재
- 저작권 — 학습 데이터셋에 포함된 이미지를 모델이 "기억"할 수 있음. 상업 사용 시 모델 카드의 라이선스 확인 필수
- DSGVO/GDPR — 유럽에서 인물 사진을 클라우드 SaaS로 보내는 경우 데이터 처리 동의 필요
- 디지털 위조 우려 — 같은 기술로 가짜 디테일을 그려넣을 수도 있음. 보도/저널리즘에서는 사용 시 명시 필수
17장 · 워크플로우 추천 — 케이스별 정리
케이스 A: 옛 가족 사진 한 장만 빨리
Pixelmator Pro의 ML Super Resolution 한 클릭 → 만족 → 끝. 5초.
케이스 B: 옛 사진 100장 일괄 복원
ComfyUI 워크플로우(GFPGAN + Real-ESRGAN) 또는 Topaz Photo AI Batch.
케이스 C: 인쇄용 풍경 사진
Topaz Gigapixel 8의 High Fidelity 모델, 또는 SUPIR로 디테일 합성.
케이스 D: SNS 콘텐츠 제작자(창의적 자유 허용)
Magnific 또는 Krea — 창의성 슬라이더를 살짝 올려 디테일 풍부하게.
케이스 E: 만화 컬렉터
Real-CUGAN 또는 Real-ESRGAN Anime를 ComfyUI에서, 배치 처리.
케이스 F: 영상 리마스터
Topaz Video AI Proteus 또는 Resolve Studio Super Scale.
18장 · 자주 묻는 질문
Q. PSNR이 높으면 무조건 좋은가? A. 아니다. PSNR은 픽셀 차이 기반이라 매끄럽고 흐릿한 결과가 더 높은 PSNR을 받기도 한다. LPIPS·MUSIQ를 함께 보자.
Q. 디퓨전 모델은 항상 더 좋은가? A. 사진 같은 자연 이미지에는 SUPIR이 최강이지만, 텍스트가 있거나 정밀한 픽셀이 중요한 경우(문서·도면·차트)에는 SwinIR·HAT 같은 회귀형 모델이 더 안정적이다.
Q. 무료 도구만으로 충분한가? A. 80% 사용 사례에는 충분하다. Real-ESRGAN + CodeFormer + GFPGAN의 ComfyUI 조합이면 가족 사진 복원·만화·일반 업스케일 다 가능. 다만 UI와 일관성 면에서 Topaz가 더 편하다.
Q. Mac에서 SUPIR 돌릴 수 있나? A. M3 Max 이상 64GB 통합 메모리면 돌아간다(Diffusers의 MPS 백엔드). M2 Pro 16GB는 더 가벼운 StableSR·ResShift 권장.
Q. 업스케일과 인페인팅의 관계는? A. 인페인팅(Stable Diffusion Inpaint)은 "구멍 메우기"고, 업스케일은 "크기 키우기"다. 다만 디퓨전 기반 업스케일러는 사실상 모든 픽셀을 인페인팅한다고도 볼 수 있다.
19장 · 미래 — 2026~2027 트렌드
- 비디오 디퓨전 SR — 시간적 일관성을 보장하는 디퓨전 영상 업스케일(Stable Video Diffusion 기반)이 본격화
- iPhone 온디바이스 모델 — Apple Intelligence가 사진 앱 안에서 디퓨전 업스케일 제공 가능성
- NPU 가속 — Snapdragon X Elite·M4·Intel Lunar Lake가 NPU 전용 업스케일 모델 가속
- 저비용 클라우드 GPU — Modal·RunPod·Together AI가 SUPIR를 API로 제공
- 저작권 안전 학습 데이터 — Adobe Firefly 식의 "안전 학습" 업스케일러 등장 가능성
- 3D·4D 업스케일 — 가우시안 스플랫·NeRF 결과를 고해상도화
20장 · 체크리스트 — 입문자가 처음 시도할 때
다음 순서로 가보자:
- 무료로 시작하기 — Pixelmator Pro 한 클릭(Mac) 또는 Bigjpg(웹)
- 한계가 느껴지면 — Topaz Photo AI 트라이얼
- 통제가 필요하면 — Stable Diffusion WebUI(Forge)의 Extras 탭으로 Real-ESRGAN + GFPGAN
- 진심으로 빠지면 — ComfyUI 설치 + SUPIR 워크플로우
- 영상이 필요하면 — Topaz Video AI 트라이얼
- 매월 100장 이상 처리 → 워크플로우 자동화(ComfyUI 배치 또는 Topaz 라이선스)
에필로그 — 픽셀을 늘리는 것이 아니라 의미를 복원하는 것
AI 업스케일링이 흥미로운 이유는, 그것이 단순한 해상도 변환이 아니기 때문이다. 모델은 "이게 사람 얼굴이다", "이건 풀잎이다", "이건 글자다"라는 의미를 알고 그에 맞는 디테일을 합성한다. 즉, 픽셀이 아니라 의미를 복원한다.
이는 곧 윤리적 책임도 따라온다는 뜻이다. 복원된 사진은 "있는 그대로"가 아니라 "그럴법한" 모습이다. 가족 앨범의 흑백 사진 속 할아버지의 눈동자 색이 갈색으로 컬러화되었을 때, 그것은 모델의 추측일 뿐이다.
그래도, 옛 결혼식 사진을 4K로 거실 TV에 띄우고 부모님이 미소 짓는 순간 — 그 가치는 분명히 진짜다. 의미는 합성됐을지언정, 감동은 합성되지 않았다.
2026년의 업스케일 도구는 그 어느 때보다 강력하고, 어느 때보다 접근하기 쉽다. Topaz든 Magnific이든 ComfyUI든, 자기 워크플로우에 맞는 도구를 찾고 한 장이라도 직접 복원해보자. 그 한 장이 시작이다.
References
- Topaz Labs Photo AI: https://www.topazlabs.com/photo-ai
- Topaz Gigapixel 8: https://www.topazlabs.com/gigapixel
- Topaz Video AI: https://www.topazlabs.com/topaz-video-ai
- Magnific: https://magnific.ai/
- Krea Upscaler: https://www.krea.ai/
- Adobe Camera RAW Enhance / Super Resolution: https://helpx.adobe.com/camera-raw/using/enhance-details.html
- Luminar Neo: https://skylum.com/luminar
- ON1 Resize AI: https://www.on1.com/products/resize-ai/
- Pixelmator Pro: https://www.pixelmator.com/pro/
- Real-ESRGAN (Xintao Wang): https://github.com/xinntao/Real-ESRGAN
- Real-CUGAN: https://github.com/bilibili/ailab/tree/main/Real-CUGAN
- SwinIR (Liang et al, ICCV 2021): https://github.com/JingyunLiang/SwinIR
- HAT (Chen et al, CVPR 2023): https://github.com/XPixelGroup/HAT
- DAT (Chen et al, ICCV 2023): https://github.com/zhengchen1999/DAT
- DRCT (Hsu et al, CVPRW 2024): https://github.com/ming053l/DRCT
- SUPIR (Yu et al, ECCV 2024): https://github.com/Fanghua-Yu/SUPIR
- StableSR (Wang et al, IJCV 2024): https://github.com/IceClear/StableSR
- ResShift (Yue Z. et al, NeurIPS 2023): https://github.com/zsyOAOA/ResShift
- SeeSR (Wu et al, CVPR 2024): https://github.com/cswry/SeeSR
- DiffBIR (Lin et al, ECCV 2024): https://github.com/XPixelGroup/DiffBIR
- PASD (Yang et al, ECCV 2024): https://github.com/yangxy/PASD
- GFPGAN: https://github.com/TencentARC/GFPGAN
- CodeFormer (Zhou et al, NeurIPS 2022): https://github.com/sczhou/CodeFormer
- RestoreFormer: https://github.com/wzhouxiff/RestoreFormer
- waifu2x: https://github.com/nagadomi/waifu2x
- Anime4K: https://github.com/bloc97/Anime4K
- ComfyUI: https://github.com/comfyanonymous/ComfyUI
- Stable Diffusion WebUI Forge: https://github.com/lllyasviel/stable-diffusion-webui-forge
- Bringing Old Photos Back to Life: https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life
- DeOldify: https://github.com/jantic/DeOldify
- NVIDIA RTX Video Super Resolution: https://www.nvidia.com/en-us/geforce/news/rtx-video-super-resolution/
- LPIPS: https://github.com/richzhang/PerceptualSimilarity
- MUSIQ: https://github.com/google-research/google-research/tree/master/musiq