[가상화] 10. 가상화 기술의 미래: 컨피덴셜 컴퓨팅부터 GPU 디스어그리게이션까지

들어가며
컨피덴셜 컴퓨팅 (Confidential Computing)
ARM 가상화
- Apple Virtualization.framework
- Ampere Altra / AWS Graviton
GPU 디스어그리게이션
NVIDIA BlueField DPU
- SmartNIC에 가상화 오프로딩
- 장점
WebAssembly (Wasm) 가상화
Kata Containers
- VM 격리 컨테이너
- 장점
유니커널 (Unikernels)
- 목적별 최소 VM
- 주요 유니커널 프로젝트
서버리스 GPU
- 온디맨드 GPU 할당
- 주요 서비스
엣지 컴퓨팅 가상화
- 과제
- 엣지에 적합한 가상화 기술
그린 컴퓨팅과 가상화
- 에너지 효율성
- 미래 기술
시리즈 요약
마치며

들어가며

가상화 기술은 메인프레임 시대부터 현재의 클라우드 네이티브 시대까지 끊임없이 진화해 왔습니다. 이 글에서는 가상화의 미래를 형성할 핵심 기술들을 살펴보며 시리즈를 마무리합니다.

컨피덴셜 컴퓨팅 (Confidential Computing)

개요

컨피덴셜 컴퓨팅은 데이터를 사용 중(in-use)에도 암호화된 상태로 처리하는 기술입니다. 기존에는 저장(at-rest)과 전송(in-transit) 중에만 암호화가 가능했습니다.

기존 암호화:
+------------------+     +------------------+     +------------------+
| 저장 시 (at-rest)|     | 전송 중          |     | 사용 중 (in-use) |
| AES 암호화       | --> | TLS/SSL          | --> | 평문 처리        |
| [보호됨]         |     | [보호됨]          |     | [취약]           |
+------------------+     +------------------+     +------------------+

컨피덴셜 컴퓨팅:
+------------------+     +------------------+     +------------------+
| 저장 시 (at-rest)|     | 전송 중          |     | 사용 중 (in-use) |
| AES 암호화       | --> | TLS/SSL          | --> | 메모리 암호화     |
| [보호됨]         |     | [보호됨]          |     | [보호됨]          |
+------------------+     +------------------+     +------------------+

하드웨어 기술

AMD SEV (Secure Encrypted Virtualization)

+------------------------------------------+
|           AMD SEV 아키텍처                 |
|                                          |
|  +------------------+  +---------------+ |
|  | VM 1             |  | VM 2          | |
|  | 고유 암호화 키     |  | 고유 암호화 키  | |
|  | [메모리 암호화됨]  |  | [메모리 암호화됨]| |
|  +------------------+  +---------------+ |
|                                          |
|  +--------------------------------------+|
|  | AMD Secure Processor (PSP)           ||
|  | - 키 관리                             ||
|  | - 메모리 암호화 엔진 (SME)             ||
|  | - SEV-ES: 레지스터 상태 암호화          ||
|  | - SEV-SNP: 무결성 보호 추가            ||
|  +--------------------------------------+|
+------------------------------------------+

SEV: VM 메모리 암호화
SEV-ES: CPU 레지스터 상태 암호화 추가
SEV-SNP: 메모리 무결성 보호 추가 (하이퍼바이저 공격 방어)

Intel TDX (Trust Domain Extensions)

Trust Domain (TD)라는 격리된 실행 환경 제공
하이퍼바이저로부터의 VM 보호
리모트 어테스테이션(remote attestation) 지원

ARM CCA (Confidential Compute Architecture)

Realm이라는 새로운 실행 환경 도입
ARM 기반 서버/엣지 디바이스에 적용
모바일부터 데이터센터까지 통합 보안 모델

클라우드 서비스

서비스	기반 기술	특징
AWS Nitro Enclaves	AWS Nitro System	격리된 컴퓨팅 환경, 네트워크 없음
Azure Confidential VMs	AMD SEV-SNP / Intel TDX	전체 VM 메모리 암호화
GCP Confidential VMs	AMD SEV	리프트 앤 시프트 마이그레이션

ARM 가상화

Apple Virtualization.framework

macOS에서 경량 VM을 실행하기 위한 네이티브 프레임워크입니다.

+------------------------------------------+
| macOS (Apple Silicon)                    |
|                                          |
|  +------------------------------------+ |
|  | Virtualization.framework           | |
|  |                                    | |
|  |  +----------+  +----------+       | |
|  |  | Linux VM |  | macOS VM |       | |
|  |  | (ARM64)  |  | (ARM64)  |       | |
|  |  +----------+  +----------+       | |
|  |                                    | |
|  | - Rosetta 2 x86 에뮬레이션 지원     | |
|  | - virtio 디바이스 모델              | |
|  | - GPU 가속 (Metal)                 | |
|  +------------------------------------+ |
+------------------------------------------+

Ampere Altra / AWS Graviton

ARM 기반 서버 프로세서가 데이터센터에서 급격히 확산되고 있습니다.

프로세서	코어 수	용도	가상화 지원
Ampere Altra Max	128	클라우드 네이티브	KVM/QEMU
AWS Graviton 4	96	AWS EC2	Nitro
NVIDIA Grace	72	AI/HPC	KVM

ARM 가상화의 장점은 다음과 같습니다.

뛰어난 전력 효율성 (와트당 성능)
코어 수 대비 높은 VM 밀도
클라우드 비용 절감 (x86 대비 20-40%)

GPU 디스어그리게이션

개념

GPU를 컴퓨팅 노드에서 분리하여 네트워크를 통해 공유하는 아키텍처입니다.

기존 아키텍처:
+------------------+  +------------------+  +------------------+
| Server 1         |  | Server 2         |  | Server 3         |
| CPU + GPU x4     |  | CPU + GPU x4     |  | CPU (GPU 없음)    |
| [GPU 낭비 가능]   |  | [GPU 부족 가능]   |  | [GPU 필요]        |
+------------------+  +------------------+  +------------------+

디스어그리게이션:
+------------------+  +------------------+  +------------------+
| Server 1         |  | Server 2         |  | Server 3         |
| CPU              |  | CPU              |  | CPU              |
+--------+---------+  +--------+---------+  +--------+---------+
         |                     |                     |
+--------v---------------------v---------------------v---------+
|                    GPU Pool (네트워크 연결)                     |
|  +------+  +------+  +------+  +------+  +------+  +------+ |
|  | GPU  |  | GPU  |  | GPU  |  | GPU  |  | GPU  |  | GPU  | |
|  +------+  +------+  +------+  +------+  +------+  +------+ |
+--------------------------------------------------------------+

인터커넥트 기술

기술	대역폭	레이턴시	용도
PCIe Gen5	128 GB/s (x16)	매우 낮음	로컬
CXL 3.0	128 GB/s	낮음	랙 내
NVLink 5.0	1.8 TB/s (GPU 간)	매우 낮음	GPU 클러스터
InfiniBand NDR	400 Gb/s	중간	데이터센터

CXL (Compute Express Link)

CXL은 GPU 디스어그리게이션의 핵심 인터커넥트 기술입니다.

CXL 메모리 풀링:

+--------+  +--------+  +--------+
| CPU 1  |  | CPU 2  |  | GPU    |
+---+----+  +---+----+  +---+----+
    |            |            |
+---v------------v------------v---+
|        CXL Switch               |
+---+------------+------------+---+
    |            |            |
+---v----+  +---v----+  +---v----+
| 메모리  |  | 메모리  |  | 메모리  |
| 풀 1   |  | 풀 2   |  | 풀 3   |
+--------+  +--------+  +--------+

NVIDIA BlueField DPU

SmartNIC에 가상화 오프로딩

BlueField DPU는 가상화, 네트워킹, 스토리지 처리를 호스트 CPU에서 분리하여 SmartNIC에서 처리합니다.

+------------------------------------------+
|           Host Server                     |
|  +------------------------------------+  |
|  | CPU                                |  |
|  | - 애플리케이션 워크로드만 실행       |  |
|  | - 가상화 오버헤드 없음              |  |
|  +------------------------------------+  |
|                  |                        |
|  +------------------------------------+  |
|  | BlueField DPU                      |  |
|  |                                    |  |
|  |  - ARM 코어에서 하이퍼바이저 실행   |  |
|  |  - OVS 가속 (네트워킹)             |  |
|  |  - SNAP 가속 (스토리지)            |  |
|  |  - IPsec/TLS 하드웨어 가속          |  |
|  |  - Zero-trust 보안                 |  |
|  +------------------------------------+  |
+------------------------------------------+

장점

호스트 CPU 사이클을 애플리케이션에 100% 활용
네트워크/스토리지 가상화 오버헤드 제거
인프라와 테넌트 간 하드웨어 수준 격리
GPU Direct RDMA 가속

WebAssembly (Wasm) 가상화

경량 가상화 대안

WebAssembly는 컨테이너보다 가볍고, VM보다 빠른 새로운 실행 환경입니다.

비교:

VM          Container     Wasm
+--------+  +--------+   +--------+
| App    |  | App    |   | App    |
+--------+  +--------+   +--------+
| Guest  |  | Libs   |   | Wasm   |
| OS     |  +--------+   | Runtime|
+--------+  | Container| +--------+
| Hypervisor| | Runtime |
+--------+  +--------+
| Host OS|  | Host OS|   | Host OS|
+--------+  +--------+   +--------+

시작 시간: 초~분   밀리초      마이크로초
메모리:    GB      MB          KB~MB
격리:      강함    중간        Sandbox

주요 Wasm 런타임

런타임	특징	용도
Wasmtime	Bytecode Alliance, 표준 준수	서버사이드
WasmEdge	CNCF Sandbox, 경량	엣지/IoT
Spin	Fermyon, 서버리스 프레임워크	마이크로서비스
WAMR	Intel, 초경량	임베디드

쿠버네티스 통합

# SpinKube를 통한 Wasm 워크로드 예시
apiVersion: core.spinoperator.dev/v1alpha1
kind: SpinApp
metadata:
  name: my-wasm-app
spec:
  image: ghcr.io/my-org/my-wasm-app:latest
  replicas: 3
  executor: containerd-shim-spin

Kata Containers

VM 격리 컨테이너

Kata Containers는 각 컨테이너(또는 Pod)를 경량 VM 안에서 실행하여 하드웨어 수준의 격리를 제공합니다.

일반 컨테이너:
+------------------+
| Container 1      |  Container 2      |
|                  |                   |
| 같은 커널 공유    |  같은 커널 공유    |
+------------------+-------------------+
|          Host Kernel                  |
+--------------------------------------+

Kata Containers:
+------------------+  +------------------+
| Container 1      |  | Container 2      |
+------------------+  +------------------+
| Guest Kernel 1   |  | Guest Kernel 2   |
+------------------+  +------------------+
| Lightweight VM 1 |  | Lightweight VM 2 |
+------------------+  +------------------+
|          Host Kernel + KVM             |
+----------------------------------------+

장점

컨테이너 수준의 사용 편의성 + VM 수준의 격리
OCI 호환, 기존 컨테이너 이미지 그대로 사용
멀티테넌트 환경에서 강력한 보안
쿠버네티스 런타임으로 직접 사용 가능

유니커널 (Unikernels)

목적별 최소 VM

유니커널은 애플리케이션에 필요한 OS 기능만 포함하는 초경량 VM입니다.

일반 VM:
+----------------------------------+
| Application                      |
+----------------------------------+
| 전체 OS (커널 + 사용자 공간)       |
| - 파일시스템, 네트워킹, 프로세스    |
| - 불필요한 서비스, 데몬            |
| - 보안 취약 표면 넓음              |
+----------------------------------+
크기: 수백 MB ~ 수 GB

유니커널:
+----------------------------------+
| Application + 필요한 OS 기능만     |
| - 최소 네트워크 스택              |
| - 최소 메모리 관리                |
| - 단일 주소 공간                  |
+----------------------------------+
크기: 수 MB ~ 수십 MB

주요 유니커널 프로젝트

프로젝트	언어	특징
MirageOS	OCaml	학술적, 타입 안전
Unikraft	C/C++	모듈러, POSIX 호환
Nanos	C	범용, 실행 편의성
OSv	Java/C	JVM 최적화

서버리스 GPU

온디맨드 GPU 할당

VM이나 컨테이너를 관리할 필요 없이 함수 수준에서 GPU를 사용하는 패러다임입니다.

기존 방식:
사용자 --> VM/컨테이너 프로비저닝 --> GPU 할당 --> 애플리케이션 실행
         (수분 소요)               (고정 할당)

서버리스 GPU:
사용자 --> API 호출 --> GPU 자동 할당 --> 함수 실행 --> GPU 자동 반환
         (밀리초)     (온디맨드)                    (비용 최소화)

주요 서비스

서비스	특징
AWS Lambda (GPU 미지원)	서버리스 표준, GPU 지원 예정
Modal	Python 네이티브, GPU 서버리스
Banana	ML 추론 특화
RunPod Serverless	GPU 서버리스 컨테이너

엣지 컴퓨팅 가상화

과제

엣지 환경에서의 가상화는 리소스 제약과 관리 복잡도라는 고유한 도전을 안고 있습니다.

클라우드                     엣지
+------------------+         +------------------+
| 풍부한 리소스     |         | 제한된 리소스     |
| 안정적 네트워크   |         | 불안정한 연결     |
| 중앙 관리        |         | 분산 관리 필요    |
| 물리 보안 우수   |         | 물리 접근 위험    |
+------------------+         +------------------+

엣지에 적합한 가상화 기술

기술	리소스 요구	시작 시간	적합도
QEMU/KVM (microVM)	낮음	100ms 이하	높음
Kata Containers	낮음	100ms 이하	높음
WebAssembly	매우 낮음	마이크로초	매우 높음
유니커널	매우 낮음	밀리초	높음
일반 VM	높음	초~분	낮음

그린 컴퓨팅과 가상화

에너지 효율성

가상화는 하드웨어 활용률을 높여 에너지 소비를 줄이는 핵심 기술입니다.

가상화 없이:
+--------+ +--------+ +--------+ +--------+
|Server 1| |Server 2| |Server 3| |Server 4|
| 사용률  | | 사용률  | | 사용률  | | 사용률  |
|  15%   | |  10%   | |  20%   | |  5%    |
+--------+ +--------+ +--------+ +--------+
총 서버: 4대, 평균 사용률: 12.5%

가상화 적용:
+--------+
|Server 1|
| 사용률  |
|  70%   |  <-- 4대의 워크로드 통합
+--------+
총 서버: 1대, 전력 절감: 60-75%

미래 기술

워크로드 인식 GPU 전력 관리
카본 인식(carbon-aware) 스케줄링
재생 에너지 가용 시간에 맞춘 배치 작업
AI 기반 VM 배치 최적화

시리즈 요약

이 시리즈에서 다룬 내용을 정리하겠습니다.

회차	주제	핵심 내용
06	KubeVirt	K8s 네이티브 VM 실행, CRD, CDI, 라이브 마이그레이션
07	GPU Operator	GPU 소프트웨어 스택 자동화, ClusterPolicy, MIG
08	KubeVirt + GPU	VM GPU 패스스루/vGPU, VFIO, Sandbox Plugin
09	플랫폼 비교	QEMU/VBox/VMware/KubeVirt 종합 비교
10	미래 기술	컨피덴셜 컴퓨팅, GPU 디스어그리게이션, Wasm

마치며

가상화 기술은 단순한 하드웨어 추상화를 넘어, 보안(컨피덴셜 컴퓨팅), 효율성(GPU 디스어그리게이션), 경량화(Wasm/유니커널), 자동화(KubeVirt/GPU Operator) 등 다양한 방향으로 진화하고 있습니다.

특히 AI/ML 워크로드의 폭발적 증가로 인해 GPU 가상화와 디스어그리게이션 기술은 앞으로 더욱 중요해질 것입니다. 쿠버네티스 생태계에서 KubeVirt와 GPU Operator의 결합은 이러한 미래를 준비하는 핵심 기술 스택이 될 것입니다.

퀴즈: 가상화 미래 기술 이해도 점검

Q1. 컨피덴셜 컴퓨팅이 보호하는 데이터 상태는?

A) 저장 시 (at-rest) B) 전송 중 (in-transit) C) 사용 중 (in-use) D) 삭제 시 (at-deletion)

정답: C) 컨피덴셜 컴퓨팅은 기존에 보호가 어려웠던 사용 중(in-use) 데이터를 하드웨어 수준에서 암호화합니다.

Q2. GPU 디스어그리게이션의 핵심 인터커넥트 기술은?

A) USB 4.0 B) CXL (Compute Express Link) C) Thunderbolt 5 D) SATA Express

정답: B) CXL은 CPU, GPU, 메모리 간의 저지연 고대역폭 연결을 제공하는 GPU 디스어그리게이션의 핵심 기술입니다.

Q3. Kata Containers의 핵심 특징은?

A) GPU를 네트워크로 공유 B) WebAssembly 런타임 제공 C) 각 컨테이너를 경량 VM에서 실행하여 격리 D) 유니커널 기반 초경량 OS

정답: C) Kata Containers는 컨테이너를 경량 VM 안에서 실행하여 컨테이너의 편의성과 VM의 격리를 모두 제공합니다.

Q4. 엣지 컴퓨팅에 가장 적합한 가상화 기술은?

A) 일반 VM (전체 OS) B) VMware ESXi C) WebAssembly D) VirtualBox

정답: C) WebAssembly는 마이크로초 단위의 시작 시간과 KB 수준의 메모리 사용으로 리소스가 제한된 엣지 환경에 가장 적합합니다.