Skip to content

Split View: AWS vs GCP vs Azure 완전 비교 2025: 서비스별 매핑, 비용, 자격증, 선택 기준 총정리

✨ Learn with Quiz
|

AWS vs GCP vs Azure 완전 비교 2025: 서비스별 매핑, 비용, 자격증, 선택 기준 총정리

서론: 클라우드 시장 2025

2025년 전 세계 클라우드 시장 규모는 약 6,000억 달러를 넘어섰습니다. 3대 클라우드 벤더의 시장 점유율은 다음과 같습니다:

벤더시장 점유율 (2025 Q1)연간 매출 규모
AWS (Amazon)약 31%약 1,000억 달러
Azure (Microsoft)약 25%약 800억 달러
GCP (Google)약 11%약 400억 달러

AWS가 여전히 선두를 유지하고 있지만, Azure는 엔터프라이즈 시장에서 빠르게 성장하고 있으며, GCP는 데이터/AI/ML과 Kubernetes 분야에서 강력한 입지를 구축하고 있습니다.

어떤 클라우드를 선택해야 할까요? 이 글에서는 3대 클라우드를 서비스별로 매핑하고, 비용, 강점/약점, 자격증, 의사결정 프레임워크까지 완전히 비교합니다.


1. 서비스 매핑표: 30+ 서비스 1:1 비교

1.1 컴퓨팅 (Compute)

기능AWSGCPAzure
가상 머신EC2Compute Engine (GCE)Virtual Machines
서버리스 함수LambdaCloud FunctionsAzure Functions
컨테이너 서비스ECS / FargateCloud RunContainer Apps
KubernetesEKSGKEAKS
배치 처리BatchCloud BatchAzure Batch
Edge 컴퓨팅Lambda@EdgeCloud CDN FunctionsAzure Edge Zones

1.2 스토리지 (Storage)

기능AWSGCPAzure
오브젝트 스토리지S3Cloud Storage (GCS)Blob Storage
블록 스토리지EBSPersistent DiskManaged Disks
파일 스토리지EFSFilestoreAzure Files
아카이브S3 GlacierArchive StorageCool/Archive Blob
CDNCloudFrontCloud CDNAzure CDN / Front Door

1.3 데이터베이스 (Database)

기능AWSGCPAzure
관계형 DBRDS / AuroraCloud SQL / AlloyDBAzure SQL / Flexible Server
NoSQL (문서)DynamoDBFirestoreCosmos DB
NoSQL (와이드컬럼)DynamoDBBigtableCosmos DB (Cassandra API)
인메모리ElastiCacheMemorystoreAzure Cache for Redis
데이터 웨어하우스RedshiftBigQuerySynapse Analytics
그래프 DBNeptune-Cosmos DB (Gremlin API)

1.4 AI/ML

기능AWSGCPAzure
ML 플랫폼SageMakerVertex AIAzure ML
Pre-trained AIRekognition, ComprehendVision AI, Natural LanguageCognitive Services
LLM 서비스BedrockVertex AI (Gemini)Azure OpenAI
데이터 분석Athena + GlueBigQuerySynapse Analytics
AutoMLSageMaker AutopilotVertex AI AutoMLAzure AutoML

1.5 네트워킹 (Networking)

기능AWSGCPAzure
VPCVPCVPCVirtual Network (VNet)
로드밸런서ALB / NLB / GLBCloud Load BalancingApplication Gateway / LB
DNSRoute 53Cloud DNSAzure DNS
VPNVPN GatewayCloud VPNVPN Gateway
전용 연결Direct ConnectCloud InterconnectExpressRoute
API 관리API GatewayApigee / API GatewayAPI Management

1.6 서버리스 & 이벤트 (Serverless & Event)

기능AWSGCPAzure
FaaSLambdaCloud FunctionsAzure Functions
이벤트 버스EventBridgeEventarcEvent Grid
메시지 큐SQSCloud Tasks / Pub/SubQueue Storage / Service Bus
Pub/SubSNSPub/SubEvent Grid / Service Bus
워크플로Step FunctionsWorkflowsLogic Apps / Durable Functions

1.7 DevOps & 모니터링

기능AWSGCPAzure
CI/CDCodePipeline / CodeBuildCloud BuildAzure DevOps / GitHub Actions
IaCCloudFormation / CDKDeployment Manager / TerraformARM Templates / Bicep
모니터링CloudWatchCloud MonitoringAzure Monitor
로깅CloudWatch LogsCloud LoggingLog Analytics
추적X-RayCloud TraceApplication Insights
비밀 관리Secrets ManagerSecret ManagerKey Vault

2. 컴퓨팅 심층 비교

2.1 가상 머신: EC2 vs GCE vs Azure VM

성능 비교 (vCPU 4, 메모리 16GB 기준):

AWS EC2 (m6i.xlarge):
- vCPU: 4, Memory: 16GB
- 온디맨드: ~$0.192/hr (~$140/)
- 네트워크: 최대 12.5 Gbps

GCP GCE (n2-standard-4):
- vCPU: 4, Memory: 16GB
- 온디맨드: ~$0.194/hr (~$142/)
- 커스텀 머신 타입: CPU/메모리 독립 조정 가능 (GCP만의 강점!)

Azure VM (D4s v5):
- vCPU: 4, Memory: 16GB
- 온디맨드: ~$0.192/hr (~$140/)
- 하이브리드 혜택: Windows Server 라이선스 보유 시 최대 40% 할인

핵심 차이점:

  • AWS: 인스턴스 타입이 가장 다양 (500+ 종류). Graviton(ARM) 프로세서로 비용 대비 성능 우수
  • GCP: 커스텀 머신 타입으로 유연한 리소스 배분. 지속 사용 할인(Sustained Use Discount) 자동 적용
  • Azure: Windows 워크로드에 최적화. Hybrid Benefit으로 기존 라이선스 활용

2.2 서버리스: Lambda vs Cloud Functions vs Azure Functions

서버리스 함수 비교:

AWS Lambda:
- 최대 실행 시간: 15- 메모리: 128MB ~ 10GB
- 동시 실행: 1,000 (기본, 증가 가능)
- 콜드 스타트: 중간 (SnapStart로 개선)
- 프로비저닝된 동시성 지원

GCP Cloud Functions (2nd gen):
- 최대 실행 시간: 60 (2nd gen)
- 메모리: 128MB ~ 32GB
- 동시 실행: 인스턴스당 최대 1,000 요청
- 콜드 스타트: 가장 짧음
- Cloud Run 기반으로 확장

Azure Functions:
- 최대 실행 시간: 무제한 (Premium Plan)
- 메모리: 1.5GB ~ 14GB
- 동시 실행: 200 (기본)
- Durable Functions: 상태 보존 워크플로
- Visual Studio 통합 우수

3. 스토리지 심층 비교

3.1 오브젝트 스토리지: S3 vs GCS vs Blob Storage

항목AWS S3GCP Cloud StorageAzure Blob Storage
내구성99.999999999% (11 9's)99.999999999%99.999999999%
스토리지 클래스Standard, IA, Glacier, Deep ArchiveStandard, Nearline, Coldline, ArchiveHot, Cool, Cold, Archive
최소 저장 기간클래스별 상이Nearline: 30일, Coldline: 90일Cool: 30일, Archive: 180일
가격 (GB/월)Standard: $0.023Standard: $0.020Hot: $0.018
전송 비용$0.09/GB (아웃)$0.12/GB (아웃)$0.087/GB (아웃)
강점가장 성숙한 생태계가장 저렴한 저장 비용Azure 통합

3.2 블록 스토리지

블록 스토리지 비교:

AWS EBS (gp3):
- IOPS: 3,000 기본 (최대 16,000)
- 처리량: 125 MB/s 기본 (최대 1,000 MB/s)
- 가격: $0.08/GB/- 스냅샷: 증분 백업

GCP Persistent Disk (pd-ssd):
- IOPS: 디스크 크기에 비례
- 처리량: 디스크 크기에 비례
- 가격: $0.17/GB/ (SSD)
- 특장점: 멀티 인스턴스 연결 가능

Azure Managed Disks (Premium SSD v2):
- IOPS: 최대 80,000
- 처리량: 최대 1,200 MB/s
- 가격: $0.132/GB/- 특장점: IOPS/처리량 독립 프로비저닝

4. 데이터베이스 심층 비교

4.1 관계형 DB: RDS/Aurora vs Cloud SQL/AlloyDB vs Azure SQL

항목AWS AuroraGCP AlloyDBAzure SQL
엔진MySQL, PostgreSQLPostgreSQLSQL Server, PostgreSQL
성능MySQL 대비 5배, PG 대비 3배PostgreSQL 대비 4배업계 최고 SQL Server 성능
스토리지자동 확장 (최대 128TB)자동 확장자동 확장 (최대 100TB)
복제최대 15 읽기 전용 복제본최대 20 읽기 전용 복제본활성 지오 복제
서버리스Aurora Serverless v2AlloyDB (서버리스 아님)Azure SQL Serverless
강점성숙도, 호환성AI 통합, 성능SQL Server 워크로드

4.2 NoSQL: DynamoDB vs Firestore vs Cosmos DB

NoSQL 비교:

AWS DynamoDB:
- 모델:-+ 문서
- 성능: 단일 자릿수 ms 지연
- 용량 모드: 온디맨드 / 프로비저닝
- 글로벌 테이블: 멀티 리전 복제
- DAX: 인메모리 캐시 레이어
- 강점: 대규모 트래픽 처리, 일관된 성능

GCP Firestore:
- 모델: 문서 (컬렉션 + 문서)
- 성능: 수 ms 지연
- 실시간 동기화: 내장 (모바일/)
- 오프라인 지원: 네이티브
- 강점: 모바일/웹 앱 개발, 실시간 기능

Azure Cosmos DB:
- 모델: 멀티 모델 (문서,-, 그래프, 컬럼)
- API: SQL, MongoDB, Cassandra, Gremlin, Table
- 글로벌 분산: 턴키 멀티 리전
- 일관성: 5가지 레벨 선택 가능
- 강점: 멀티 모델 유연성, 글로벌 분산

4.3 데이터 웨어하우스: Redshift vs BigQuery vs Synapse

항목AWS RedshiftGCP BigQueryAzure Synapse
아키텍처클러스터 기반서버리스서버리스 + 전용
과금노드 시간스캔 데이터량쿼리 기반 / 프로비저닝
확장성수동 클러스터 조정완전 자동자동 / 수동
가격 (1TB 쿼리)클러스터 의존적$5/TB쿼리 의존적
강점BI 도구 통합속도, 비용 효율성MS 생태계 통합

BigQuery의 압도적 강점: 서버리스 아키텍처로 인프라 관리 불필요, 페타바이트급 데이터도 초 단위 쿼리, 스캔 데이터량 기반 과금으로 비용 예측 용이.


5. AI/ML 서비스 비교

5.1 ML 플랫폼: SageMaker vs Vertex AI vs Azure ML

항목AWS SageMakerGCP Vertex AIAzure ML
노트북SageMaker StudioWorkbenchAzure ML Studio
AutoMLAutopilotAutoMLAutoML
학습분산 학습, Spot 지원TPU 지원, 분산 학습분산 학습, GPU 클러스터
배포엔드포인트, 서버리스 추론엔드포인트, 배치 예측관리형 엔드포인트
MLOpsPipelines, Model RegistryPipelines, Model RegistryMLflow 통합
LLMBedrock (Claude, Llama 등)Gemini, Model GardenAzure OpenAI (GPT-4o)
강점가장 넓은 프레임워크 지원TPU, BigQuery 통합OpenAI 파트너십

5.2 LLM/생성형 AI 비교

LLM 서비스 비교:

AWS Bedrock:
- 모델: Claude (Anthropic), Llama, Titan, Mistral
- 특장점: 다양한 모델 선택, 모델 커스터마이징
- Fine-tuning: 지원
- RAG: Knowledge Bases 기능

GCP Vertex AI:
- 모델: Gemini (Google), PaLM 2
- 특장점: Google 검색 연동, Grounding
- Fine-tuning: 지원
- 멀티모달: Gemini의 이미지/비디오 이해

Azure OpenAI:
- 모델: GPT-4o, GPT-4, DALL-E, Whisper
- 특장점: OpenAI와의 독점 파트너십
- Fine-tuning: 지원
- 엔터프라이즈: 가장 강력한 보안/규정 준수

6. Kubernetes 비교: EKS vs GKE vs AKS

6.1 관리형 Kubernetes 비교

항목AWS EKSGCP GKEAzure AKS
제어 플레인 비용0.10/hr(0.10/hr (73/월)무료 (Standard)무료
노드 자동 확장Karpenter (추천)Autopilot (완전 자동)KEDA / Cluster Autoscaler
서비스 메시App Mesh / IstioAnthos Service Mesh (관리형)Istio (관리형)
네트워킹VPC CNIVPC-nativeAzure CNI
로깅/모니터링CloudWatch + PrometheusCloud Operations (통합)Azure Monitor + Prometheus
강점AWS 서비스 통합가장 성숙한 K8s, AutopilotAzure AD 통합, 비용

GKE가 Kubernetes의 골드 스탠다드인 이유: Google이 Kubernetes를 만들었기에 가장 빠른 버전 지원, Autopilot 모드의 완전 관리, 우수한 네트워킹 성능을 제공합니다.

6.2 Kubernetes 아키텍처 비교

GKE Autopilot (권장):
┌─────────────────────────────────┐
Google 관리 Control Plane+ 노드 관리 자동화              │
+ Pod 단위 과금                 │
+ 보안 자동 강화                │
└──────────┬──────────────────────┘
     ┌─────▼─────┐
Workloads       (Pods)     └───────────┘

EKS with Karpenter:
┌─────────────────────────────────┐
AWS 관리 Control Plane ($73/)└──────────┬──────────────────────┘
  ┌────────▼────────┐
Karpenter   (노드 자동 프로비저닝)  └────────┬─────────┘
     ┌─────▼─────┐
Nodes+ Pods     └───────────┘

AKS:
┌─────────────────────────────────┐
Azure 관리 Control Plane (무료)└──────────┬──────────────────────┘
  ┌────────▼────────┐
Node Pools+ Azure AD 통합  │
  └──────────────────┘

7. 비용 비교

7.1 과금 모델 비교

과금 유형AWSGCPAzure
온디맨드시간/초 단위초 단위 (최소 1분)분 단위
예약 (1년)최대 40% 할인CUD: 최대 37% 할인최대 40% 할인
예약 (3년)최대 60% 할인CUD: 최대 55% 할인최대 72% 할인
스팟/선점형Spot: 최대 90% 할인Preemptible/Spot: 최대 91% 할인Spot: 최대 90% 할인
지속 사용 할인없음자동 (최대 30%)없음
프리 티어12개월 무료 + Always Free12개월 무료 + Always Free12개월 무료 + Always Free

7.2 프리 티어 비교

AWS 프리 티어 (12개월):
- EC2: t2.micro 750시간/- S3: 5GB
- RDS: db.t2.micro 750시간/- Lambda: 100만 요청/ (Always Free)
- DynamoDB: 25GB + 25 WCU/RCU (Always Free)

GCP 프리 티어 (12개월):
- GCE: e2-micro (Always Free, US 리전)
- Cloud Storage: 5GB (Always Free)
- BigQuery: 1TB 쿼리/ (Always Free)
- Cloud Functions: 200만 호출/ (Always Free)
- Firestore: 1GB 저장 (Always Free)

Azure 프리 티어 (12개월):
- VM: B1s 750시간/- Blob: 5GB
- Azure SQL: 250GB S0 인스턴스
- Functions: 100만 요청/ (Always Free)
- Cosmos DB: 1000 RU/s + 25GB (Always Free)

7.3 비용 최적화 전략

비용 최적화 공통 전략:

1. 적절한 인스턴스 크기 선택 (Right-sizing)
   - AWS: Compute Optimizer
   - GCP: Recommender
   - Azure: Advisor

2. 예약 인스턴스 / 약정 할인 활용
   - 안정적 워크로드: 1-3년 약정으로 최대 72% 절감

3. Spot/Preemptible 인스턴스 활용
   - 배치 처리, CI/CD, 비중요 워크로드에 적합
   - 최대 90% 비용 절감

4. 자동 스케일링 설정
   - 비사용 시간에 자동 축소

5. 스토리지 수명 주기 정책
   - 오래된 데이터를 자동으로 저렴한 티어로 이동

6. 비용 모니터링 도구 활용
   - AWS: Cost Explorer, Budgets
   - GCP: Billing Reports, Budgets
   - Azure: Cost Management

8. 강점과 약점 분석

8.1 AWS 강점과 약점

강점:

  • 서비스 범위: 200+ 서비스로 가장 넓은 포트폴리오
  • 시장 성숙도: 가장 오래된 클라우드 (2006년 시작), 가장 큰 커뮤니티
  • 글로벌 인프라: 33개 리전, 100+ 가용 영역
  • 파트너 생태계: 가장 많은 ISV, SI 파트너
  • Graviton: ARM 기반 프로세서로 비용 대비 최고 성능

약점:

  • 과금 구조가 복잡 (서비스 간 데이터 전송 비용 특히)
  • 콘솔 UX가 GCP 대비 복잡
  • 관리형 Kubernetes(EKS)가 GKE 대비 설정 복잡
  • 네이티브 데이터 분석이 BigQuery 대비 약함

8.2 GCP 강점과 약점

강점:

  • 데이터/AI: BigQuery, Vertex AI, TPU로 데이터 분석/ML 최강
  • Kubernetes: GKE Autopilot이 가장 성숙한 관리형 K8s
  • 네트워크: Google의 글로벌 네트워크 (해저 케이블 보유)
  • 비용 투명성: 지속 사용 할인 자동 적용, 커스텀 머신 타입
  • 개발자 경험: 깔끔한 콘솔 UX, 우수한 문서

약점:

  • 서비스 범위가 AWS/Azure 대비 좁음
  • 엔터프라이즈 지원 성숙도가 AWS/Azure 대비 낮음
  • 서비스 폐기(Deprecation) 이력이 많아 신뢰도 우려
  • 일부 리전에서 가용 영역 수가 적음

8.3 Azure 강점과 약점

강점:

  • 엔터프라이즈: Active Directory 통합, Office 365/Teams 연동
  • 하이브리드 클라우드: Azure Arc, Azure Stack으로 온프레미스 통합
  • 규정 준수: 정부/금융/의료 규정 준수 인증 가장 다양
  • OpenAI 파트너십: GPT-4o 독점 접근
  • Windows 워크로드: .NET, SQL Server 최적화

약점:

  • 안정성 이슈가 AWS/GCP 대비 잦음 (특히 2024년 대규모 장애)
  • 일부 서비스의 문서가 AWS/GCP 대비 부족
  • Linux 워크로드에서 AWS/GCP 대비 비용 경쟁력 낮음
  • 콘솔이 복잡하고 느림

9. 자격증 로드맵

9.1 AWS 자격증

AWS 자격증 로드맵:

입문: Cloud Practitioner (CLF-C02)
중급: Solutions Architect Associate (SAA-C03)  ← 가장 인기
중급: Developer Associate (DVA-C02)
중급: SysOps Administrator Associate
고급: Solutions Architect Professional (SAP-C02)
고급: DevOps Engineer Professional
전문: Security Specialty / Database Specialty / ML Specialty

9.2 GCP 자격증

GCP 자격증 로드맵:

입문: Cloud Digital Leader
중급: Associate Cloud Engineer (ACE)  ← 가장 인기
고급: Professional Cloud Architect (PCA)
고급: Professional Data Engineer
고급: Professional ML Engineer
전문: Professional Cloud Security Engineer

9.3 Azure 자격증

Azure 자격증 로드맵:

입문: Azure Fundamentals (AZ-900)
중급: Azure Administrator (AZ-104)  ← 가장 인기
중급: Azure Developer (AZ-204)
고급: Azure Solutions Architect Expert (AZ-305)
전문: Azure Security Engineer (AZ-500)
전문: Azure AI Engineer (AI-102)

9.4 자격증 비교

항목AWS SAAGCP ACEAzure AZ-104
난이도중간중간중간
시험 비용$150$200$165
유효 기간3년2년 (재인증 시 3년)1년 (무료 갱신)
추천 학습 기간2-3개월2-3개월2-3개월
시장 가치가장 높음데이터/K8s 분야에서 높음엔터프라이즈에서 높음

10. 의사결정 프레임워크

10.1 시나리오별 추천

시나리오별 클라우드 추천:

스타트업 (초기 단계):
AWS: 가장 넓은 프리 티어, 크레딧 프로그램, 방대한 튜토리얼
GCP: $300 크레딧, Firebase 무료 티어 (모바일 앱에 적합)

데이터/AI 중심 팀:
GCP: BigQuery + Vertex AI + TPU 조합이 압도적
AWS: SageMaker + Bedrock도 강력하지만 비용 높음

엔터프라이즈 (기존 MS 환경):
Azure: AD 통합, Office 365, Hybrid Benefit이 결정적
AWS: MS 환경이 없는 엔터프라이즈에 적합

Kubernetes 중심 아키텍처:
GCP: GKE Autopilot이 최고의 K8s 경험 제공
AWS: EKS + Karpenter도 좋지만 설정 복잡

규정 준수가 중요한 경우 (정부/금융/의료):
Azure: 가장 많은 규정 준수 인증 보유
AWS: GovCloud로 정부 워크로드 지원

게임/미디어:
AWS: GameLift, IVS 등 전문 서비스
GCP: Google 네트워크 성능 + Game Servers

비용 최우선:
GCP: 지속 사용 할인 + 커스텀 머신 타입
AWS: Graviton + Spot Instances 조합

10.2 의사결정 플로우차트

클라우드 선택 의사결정:

Q1: 기존 Microsoft 환경(AD, Office 365)이 있나?
YesAzure (Hybrid Benefit + AD 통합)
NoQ2
Q2: 주요 워크로드가 데이터 분석/AI인가?
YesGCP (BigQuery + Vertex AI)
NoQ3
Q3: Kubernetes가 핵심 인프라인가?
YesGCP (GKE Autopilot)
NoQ4
Q4: 서비스 다양성과 생태계가 중요한가?
YesAWS (200+ 서비스)
NoQ5
Q5: 예산이 가장 중요한 제약 조건인가?
YesGCP (지속 사용 할인) 또는 AWS (Graviton)
NoAWS (가장 안정적, 가장 넓은 파트너 생태계)

11. 멀티클라우드 및 하이브리드 전략

11.1 멀티클라우드를 고려해야 하는 경우

멀티클라우드가 필요한 시나리오:

1. 벤더 종속(Lock-in) 방지
   - 핵심 서비스를 특정 클라우드에 의존하지 않음
   - Kubernetes + Terraform으로 이식성 확보

2. Best-of-Breed 접근
   - AI/ML: GCP (BigQuery + Vertex AI)
   - 백엔드 인프라: AWS (EC2 + Lambda)
   - ID/접근 관리: Azure (Active Directory)

3. 규정 준수
   - 데이터 주권: 특정 리전에만 데이터 저장
   - 다중 클라우드로 규정 충족

4. 재해 복구 (DR)
   - 한 클라우드 장애 시 다른 클라우드로 전환
   - Active-Active 또는 Active-Passive DR

11.2 멀티클라우드 기술 스택

멀티클라우드 기술 스택:

IaC (Infrastructure as Code):
- Terraform: 모든 클라우드 지원, 가장 인기
- Pulumi: 프로그래밍 언어로 IaC 작성

컨테이너 오케스트레이션:
- Kubernetes: 모든 클라우드에서 실행
- Istio/Linkerd: 서비스 메시로 크로스 클라우드 통신

CI/CD:
- GitHub Actions: 클라우드 독립적
- GitLab CI: 자체 호스팅 가능

모니터링:
- Datadog: 멀티클라우드 통합 모니터링
- Grafana + Prometheus: 오픈소스 대안

서비스 메시:
- Istio: 크로스 클라우드 트래픽 관리
- Consul: 서비스 디스커버리 + 멀티클라우드

11.3 멀티클라우드 주의사항

멀티클라우드는 복잡성을 크게 증가시킵니다. 다음을 고려하세요:

  • 운영 팀의 역량: 2-3개 클라우드 전문가가 필요
  • 네트워크 비용: 클라우드 간 데이터 전송 비용이 높음
  • 일관성: 보안 정책, IAM, 로깅을 통합 관리해야 함
  • 최소 2개 팀의 합의 없이 멀티클라우드 도입은 위험

현실적 조언: 대부분의 조직에서는 하나의 주력 클라우드 + 특수 용도로 1-2개 서비스만 사용하는 것이 최적입니다. 진정한 멀티클라우드는 대기업에서만 필요합니다.


12. 면접 예상 질문 15선

기초 질문

Q1: AWS, GCP, Azure의 핵심 차이점을 간략히 설명하세요.

AWS는 가장 넓은 서비스 포트폴리오(200+ 서비스)와 가장 큰 시장 점유율을 보유합니다. GCP는 데이터 분석(BigQuery), AI/ML(Vertex AI, TPU), Kubernetes(GKE)에서 강점이 있습니다. Azure는 Microsoft 생태계(AD, Office 365) 통합과 엔터프라이즈/하이브리드 클라우드에서 강점이 있습니다.

Q2: 서버리스 컴퓨팅이란 무엇이며 각 클라우드의 서비스를 비교하세요.

서버리스는 서버 관리 없이 코드를 실행하는 모델입니다. AWS Lambda(최대 15분, 가장 넓은 이벤트 소스), GCP Cloud Functions(최대 60분 2nd gen, Cloud Run 기반), Azure Functions(Durable Functions로 상태 보존 워크플로). Lambda가 가장 성숙하고, Cloud Functions가 콜드 스타트가 가장 짧습니다.

Q3: 각 클라우드의 프리 티어 차이점은?

AWS: EC2 t2.micro 750시간, S3 5GB, Lambda 100만 요청 Always Free. GCP: e2-micro Always Free(US), BigQuery 1TB/월 Always Free, Cloud Functions 200만 호출. Azure: B1s VM 750시간, 250GB SQL, Functions 100만 요청. GCP의 Always Free 범위가 가장 넓습니다.

Q4: 벤더 종속(Vendor Lock-in)이란 무엇이며 어떻게 완화하나요?

벤더 종속은 특정 클라우드의 독점 서비스에 의존하여 다른 클라우드로 이전이 어려운 상태입니다. 완화 방법: 1) Kubernetes + Terraform 사용, 2) 오픈 표준 기반 기술 선택 (PostgreSQL vs Aurora), 3) 추상화 레이어 도입, 4) 컨테이너 기반 배포.

Q5: Reserved Instance vs Spot Instance의 차이를 설명하세요.

Reserved Instance는 1-3년 약정으로 최대 72% 할인받는 모델로, 안정적 워크로드에 적합합니다. Spot Instance는 유휴 용량을 최대 90% 할인으로 사용하지만, 언제든 회수될 수 있어 배치 처리, CI/CD 등 중단 가능한 워크로드에 적합합니다.

중급 질문

Q6: BigQuery가 Redshift보다 데이터 분석에 유리한 이유는?

BigQuery는 완전 서버리스로 인프라 관리가 불필요하고, 스캔 데이터량 기반 과금으로 비용 예측이 용이합니다. 스토리지와 컴퓨팅이 분리되어 독립적으로 확장 가능하며, 머신러닝 모델을 SQL로 직접 실행(BigQuery ML)할 수 있습니다. Redshift는 클러스터 크기를 미리 프로비저닝해야 합니다.

Q7: GKE가 EKS/AKS보다 Kubernetes 경험이 우수한 이유는?

Google이 Kubernetes를 만들었기에 가장 빠른 버전 지원을 제공합니다. GKE Autopilot은 노드 관리를 완전 자동화하여 Pod 단위 과금이 가능합니다. 네트워킹 성능이 우수하고, Anthos Service Mesh가 관리형으로 제공됩니다. EKS는 제어 플레인 비용이 발생하고 설정이 복잡합니다.

Q8: Azure가 엔터프라이즈 시장에서 강한 이유는?

Active Directory 통합으로 기존 ID 관리 시스템과 원활하게 연동됩니다. Office 365, Teams, Dynamics 365와의 통합이 자연스럽습니다. Azure Arc와 Azure Stack으로 온프레미스-클라우드 하이브리드 운영이 가능합니다. Windows Server Hybrid Benefit으로 기존 라이선스 비용을 절감할 수 있습니다.

Q9: 멀티클라우드 전략의 장단점을 설명하세요.

장점: 벤더 종속 방지, Best-of-Breed 서비스 활용, 재해 복구 강화, 규정 준수 용이. 단점: 운영 복잡성 증가, 전문 인력 필요, 네트워크 비용 증가, 보안 정책 일관성 유지 어려움. 대부분의 조직에서는 하나의 주력 클라우드를 권장합니다.

Q10: 클라우드 비용 최적화 전략 5가지를 설명하세요.

  1. Right-sizing: Compute Optimizer/Recommender로 적절한 인스턴스 크기 선택. 2) 예약 인스턴스/CUD로 안정 워크로드 할인. 3) Spot/Preemptible로 비중요 워크로드 비용 절감. 4) 자동 스케일링으로 비사용 시간 축소. 5) 스토리지 수명 주기 정책으로 저렴한 티어 자동 이동.

심화 질문

Q11: Cosmos DB와 DynamoDB의 아키텍처 차이를 설명하세요.

DynamoDB는 키-값 + 문서 모델 전용이며, 일관된 단일 자릿수 ms 지연을 보장합니다. Global Tables로 멀티 리전 복제가 가능합니다. Cosmos DB는 멀티 모델(문서, 키-값, 그래프, 컬럼)을 지원하고, 5가지 일관성 레벨(Strong ~ Eventual)을 선택할 수 있습니다. 턴키 글로벌 분산이 강점입니다.

Q12: 클라우드 마이그레이션 전략(6R)을 설명하세요.

  1. Rehost (Lift and Shift): 변경 없이 이전. 2) Replatform: 최소한의 최적화 후 이전. 3) Refactor: 클라우드 네이티브로 재설계. 4) Repurchase: SaaS로 전환. 5) Retain: 온프레미스 유지. 6) Retire: 폐기. 대부분 Rehost로 시작하여 점진적으로 Refactor합니다.

Q13: Terraform으로 멀티클라우드를 관리하는 방법을 설명하세요.

Terraform은 HCL로 인프라를 정의하고, Provider를 통해 AWS/GCP/Azure 모두 지원합니다. State 관리는 원격 백엔드(S3, GCS 등)를 사용하고, Module로 재사용 가능한 인프라 컴포넌트를 정의합니다. Workspace로 환경(dev/staging/prod)을 분리합니다.

Q14: 각 클라우드의 AI/ML 생태계를 비교하세요.

AWS: SageMaker(ML 플랫폼) + Bedrock(LLM, Claude/Llama) — 가장 넓은 프레임워크 지원. GCP: Vertex AI + BigQuery ML + TPU + Gemini — 데이터 분석과 ML의 통합이 최강. Azure: Azure ML + Azure OpenAI(GPT-4o 독점) — 엔터프라이즈 생성형 AI에서 최강.

Q15: 클라우드 네이티브 애플리케이션 설계 원칙을 설명하세요.

12-Factor App 원칙을 기반으로: 1) 마이크로서비스 아키텍처. 2) 컨테이너 기반 배포. 3) CI/CD 자동화. 4) 인프라의 코드화(IaC). 5) 상태 비저장(Stateless) 설계. 6) 관측성(Observability) 내장. 7) 자동 스케일링. 8) 장애 격리(Circuit Breaker 등). 9) 선언적 API. 10) 이벤트 기반 비동기 처리.


13. 퀴즈

Q1: 2025년 기준 글로벌 클라우드 시장 점유율 1위는?

AWS (약 31%) 입니다. 2006년 S3와 EC2 출시 이후 가장 오래된 퍼블릭 클라우드로서 가장 넓은 서비스 포트폴리오를 보유하고 있습니다. 2위 Azure(25%), 3위 GCP(11%)가 뒤를 잇습니다.

Q2: Kubernetes를 사용한다면 어떤 클라우드가 가장 적합한가?

GCP의 GKE(Google Kubernetes Engine) 가 가장 적합합니다. Google이 Kubernetes를 만들었기에 가장 빠른 버전 지원, Autopilot 모드의 완전 관리형 경험, 우수한 네트워킹 성능을 제공합니다. Autopilot은 Pod 단위 과금으로 비용 최적화도 우수합니다.

Q3: 엔터프라이즈에서 Microsoft 환경을 사용 중이라면?

Azure가 가장 적합합니다. Active Directory 통합, Office 365/Teams 연동, Windows Server Hybrid Benefit(기존 라이선스 비용 절감), Azure Arc/Stack으로 하이브리드 클라우드 구현이 가능합니다. 정부/금융/의료 규정 준수 인증도 가장 다양합니다.

Q4: 데이터 분석과 AI/ML 중심이라면 어떤 클라우드가 좋은가?

GCP가 가장 적합합니다. BigQuery(서버리스 데이터 웨어하우스, 1TB/월 무료 쿼리), Vertex AI(통합 ML 플랫폼), TPU(텐서 처리 장치), Gemini(멀티모달 LLM)의 조합이 압도적입니다. BigQuery ML로 SQL만으로 ML 모델을 학습/배포할 수 있습니다.

Q5: 벤더 종속을 방지하는 기술 스택은?

Kubernetes + Terraform + 오픈 표준 기반 기술입니다. Kubernetes로 컨테이너 오케스트레이션을 표준화하고, Terraform(HCL)으로 인프라를 정의하면 클라우드 간 이식성이 높아집니다. 데이터베이스는 PostgreSQL 같은 오픈소스를 사용하고, 모니터링은 Prometheus + Grafana를 사용하면 벤더 독립적인 스택을 구성할 수 있습니다.


참고 자료

AWS vs GCP vs Azure Complete Comparison 2025: Service Mapping, Pricing, Certifications, and Decision Framework

Introduction: Cloud Market 2025

The global cloud market in 2025 has surpassed approximately $600 billion. The market share of the three major cloud vendors:

VendorMarket Share (2025 Q1)Annual Revenue
AWS (Amazon)~31%~$100B
Azure (Microsoft)~25%~$80B
GCP (Google)~11%~$40B

AWS still leads, but Azure is growing rapidly in the enterprise market, and GCP has established a strong position in data/AI/ML and Kubernetes.

Which cloud should you choose? This guide maps all three clouds service-by-service and provides a complete comparison of pricing, strengths/weaknesses, certifications, and decision frameworks.


1. Service Mapping: 30+ Services Compared 1:1

1.1 Compute

FunctionAWSGCPAzure
Virtual MachinesEC2Compute Engine (GCE)Virtual Machines
Serverless FunctionsLambdaCloud FunctionsAzure Functions
Container ServiceECS / FargateCloud RunContainer Apps
KubernetesEKSGKEAKS
Batch ProcessingBatchCloud BatchAzure Batch
Edge ComputingLambda@EdgeCloud CDN FunctionsAzure Edge Zones

1.2 Storage

FunctionAWSGCPAzure
Object StorageS3Cloud Storage (GCS)Blob Storage
Block StorageEBSPersistent DiskManaged Disks
File StorageEFSFilestoreAzure Files
ArchiveS3 GlacierArchive StorageCool/Archive Blob
CDNCloudFrontCloud CDNAzure CDN / Front Door

1.3 Database

FunctionAWSGCPAzure
Relational DBRDS / AuroraCloud SQL / AlloyDBAzure SQL / Flexible Server
NoSQL (Document)DynamoDBFirestoreCosmos DB
NoSQL (Wide Column)DynamoDBBigtableCosmos DB (Cassandra API)
In-MemoryElastiCacheMemorystoreAzure Cache for Redis
Data WarehouseRedshiftBigQuerySynapse Analytics
Graph DBNeptune-Cosmos DB (Gremlin API)

1.4 AI/ML

FunctionAWSGCPAzure
ML PlatformSageMakerVertex AIAzure ML
Pre-trained AIRekognition, ComprehendVision AI, Natural LanguageCognitive Services
LLM ServiceBedrockVertex AI (Gemini)Azure OpenAI
Data AnalyticsAthena + GlueBigQuerySynapse Analytics
AutoMLSageMaker AutopilotVertex AI AutoMLAzure AutoML

1.5 Networking

FunctionAWSGCPAzure
VPCVPCVPCVirtual Network (VNet)
Load BalancerALB / NLB / GLBCloud Load BalancingApplication Gateway / LB
DNSRoute 53Cloud DNSAzure DNS
VPNVPN GatewayCloud VPNVPN Gateway
Dedicated ConnectionDirect ConnectCloud InterconnectExpressRoute
API ManagementAPI GatewayApigee / API GatewayAPI Management

1.6 Serverless and Events

FunctionAWSGCPAzure
FaaSLambdaCloud FunctionsAzure Functions
Event BusEventBridgeEventarcEvent Grid
Message QueueSQSCloud Tasks / Pub/SubQueue Storage / Service Bus
Pub/SubSNSPub/SubEvent Grid / Service Bus
WorkflowStep FunctionsWorkflowsLogic Apps / Durable Functions

1.7 DevOps and Monitoring

FunctionAWSGCPAzure
CI/CDCodePipeline / CodeBuildCloud BuildAzure DevOps / GitHub Actions
IaCCloudFormation / CDKDeployment Manager / TerraformARM Templates / Bicep
MonitoringCloudWatchCloud MonitoringAzure Monitor
LoggingCloudWatch LogsCloud LoggingLog Analytics
TracingX-RayCloud TraceApplication Insights
SecretsSecrets ManagerSecret ManagerKey Vault

2. Compute Deep Dive

2.1 Virtual Machines: EC2 vs GCE vs Azure VM

Performance Comparison (4 vCPU, 16GB Memory):

AWS EC2 (m6i.xlarge):
- vCPU: 4, Memory: 16GB
- On-demand: ~$0.192/hr (~$140/mo)
- Network: up to 12.5 Gbps

GCP GCE (n2-standard-4):
- vCPU: 4, Memory: 16GB
- On-demand: ~$0.194/hr (~$142/mo)
- Custom Machine Types: independently adjust CPU/memory (GCP exclusive!)

Azure VM (D4s v5):
- vCPU: 4, Memory: 16GB
- On-demand: ~$0.192/hr (~$140/mo)
- Hybrid Benefit: up to 40% discount with existing Windows Server license

Key Differences:

  • AWS: Most diverse instance types (500+). Graviton (ARM) processors offer best price-performance
  • GCP: Custom machine types for flexible resource allocation. Sustained Use Discounts applied automatically
  • Azure: Optimized for Windows workloads. Hybrid Benefit leverages existing licenses

2.2 Serverless: Lambda vs Cloud Functions vs Azure Functions

Serverless Function Comparison:

AWS Lambda:
- Max execution: 15 minutes
- Memory: 128MB - 10GB
- Concurrency: 1,000 (default, can be increased)
- Cold start: Medium (improved with SnapStart)
- Provisioned Concurrency supported

GCP Cloud Functions (2nd gen):
- Max execution: 60 minutes (2nd gen)
- Memory: 128MB - 32GB
- Concurrency: up to 1,000 requests per instance
- Cold start: Shortest
- Cloud Run-based scaling

Azure Functions:
- Max execution: Unlimited (Premium Plan)
- Memory: 1.5GB - 14GB
- Concurrency: 200 (default)
- Durable Functions: stateful workflows
- Excellent Visual Studio integration

3. Storage Deep Dive

3.1 Object Storage: S3 vs GCS vs Blob Storage

ItemAWS S3GCP Cloud StorageAzure Blob Storage
Durability99.999999999% (11 9's)99.999999999%99.999999999%
Storage ClassesStandard, IA, Glacier, Deep ArchiveStandard, Nearline, Coldline, ArchiveHot, Cool, Cold, Archive
Price (GB/mo)Standard: $0.023Standard: $0.020Hot: $0.018
Egress Cost$0.09/GB$0.12/GB$0.087/GB
StrengthMost mature ecosystemLowest storage costAzure integration

3.2 Block Storage

Block Storage Comparison:

AWS EBS (gp3):
- IOPS: 3,000 baseline (max 16,000)
- Throughput: 125 MB/s baseline (max 1,000 MB/s)
- Price: $0.08/GB/mo
- Snapshots: incremental backup

GCP Persistent Disk (pd-ssd):
- IOPS: proportional to disk size
- Throughput: proportional to disk size
- Price: $0.17/GB/mo (SSD)
- Feature: multi-instance attachment

Azure Managed Disks (Premium SSD v2):
- IOPS: up to 80,000
- Throughput: up to 1,200 MB/s
- Price: $0.132/GB/mo
- Feature: independent IOPS/throughput provisioning

4. Database Deep Dive

4.1 Relational DB: Aurora vs AlloyDB vs Azure SQL

ItemAWS AuroraGCP AlloyDBAzure SQL
EngineMySQL, PostgreSQLPostgreSQLSQL Server, PostgreSQL
Performance5x MySQL, 3x PostgreSQL4x PostgreSQLBest SQL Server perf
StorageAuto-scale (max 128TB)Auto-scaleAuto-scale (max 100TB)
ReplicasUp to 15 read replicasUp to 20 read replicasActive geo-replication
ServerlessAurora Serverless v2NoAzure SQL Serverless
StrengthMaturity, compatibilityAI integration, perfSQL Server workloads

4.2 NoSQL: DynamoDB vs Firestore vs Cosmos DB

NoSQL Comparison:

AWS DynamoDB:
- Model: Key-value + Document
- Latency: Single-digit ms
- Capacity: On-demand / Provisioned
- Global Tables: multi-region replication
- DAX: in-memory cache layer
- Strength: massive traffic handling, consistent performance

GCP Firestore:
- Model: Document (collections + documents)
- Latency: few ms
- Real-time sync: built-in (mobile/web)
- Offline support: native
- Strength: mobile/web app development, real-time features

Azure Cosmos DB:
- Model: Multi-model (document, key-value, graph, column)
- API: SQL, MongoDB, Cassandra, Gremlin, Table
- Global distribution: turnkey multi-region
- Consistency: 5 levels selectable
- Strength: multi-model flexibility, global distribution

4.3 Data Warehouse: Redshift vs BigQuery vs Synapse

ItemAWS RedshiftGCP BigQueryAzure Synapse
ArchitectureCluster-basedServerlessServerless + Dedicated
PricingNode hoursData scannedQuery-based / Provisioned
ScalabilityManual cluster resizingFully automaticAuto / Manual
Price (1TB query)Cluster-dependent$5/TBQuery-dependent
StrengthBI tool integrationSpeed, cost efficiencyMS ecosystem integration

BigQuery's overwhelming advantage: Serverless architecture requires no infrastructure management, petabyte-scale data queried in seconds, scan-based pricing makes costs predictable.


5. AI/ML Services Comparison

5.1 ML Platform: SageMaker vs Vertex AI vs Azure ML

ItemAWS SageMakerGCP Vertex AIAzure ML
NotebooksSageMaker StudioWorkbenchAzure ML Studio
AutoMLAutopilotAutoMLAutoML
TrainingDistributed, Spot supportTPU support, distributedDistributed, GPU clusters
DeploymentEndpoints, serverless inferenceEndpoints, batch predictionManaged endpoints
MLOpsPipelines, Model RegistryPipelines, Model RegistryMLflow integration
LLMBedrock (Claude, Llama, etc.)Gemini, Model GardenAzure OpenAI (GPT-4o)
StrengthWidest framework supportTPU, BigQuery integrationOpenAI partnership

5.2 LLM/Generative AI Comparison

LLM Service Comparison:

AWS Bedrock:
- Models: Claude (Anthropic), Llama, Titan, Mistral
- Strength: diverse model selection, model customization
- Fine-tuning: supported
- RAG: Knowledge Bases feature

GCP Vertex AI:
- Models: Gemini (Google), PaLM 2
- Strength: Google Search integration, Grounding
- Fine-tuning: supported
- Multimodal: Gemini image/video understanding

Azure OpenAI:
- Models: GPT-4o, GPT-4, DALL-E, Whisper
- Strength: exclusive OpenAI partnership
- Fine-tuning: supported
- Enterprise: strongest security/compliance

6. Kubernetes: EKS vs GKE vs AKS

6.1 Managed Kubernetes Comparison

ItemAWS EKSGCP GKEAzure AKS
Control Plane Cost0.10/hr(0.10/hr (73/mo)Free (Standard)Free
Node AutoscalingKarpenter (recommended)Autopilot (fully automatic)KEDA / Cluster Autoscaler
Service MeshApp Mesh / IstioAnthos Service Mesh (managed)Istio (managed)
NetworkingVPC CNIVPC-nativeAzure CNI
Logging/MonitoringCloudWatch + PrometheusCloud Operations (integrated)Azure Monitor + Prometheus
StrengthAWS service integrationMost mature K8s, AutopilotAzure AD integration, cost

Why GKE is the gold standard for Kubernetes: Google created Kubernetes, providing the fastest version support, Autopilot mode with full management, and superior networking performance.

6.2 Kubernetes Architecture Comparison

GKE Autopilot (Recommended):
+---------------------------------+
|  Google-managed Control Plane   |
|  + Automated node management    |
|  + Per-pod billing              |
|  + Auto security hardening      |
+----------+----------------------+
           |
     +-----v-----+
     |  Workloads |
     |  (Pods)    |
     +-----------+

EKS with Karpenter:
+---------------------------------+
|  AWS-managed Control Plane      |
|  ($73/mo)                       |
+----------+----------------------+
           |
  +--------v--------+
  |    Karpenter     |
  | (auto node       |
  |  provisioning)   |
  +--------+---------+
           |
     +-----v-----+
     |   Nodes    |
     |  + Pods    |
     +-----------+

AKS:
+---------------------------------+
|  Azure-managed Control Plane    |
|  (Free)                         |
+----------+----------------------+
           |
  +--------v--------+
  |   Node Pools     |
  | + Azure AD       |
  |   integration    |
  +------------------+

7. Pricing Comparison

7.1 Pricing Model Comparison

Pricing TypeAWSGCPAzure
On-demandPer hour/secondPer second (min 1 min)Per minute
Reserved (1yr)Up to 40% offCUD: up to 37% offUp to 40% off
Reserved (3yr)Up to 60% offCUD: up to 55% offUp to 72% off
Spot/PreemptibleSpot: up to 90% offPreemptible/Spot: up to 91% offSpot: up to 90% off
Sustained UseNoneAutomatic (up to 30%)None
Free Tier12-month free + Always Free12-month free + Always Free12-month free + Always Free

7.2 Free Tier Comparison

AWS Free Tier (12 months):
- EC2: t2.micro 750 hrs/mo
- S3: 5GB
- RDS: db.t2.micro 750 hrs/mo
- Lambda: 1M requests/mo (Always Free)
- DynamoDB: 25GB + 25 WCU/RCU (Always Free)

GCP Free Tier (12 months):
- GCE: e2-micro (Always Free, US regions)
- Cloud Storage: 5GB (Always Free)
- BigQuery: 1TB queries/mo (Always Free)
- Cloud Functions: 2M invocations/mo (Always Free)
- Firestore: 1GB storage (Always Free)

Azure Free Tier (12 months):
- VM: B1s 750 hrs/mo
- Blob: 5GB
- Azure SQL: 250GB S0 instance
- Functions: 1M requests/mo (Always Free)
- Cosmos DB: 1000 RU/s + 25GB (Always Free)

7.3 Cost Optimization Strategies

Common Cost Optimization Strategies:

1. Right-sizing
   - AWS: Compute Optimizer
   - GCP: Recommender
   - Azure: Advisor

2. Reserved Instances / Committed Use Discounts
   - Stable workloads: up to 72% savings with 1-3 year commitments

3. Spot/Preemptible Instances
   - Best for batch processing, CI/CD, non-critical workloads
   - Up to 90% cost savings

4. Auto-scaling Configuration
   - Automatic scale-down during off-hours

5. Storage Lifecycle Policies
   - Auto-transition old data to cheaper tiers

6. Cost Monitoring Tools
   - AWS: Cost Explorer, Budgets
   - GCP: Billing Reports, Budgets
   - Azure: Cost Management

8. Strengths and Weaknesses Analysis

8.1 AWS

Strengths:

  • Service breadth: 200+ services, widest portfolio
  • Market maturity: Oldest cloud (since 2006), largest community
  • Global infrastructure: 33 regions, 100+ availability zones
  • Partner ecosystem: Most ISV and SI partners
  • Graviton: ARM-based processors with best price-performance ratio

Weaknesses:

  • Complex pricing structure (especially inter-service data transfer costs)
  • Console UX more complex than GCP
  • EKS setup more complex than GKE
  • Native data analytics weaker than BigQuery

8.2 GCP

Strengths:

  • Data/AI: BigQuery, Vertex AI, TPU make it the strongest for analytics/ML
  • Kubernetes: GKE Autopilot is the most mature managed K8s
  • Network: Google's global network (owns submarine cables)
  • Cost transparency: Automatic sustained use discounts, custom machine types
  • Developer experience: Clean console UX, excellent documentation

Weaknesses:

  • Narrower service range than AWS/Azure
  • Enterprise support maturity lower than AWS/Azure
  • Service deprecation history raises trust concerns
  • Fewer availability zones in some regions

8.3 Azure

Strengths:

  • Enterprise: Active Directory integration, Office 365/Teams integration
  • Hybrid cloud: Azure Arc, Azure Stack for on-premises integration
  • Compliance: Most diverse government/financial/healthcare certifications
  • OpenAI partnership: Exclusive GPT-4o access
  • Windows workloads: .NET, SQL Server optimization

Weaknesses:

  • More frequent stability issues than AWS/GCP (especially 2024 major outages)
  • Some services have weaker documentation than AWS/GCP
  • Less cost-competitive for Linux workloads vs AWS/GCP
  • Console is complex and slow

9. Certification Roadmap

9.1 AWS Certifications

AWS Certification Roadmap:

Entry: Cloud Practitioner (CLF-C02)
  |
Mid: Solutions Architect Associate (SAA-C03)  <- Most popular
  |
Mid: Developer Associate (DVA-C02)
  |
Mid: SysOps Administrator Associate
  |
Advanced: Solutions Architect Professional (SAP-C02)
  |
Advanced: DevOps Engineer Professional
  |
Specialty: Security / Database / ML Specialty

9.2 GCP Certifications

GCP Certification Roadmap:

Entry: Cloud Digital Leader
  |
Mid: Associate Cloud Engineer (ACE)  <- Most popular
  |
Advanced: Professional Cloud Architect (PCA)
  |
Advanced: Professional Data Engineer
  |
Advanced: Professional ML Engineer
  |
Specialty: Professional Cloud Security Engineer

9.3 Azure Certifications

Azure Certification Roadmap:

Entry: Azure Fundamentals (AZ-900)
  |
Mid: Azure Administrator (AZ-104)  <- Most popular
  |
Mid: Azure Developer (AZ-204)
  |
Advanced: Azure Solutions Architect Expert (AZ-305)
  |
Specialty: Azure Security Engineer (AZ-500)
  |
Specialty: Azure AI Engineer (AI-102)

9.4 Certification Comparison

ItemAWS SAAGCP ACEAzure AZ-104
DifficultyMediumMediumMedium
Exam Cost$150$200$165
Validity3 years2 years (3 with renewal)1 year (free renewal)
Study Time2-3 months2-3 months2-3 months
Market ValueHighest overallHigh in data/K8sHigh in enterprise

10. Decision Framework

10.1 Scenario-Based Recommendations

Cloud Recommendations by Scenario:

Startup (Early Stage):
-> AWS: Widest free tier, credit programs, vast tutorials
-> GCP: $300 credits, Firebase free tier (great for mobile apps)

Data/AI-Focused Team:
-> GCP: BigQuery + Vertex AI + TPU combination is overwhelming
-> AWS: SageMaker + Bedrock is strong but more expensive

Enterprise (Existing MS Environment):
-> Azure: AD integration, Office 365, Hybrid Benefit are decisive
-> AWS: Suitable for enterprises without MS environment

Kubernetes-Centric Architecture:
-> GCP: GKE Autopilot provides the best K8s experience
-> AWS: EKS + Karpenter is good but more complex setup

Compliance-Heavy (Government/Finance/Healthcare):
-> Azure: Most compliance certifications
-> AWS: GovCloud for government workloads

Gaming/Media:
-> AWS: GameLift, IVS and specialized services
-> GCP: Google network performance + Game Servers

Cost-First:
-> GCP: Sustained use discounts + custom machine types
-> AWS: Graviton + Spot Instances combination

10.2 Decision Flowchart

Cloud Selection Decision:

Q1: Existing Microsoft environment (AD, Office 365)?
  - Yes -> Azure (Hybrid Benefit + AD integration)
  - No -> Q2

Q2: Primary workload is data analytics/AI?
  - Yes -> GCP (BigQuery + Vertex AI)
  - No -> Q3

Q3: Is Kubernetes your core infrastructure?
  - Yes -> GCP (GKE Autopilot)
  - No -> Q4

Q4: Is service diversity and ecosystem important?
  - Yes -> AWS (200+ services)
  - No -> Q5

Q5: Is budget the primary constraint?
  - Yes -> GCP (sustained use discounts) or AWS (Graviton)
  - No -> AWS (most stable, widest partner ecosystem)

11. Multi-Cloud and Hybrid Strategy

11.1 When to Consider Multi-Cloud

Scenarios Requiring Multi-Cloud:

1. Vendor Lock-in Prevention
   - Avoid dependency on a single cloud for core services
   - Achieve portability with Kubernetes + Terraform

2. Best-of-Breed Approach
   - AI/ML: GCP (BigQuery + Vertex AI)
   - Backend infrastructure: AWS (EC2 + Lambda)
   - Identity management: Azure (Active Directory)

3. Compliance
   - Data sovereignty: store data in specific regions only
   - Multiple clouds to meet regulatory requirements

4. Disaster Recovery (DR)
   - Failover to another cloud during outages
   - Active-Active or Active-Passive DR

11.2 Multi-Cloud Tech Stack

Multi-Cloud Technology Stack:

IaC (Infrastructure as Code):
- Terraform: all-cloud support, most popular
- Pulumi: write IaC in programming languages

Container Orchestration:
- Kubernetes: runs on all clouds
- Istio/Linkerd: service mesh for cross-cloud communication

CI/CD:
- GitHub Actions: cloud-independent
- GitLab CI: self-hostable

Monitoring:
- Datadog: multi-cloud integrated monitoring
- Grafana + Prometheus: open-source alternative

Service Mesh:
- Istio: cross-cloud traffic management
- Consul: service discovery + multi-cloud

11.3 Multi-Cloud Caveats

Multi-cloud significantly increases complexity. Consider:

  • Team capability: need experts in 2-3 clouds
  • Network costs: high inter-cloud data transfer costs
  • Consistency: must unify security policies, IAM, and logging
  • Do not adopt multi-cloud without at least 2 team agreements

Practical advice: For most organizations, one primary cloud + 1-2 services for special purposes is optimal. True multi-cloud is only necessary for large enterprises.


12. Interview Questions (15)

Basic

Q1: Briefly explain the key differences between AWS, GCP, and Azure.

AWS has the widest service portfolio (200+ services) and largest market share. GCP excels in data analytics (BigQuery), AI/ML (Vertex AI, TPU), and Kubernetes (GKE). Azure excels in Microsoft ecosystem integration (AD, Office 365) and enterprise/hybrid cloud.

Q2: What is serverless computing? Compare each cloud's offering.

Serverless lets you run code without managing servers. AWS Lambda (max 15 min, widest event sources), GCP Cloud Functions (max 60 min 2nd gen, Cloud Run-based), Azure Functions (Durable Functions for stateful workflows). Lambda is most mature; Cloud Functions has shortest cold starts.

Q3: What are the free tier differences across clouds?

AWS: EC2 t2.micro 750 hrs, S3 5GB, Lambda 1M requests Always Free. GCP: e2-micro Always Free (US), BigQuery 1TB/mo Always Free, Cloud Functions 2M invocations. Azure: B1s VM 750 hrs, 250GB SQL, Functions 1M requests. GCP has the widest Always Free scope.

Q4: What is vendor lock-in and how do you mitigate it?

Vendor lock-in means depending on a cloud's proprietary services, making migration difficult. Mitigation: 1) Use Kubernetes + Terraform, 2) Choose open standard technologies (PostgreSQL vs Aurora), 3) Introduce abstraction layers, 4) Container-based deployments.

Q5: Explain the difference between Reserved Instances and Spot Instances.

Reserved Instances offer up to 72% discount with 1-3 year commitments, suitable for stable workloads. Spot Instances use idle capacity at up to 90% discount but can be reclaimed anytime, suitable for batch processing, CI/CD, and interruptible workloads.

Intermediate

Q6: Why is BigQuery better than Redshift for data analytics?

BigQuery is fully serverless requiring no infrastructure management, with scan-based pricing for predictable costs. Storage and compute are separated for independent scaling, and ML models can be trained directly with SQL (BigQuery ML). Redshift requires pre-provisioned cluster sizing.

Q7: Why does GKE offer a superior Kubernetes experience over EKS/AKS?

Google created Kubernetes, providing fastest version support. GKE Autopilot fully automates node management with per-pod billing. Superior networking performance and managed Anthos Service Mesh are included. EKS has control plane costs and more complex setup.

Q8: Why is Azure strong in the enterprise market?

Active Directory integration provides seamless connectivity with existing identity management. Natural integration with Office 365, Teams, and Dynamics 365. Azure Arc and Azure Stack enable on-premises/cloud hybrid operations. Windows Server Hybrid Benefit reduces existing license costs.

Q9: Explain the pros and cons of multi-cloud strategy.

Pros: vendor lock-in prevention, best-of-breed services, enhanced DR, easier compliance. Cons: increased operational complexity, specialized staff needed, higher network costs, difficulty maintaining consistent security policies. One primary cloud is recommended for most organizations.

Q10: Describe five cloud cost optimization strategies.

  1. Right-sizing: use Compute Optimizer/Recommender for proper instance sizing. 2) Reserved Instances/CUDs for stable workload discounts. 3) Spot/Preemptible for non-critical workload savings. 4) Auto-scaling for off-hours reduction. 5) Storage lifecycle policies for automatic tier transitions.

Advanced

Q11: Explain the architectural differences between Cosmos DB and DynamoDB.

DynamoDB is key-value + document model only, guaranteeing consistent single-digit ms latency. Global Tables enable multi-region replication. Cosmos DB supports multi-model (document, key-value, graph, column) with 5 consistency levels (Strong to Eventual). Turnkey global distribution is its strength.

Q12: Explain the cloud migration strategy (6Rs).

  1. Rehost (Lift and Shift): migrate without changes. 2) Replatform: minimal optimization before migration. 3) Refactor: redesign as cloud native. 4) Repurchase: switch to SaaS. 5) Retain: keep on-premises. 6) Retire: decommission. Most start with Rehost and progressively Refactor.

Q13: How do you manage multi-cloud with Terraform?

Terraform defines infrastructure in HCL and supports AWS/GCP/Azure through Providers. State management uses remote backends (S3, GCS, etc.), Modules define reusable infrastructure components, and Workspaces separate environments (dev/staging/prod).

Q14: Compare the AI/ML ecosystem of each cloud.

AWS: SageMaker (ML platform) + Bedrock (LLM: Claude/Llama) -- widest framework support. GCP: Vertex AI + BigQuery ML + TPU + Gemini -- strongest data analytics and ML integration. Azure: Azure ML + Azure OpenAI (exclusive GPT-4o) -- strongest for enterprise generative AI.

Q15: Explain cloud-native application design principles.

Based on 12-Factor App principles: 1) Microservices architecture. 2) Container-based deployment. 3) CI/CD automation. 4) Infrastructure as Code. 5) Stateless design. 6) Built-in observability. 7) Auto-scaling. 8) Fault isolation (Circuit Breaker, etc.). 9) Declarative APIs. 10) Event-driven async processing.


13. Quiz

Q1: Which cloud has the largest global market share in 2025?

AWS (approximately 31%). Since launching S3 and EC2 in 2006, it has been the oldest public cloud with the widest service portfolio. Azure (25%) and GCP (11%) follow.

Q2: Which cloud is best for Kubernetes workloads?

GCP's GKE (Google Kubernetes Engine) is the best choice. Since Google created Kubernetes, it provides the fastest version support, fully managed Autopilot mode, and superior networking performance. Autopilot's per-pod billing also optimizes costs.

Q3: Which cloud should an enterprise using Microsoft environment choose?

Azure is the best fit. Active Directory integration, Office 365/Teams connectivity, Windows Server Hybrid Benefit (license cost savings), and Azure Arc/Stack for hybrid cloud implementation. It also has the most diverse government/financial/healthcare compliance certifications.

Q4: Which cloud is best for data analytics and AI/ML?

GCP is the best choice. BigQuery (serverless data warehouse, 1TB/mo free queries), Vertex AI (integrated ML platform), TPU (Tensor Processing Units), and Gemini (multimodal LLM) form an overwhelming combination. BigQuery ML allows training and deploying ML models using just SQL.

Q5: What tech stack prevents vendor lock-in?

Kubernetes + Terraform + open standard technologies. Kubernetes standardizes container orchestration, Terraform (HCL) defines infrastructure for cross-cloud portability. Using open-source databases like PostgreSQL and monitoring with Prometheus + Grafana creates a vendor-independent stack.


References