Kubeflow Pipelines를 활용한 ML 워크플로우 오케스트레이션을 실전 중심으로 다룹니다. KFP v2 SDK 아키텍처, 파이프라인 컴포넌트 작성, 캐싱 전략, Argo Workflows/Airflow 비교, 장애 대응까지 프로덕션 환경에서 필요한 전략을 상세히 설명합니다.
MLflow를 활용한 ML 실험 추적, 모델 레지스트리, 배포 파이프라인을 실전 중심으로 다룹니다. Tracking Server 아키텍처부터 자동 로깅, 모델 버전 관리, Kubernetes/Docker 배포까지 프로덕션 환경에서 필요한 MLOps 전략을 상세히 설명합니다.
Event-Driven Architecture의 핵심 패턴(Pub/Sub, Event Streaming, Event Sourcing)을 비교 분석하고, CQRS 패턴과 Event Sourcing을 TypeScript와 Python으로 구현합니다. Kafka, RabbitMQ, NATS 메시지 브로커 비교, Saga 패턴을 이용한 분산 트랜잭션, 이벤트 순서 보장/중복 처리/스키마 진화 등 프로덕션 장애 사례와 체크리스트를 다룹니다.
챗봇의 멀티턴 대화에서 컨텍스트를 효과적으로 유지하는 메모리 관리 전략을 다룹니다. LangChain의 다양한 메모리 타입(Buffer, Summary, Window, Entity)과 LangGraph의 상태 기반 에이전트 아키텍처, 영속 메모리 구현, RAG 연동까지 프로덕션 환경에서의 실전 패턴을 설명합니다.
Terraform 상태 파일의 구조와 Remote Backend(S3/GCS) 설정, State Locking(DynamoDB) 메커니즘, 모듈 설계 패턴(Composition/Registry), Drift Detection 전략을 심층 분석. State 충돌 해결, 마이그레이션 절차, 대규모 인프라 관리 패턴, 장애 사례와 복구 절차, 프로덕션 체크리스트를 다룹니다.