Observability의 모든 것! Three Pillars(로그/메트릭/트레이스), OpenTelemetry, Prometheus+Grafana, ELK Stack, 분산 트레이싱(Jaeger/Tempo), 알림 전략(PagerDuty/OpsGenie), SLO/SLI/SLA, 비용 최적화.
Prometheus TSDB의 내부 구조를 소스코드 레벨에서 분석합니다. WAL 세그먼트 구조, Head Block의 memSeries와 청크 인코딩(XOR, delta-of-delta), 블록 구조, 컴팩션 알고리즘, 인덱스의 posting list까지 깊이 살펴봅니다.
Prometheus와 Alertmanager를 활용한 프로덕션 알림 파이프라인을 구축합니다. PromQL 기반 알림 규칙 작성, Alertmanager 라우팅 트리 설계, PagerDuty·Slack 통합, Alert Fatigue 방지 전략까지 운영 중심으로 다룹니다.