- Published on
2026년의 데이터 엔지니어링은 더 이상 "데이터 웨어하우스 vs 데이터 레이크"의 시대가 아니다. Apache Iceberg가 2024-25년 테이블 포맷 전쟁의 승자로 떠오르면서 Netflix·Apple·LinkedIn·Stripe·Airbnb가 모두 그 위에 모였고, Databricks는 2024년 6월 Iceberg 공동 창시자 Ryan Blue의 Tabular를 $1B 이상으로 인수해 Delta Lake와 Iceberg를 한 지붕 아래로 끌어들였다. 한쪽에서는 Apache Hudi가 Onehouse라는 상용화 회사를 통해 자기 길을 가고, Flink 팀이 만든 Apache Paimon이 스트리밍 레이크하우스라는 새 카테고리를 정의한다. 처리 엔진은 Spark 4(Spark Connect)와 Flink 2가, 쿼리 엔진은 Trino·Presto·DuckDB·ClickHouse가, 변환은 dbt가, 카탈로그는 Unity Catalog·Polaris·BigLake가 나눠 들고 있다. 이 글은 2026년 데이터 레이크하우스의 풍경을 — 테이블 포맷, 엔진, 카탈로그, 상용 서비스, 한국·일본 사례까지 — 한 호흡으로 정리한다.