- Published on
Pandas를 대체하고 ClickHouse를 임베디드로 가져온 분석 엔진, DuckDB. 이 글은 DuckDB의 내부를 처음부터 해부합니다. Mark Raasveldt와 Hannes Mühleisen의 2018년 CWI 프로젝트부터 2024년 1.0 릴리스까지의 여정, 단일 파일 단일 프로세스 설계, 컬럼나 저장 + Vector(1024 행 chunk), HyPer 스타일 Morsel-Driven 병렬 실행, 쿼리 최적화기와 cost-based join order, DuckDB Storage Format과 compression, Python/R/WASM/Node 바인딩, Parquet/Arrow 네이티브 통합, Polars와의 관계, Pandas 대체 워크플로우, 그리고 MotherDuck 클라우드 확장까지 — 임베디드 OLAP 엔진의 결정판을 제대로 이해하고 싶은 엔지니어를 위한 종합 가이드입니다.