2026년의 검색 엔진 지형은 Algolia가 만든 관리형 시장 위에, Meilisearch·Typesense·Manticore·OpenSearch·Vespa·ParadeDB·Orama 같은 셀프 호스트 대안이 폭발적으로 성장하면서 다시 그려졌다. 이 글은 각 엔진의 강점·약점·요금·성능·언어 토크나이저·RAG 친화도까지 한 호흡으로 정리한다.
2026년 벡터 데이터베이스 시장은 캄브리아기 폭발 그 자체다. Pinecone serverless, Weaviate 1.27, Milvus 2.5, Qdrant 1.13, Chroma 0.5, LanceDB 0.20, pgvector 0.8, Vespa, Turbopuffer까지 — 10개 이상의 진영이 각자의 의견을 들고 시장에 들어왔다. HNSW와 DiskANN, IVF·PQ·SQ 같은 인덱스 알고리즘부터 quantization과 multi-vector retrieval까지, 어떤 워크로드에 어떤 DB를 골라야 하는지 실제 가격·운영 경험을 포함해 한 번에 정리한다.
2026년의 검색 엔진 풍경은 Elasticsearch 한 곳에서 시작해 사방으로 흩어졌다. Meilisearch와 Typesense가 'in-app 검색'을 단순함의 미학으로 가져갔고, AWS는 OpenSearch로 라이선스 우회로를 만들었으며, Quickwit은 S3-native 로그 검색을 들고 나타나 결국 Datadog에 인수됐다. Vespa는 Spotify·Wikipedia·Pinterest가 쓰는 'real-time AI serving search'로 자리를 굳혔고, Algolia는 여전히 SaaS 사이트 검색의 1위다. 그리고 모든 곳에 BM25 + dense vector + reranker의 'hybrid search'가 기본값으로 들어왔다. Cohere Rerank·Voyage·Vespa ColBERTv2가 무엇이고 어디에 쓰는지, 풀텍스트 검색·벡터 DB·둘 다 중 무엇이 필요한지, in-app/log/RAG 시나리오별 솔직한 선택 가이드까지.
2024년에 쓴 '벡터 DB 비교' 글은 이미 낡았다. Pinecone Serverless의 가격 붕괴, Turbopuffer가 S3 위에 띄운 2.5조 벡터, pgvectorscale의 StreamingDiskANN, Qdrant의 RocksDB 제거, Weaviate의 ColBERT 멀티벡터, Milvus 2.6의 GPU 인덱스, Vespa가 Spotify에서 돌리는 실시간 하이브리드, DuckDB VSS의 등장, LanceDB의 컬럼나·임베디드 노선까지 — 2026년 5월 시점의 실제 지형을 비용·아키텍처·선택 기준으로 한 장에 정리한다. '그냥 pgvector 써' 시대의 결정 다이어그램과 안티패턴 포함.