엔터프라이즈 AI 검색 & 지식 플랫폼 2026 완벽 가이드 - Glean·Guru·Coveo·Atlassian Rovo·Notion Atlas·Microsoft 365 Copilot·Slack AI 심층 분석

프롤로그 — "그 문서 어디 있어?"가 2026년에도 풀리지 않은 문제다

매일 회사에서 가장 자주 듣는 말 중 하나.

PM: "지난 분기 OKR 회고 어디 있었지?" 엔지니어: "Confluence 어딘가에... 아니면 Notion?" PM: "Slack에서 누가 공유한 것 같은데." 엔지니어: "검색해도 안 나와요."

2026년, AI 모델은 박사 시험 수준의 추론을 하고 코드를 쓰지만, 우리 회사 안에서 내가 어제 본 문서를 찾는 일은 여전히 미해결이다. 사내 지식은 Slack·Confluence·Drive·Notion·Jira·SharePoint·Salesforce·Zendesk·GitHub에 흩어져 있고, 각 도구의 검색은 자기 도구 안만 본다. 직원의 평균 검색 시간은 IDC 추정으로 주당 9.3시간 — 1주의 1/4이다.

이 글은 2026년 현재 엔터프라이즈 AI 검색 & 지식 플랫폼의 전체 지도를 그린다. RAG over corporate data가 어떻게 직원 생산성을 바꾸는지, Glean·Microsoft 365 Copilot·Atlassian Rovo·Notion Atlas·Slack AI 같은 주요 플레이어가 어디에 위치하는지, 오픈소스 RAG는 어디까지 왔는지, RAG 아키텍처 스택을 어떻게 짜는지, 그리고 우리 팀이 빌드할지 살지를 어떻게 결정할지까지.

1장 · 왜 엔터프라이즈 AI 검색이 2026년 가장 뜨거운 시장인가

이유는 단순하다. 사내 지식 사일로는 가장 비싼 문제이고, RAG가 처음으로 그걸 풀 수 있게 됐다.

세 가지 흐름이 겹쳤다.

첫째, 지식 분산의 가속. 평균적인 미드사이즈 회사는 200~500개의 SaaS 도구를 쓴다. Okta의 Businesses at Work 2025 리포트는 직원당 평균 22.6개의 앱을 쓴다고 보고했다. 각 도구는 자기 검색을 가지고 있고, 통합되지 않는다.

둘째, 임베딩과 LLM의 비용 곡선. OpenAI text-embedding-3-small은 1M 토큰당 $0.02. Cohere Embed v3는 비슷. Llama 4 Maverick은 셀프호스트 가능. 2022년에는 RAG 인덱스를 만들기에 비용이 안 맞았지만, 2026년에는 100만 문서를 임베딩해도 수십 달러다.

셋째, 권한 보존의 성숙. 엔터프라이즈는 "내가 볼 수 없는 문서를 AI가 답에 섞으면 안 된다"가 절대 조건이다. Glean·Microsoft·Atlassian이 ACL을 인덱싱 시점에 보존하고, 쿼리 시점에 검사하는 패턴을 2024~2025년에 표준화했다.

이 세 가지가 만나서 시장이 폭발했다. Glean은 2024년 $260M을$ 4.6B 밸류에 모았고, Microsoft Copilot은 2024년 말 기준 70% 이상의 Fortune 500이 도입했다고 발표.

2장 · Glean — 리더, 엔터프라이즈 표준이 되어가는

Glean은 2019년 ex-Google 검색 엔지니어들이 창업했다. 처음부터 엔터프라이즈 검색 only로 시작했고, 2023년 LLM 시대가 오자 자연스럽게 RAG 레이어를 얹었다.

핵심 가치 제안 3가지.

100+ 커넥터 — Google Drive, OneDrive, SharePoint, Box, Dropbox, Slack, Teams, Jira, Confluence, Linear, GitHub, Salesforce, HubSpot, Zendesk, Notion, Asana, Monday, Gmail, Outlook. 거의 모든 엔터프라이즈 SaaS를 커버.
ACL 보존 — 각 소스의 권한을 인덱싱 시점에 가져와 쿼리 시점에 검사. "내가 볼 수 없는 문서가 답에 안 들어간다"의 표준 구현.
Glean Apps — 검색 위에 워크플로 앱을 올리는 플랫폼. 영업팀의 "이 계정 마지막 컨택은?", 엔지니어링의 "이 서비스 owner는?" 같은 질문을 워크플로로 묶음.

가격. Public price list 없음. 보통 시트당 월 $40~$ 80. 500시트 이상이면 협상 가능. SOC 2 Type II, ISO 27001, GDPR 준수.

약점. 비싸다. 작은 회사에는 안 맞는다. 그리고 한국·일본 엔터프라이즈 도구 커넥터는 약하다(Channel Talk, Cybozu Garoon 등).

3장 · Microsoft 365 Copilot — 가장 큰 배포 채널

Microsoft 365 Copilot은 2023년 출시, 2024년 GA. 시트당 월 $30, 연 약정. M365 라이선스 위의 add-on이다.

핵심 구조 — Microsoft Graph가 모든 것을 관장한다. Outlook·Teams·SharePoint·OneDrive·Loop·Planner의 모든 데이터가 이미 Graph에 있다. Copilot은 Graph에 RAG을 얹은 형태.

Copilot Studio + Copilot Connectors. 외부 데이터(Salesforce, ServiceNow, Workday, Jira)를 Graph로 가져오는 커넥터. 2024년 말에 100+ 커넥터 정식 공개. Microsoft가 사실상 "엔터프라이즈 검색의 OS"가 되려는 전략.

장점. 이미 M365를 쓰는 회사에 가장 자연스럽다. SSO·DLP·Purview·Sensitivity Labels이 다 통합. EU Data Boundary 보장(데이터를 EU 밖으로 안 내보냄).

약점. "Graph 안에 있는 것만 잘 한다." 외부 데이터는 Copilot Connectors로 가져와야 하고, Glean보다 커넥터 카탈로그가 작다. 그리고 "환각" 사례가 가장 많이 회자된다 — Microsoft가 가장 큰 배포라서 그렇지만, 안정성은 Glean이 더 평가 좋다.

4장 · Atlassian Rovo — Jira·Confluence·Bitbucket을 묶다

Atlassian Rovo는 2024년 발표, 2024년 말 GA. Atlassian의 엔터프라이즈 검색 + AI 에이전트 레이어.

핵심 가치. Jira·Confluence·Bitbucket·Trello 데이터를 한 자리에서 검색. 그리고 외부 커넥터(Google Drive, Microsoft 365, GitHub, Slack, Figma, Notion) 30+ 개로 확장.

Rovo Agents. 검색만이 아니라 "에이전트" — 코드 리뷰 에이전트, 릴리즈 노트 작성 에이전트, 회의 요약 에이전트. Atlassian이 자체 에이전트를 만들고, 사용자가 커스텀 에이전트를 만들 수 있는 플랫폼.

가격. Atlassian Cloud Premium·Enterprise에 포함되는 단계로 가는 중. 단독 SKU도 있음(시트당 월 $20 추정).

장점. Atlassian을 쓰는 회사(많은 엔지니어링 조직)에 자연스럽다. 데이터 거버넌스는 Atlassian Cloud의 표준.

약점. Atlassian 데이터가 아닌 외부 SaaS의 깊이는 Glean보다 얕다.

5장 · Notion AI + Notion Atlas — 협업 문서의 검색 진화

Notion AI는 2023년 출시, 처음에는 문서 작성 보조. 2024년부터 Notion Atlas라는 이름으로 다른 소스(Slack, Google Drive, Linear, Jira, GitHub, Figma)까지 검색을 확장.

Atlas의 의미. "Notion 안의 문서 + 외부 데이터를 한 검색창에서". Glean의 미니 버전 같은 포지션. Notion이 이미 회사의 위키·기획·OKR 허브인 곳에 자연스럽다.

가격. Business 시트당 월 $15, Enterprise 협상. Notion AI는 추가$ 10/seat 정도.

장점. Notion을 wiki로 쓰는 스타트업·미드사이즈에 가장 자연스럽다. UX가 깨끗하다.

약점. 대기업 엔터프라이즈 SaaS 커넥터(Salesforce, Workday, ServiceNow)는 Glean보다 얕다.

6장 · Slack AI — 채널이 곧 지식 베이스라는 가정

Slack AI는 2024년 GA. 시트당 월 $10 add-on, Slack 비즈니스/엔터프라이즈 플랜 위에.

기능 4가지.

채널 요약 — 못 본 메시지 1주일치를 요약.
스레드 요약 — 긴 스레드를 한 단락으로.
AI 검색 — "지난주 A 프로젝트 결정 사항?" 같은 자연어 쿼리.
회의 노트 — Huddle 녹취 + 요약.

핵심 가정. "회사의 실시간 지식은 Slack에 있다." 결정·디스커션·핸드오프가 채널에 산다는 가정 위에 만들어진 도구.

장점. Slack 사용자에게 가장 자연스럽다. 별도 도구 도입 없이 켜기만 하면 됨. 데이터가 Slack 밖으로 안 나감.

약점. Slack 안에 갇혀 있다. 다른 도구의 문서는 못 본다. Slack AI + Glean을 같이 쓰는 회사가 많다 — Slack AI는 채널 요약용, Glean은 전사 검색용.

7장 · Google Workspace + Gemini for Workspace — Google의 답

Gemini for Workspace는 2024년 GA. 시트당 월 $20 (Business Standard 위에 add-on, Enterprise는 더 비쌈).

기능. Gmail·Docs·Slides·Sheets 안에서 Gemini. 그리고 Workspace 전체 검색 — Drive·Gmail·Calendar를 한 자리에서.

커넥터. Microsoft보다 외부 커넥터가 약하다. Salesforce·Jira·HubSpot 정도. Google이 이 점을 보강 중이지만 2026년 5월 기준 Microsoft·Glean보다 얕다.

장점. Google Workspace를 쓰는 곳에 자연스럽다. 가격이 M365 Copilot보다 싸다. Gemini 1.5 Pro/2.5 Pro의 큰 컨텍스트 윈도(1M~2M 토큰)를 활용한 긴 문서 처리.

약점. 외부 커넥터의 깊이. 그리고 Workspace를 안 쓰는 회사에는 옵션이 아니다.

8장 · Guru — 위키 + AI 제안의 결합

Guru는 wiki를 핵심으로 시작한 회사. 2024~2025년에 AI 검색·자동 제안을 강화.

핵심 가치. "Knowledge Cards"라는 단위로 짧고 검증된 답을 만들고, AI가 Slack·브라우저·CRM에서 컨텍스트에 맞춰 카드를 제안.

언제 맞나. 영업·고객지원처럼 "검증된 짧은 답"이 중요한 팀. Glean보다 가벼움.

가격. Builder 시트당 월 $15, Enterprise 협상.

9장 · Coveo — 엔터프라이즈 + 커머스 검색의 양다리

Coveo는 캐나다 회사, 1996년 창업. 엔터프라이즈 검색(직원용)과 커머스 검색(고객용) 두 시장을 동시에 한다.

커머스 쪽. Shopify Plus·Salesforce Commerce Cloud·Adobe Commerce 위에 검색·추천. Algolia 경쟁자.

엔터프라이즈 쪽. Salesforce Service Cloud의 고객 지원 검색, 직원 인트라넷 검색.

AI. Coveo Relevance Cloud에 RAG·생성 답변(Coveo Relevance Generative Answering, RGA)을 추가. 2024년부터 GA.

가격. Public price list 없음, 보통 엔터프라이즈 협상($수만~수십만/연).

10장 · Lucidworks Fusion·Elastic — 클래식 검색의 AI 진화

Lucidworks Fusion. Apache Solr 기반 엔터프라이즈 검색 플랫폼. 2024~2025년에 ML·RAG 레이어를 강화. 대규모 e-commerce·고객지원에 강함. "Glean보다 빌드 가능성이 높은 옵션."

Elastic. Elasticsearch의 회사. 2023년에 "Enterprise Search"라는 별도 제품을 정리하고, 대신 Elastic Stack 자체에 vector search·RAG 기능을 내장하는 방향으로 재편. ELSER(Elastic Learned Sparse Encoder)와 dense vector를 같이 지원. 직접 RAG을 짓는 팀에게 좋은 베이스.

이 둘은 Glean·Microsoft와 다른 카테고리다 — 빌드 플랫폼이지 완성된 SaaS 검색 앱이 아니다.

11장 · 새 진입자 — Hebbia, Perplexity Enterprise, You.com, Claude Enterprise, ChatGPT Enterprise

Hebbia. 리서치 워크플로 특화 — 투자은행·로펌·컨설팅의 깊은 문서 분석. PDF·earnings call transcript·deal docs에 강함. 2024년 $130M 펀딩.

Perplexity Enterprise. 일반 perplexity의 엔터프라이즈 버전. 사내 데이터 연결 + 웹 검색 결합. 시트당 월 $40 정도.

You.com Pro / Enterprise. 멀티 모델(GPT·Claude·Gemini) 통합 + 엔터프라이즈 커넥터.

Anthropic Claude Enterprise. Claude의 엔터프라이즈 플랜. 큰 컨텍스트 윈도(1M 토큰), Projects(문서를 컨텍스트로), Tool use API. 사내 데이터를 직접 검색하기보다 "사내 문서를 컨텍스트로 넣는" 패턴.

ChatGPT Enterprise / Team. OpenAI의 엔터프라이즈. ChatGPT Team(시트당 월 $25, 2시트 이상), Enterprise(협상가, 보통 시트당 월$ 60+). 커스텀 GPTs, 사내 커넥터(Drive·SharePoint·Box 등).

이들은 Glean·Microsoft를 완전히 대체하기보다 보완한다 — 일반 LLM 인터페이스 + 가벼운 사내 커넥터.

12장 · 오픈소스 RAG — Onyx·Quivr·Khoj·LibreChat·AnythingLLM

엔터프라이즈가 비싸다면, 셀프호스트 옵션이 있다. 2026년 현재 의미 있는 OSS RAG 플랫폼들.

Onyx (구 Danswer). Y Combinator 2023, Apache 2.0. Slack·Confluence·Drive·Notion·Jira·GitHub 커넥터. ACL 보존(부분). 셀프호스트 또는 Onyx Cloud. OSS 엔터프라이즈 검색의 표준이 되어가는 중. Glean의 OSS 대체로 가장 자주 거론된다.

Quivr. "Second brain" 컨셉의 OSS. 개인·작은 팀용 RAG. Apache 2.0.

Khoj. 개인 RAG 어시스턴트. 노트·이메일·일정을 인덱싱. Obsidian·Emacs 통합. Apache 2.0.

Continue. 코드 특화 OSS — IDE 안의 RAG. JetBrains·VS Code 플러그인.

LibreChat. 멀티 프로바이더 채팅 UI(GPT·Claude·Gemini·Ollama). RAG 플러그인 포함. MIT.

AnythingLLM. 로컬 RAG 데스크탑 앱. 노트북에서 자기 문서로 RAG. MIT.

Ragna, R2R, Verba — 보다 라이브러리·SDK 성격. RAG를 직접 짓는 팀이 베이스로 쓰는 도구들.

언제 OSS가 맞나. (a) 데이터 주권이 절대적일 때(법무·의료·국방), (b) Glean 비용이 안 맞을 때, (c) 엔지니어링 팀이 운영할 수 있을 때.

13장 · RAG 아키텍처 스택 — 6개 레이어

엔터프라이즈 AI 검색의 내부는 결국 RAG 파이프라인이다. 6개 레이어를 분리해서 보는 게 도움이 된다.

레이어	역할	대표 도구
Ingest	문서를 가져오고 텍스트로 만든다	Unstructured.io, LlamaParse, Docling, Apache Tika, Marker
Chunk	큰 문서를 작은 조각으로	semantic chunking, contextual chunking (Anthropic)
Embed	조각을 벡터로	OpenAI text-embedding-3, Cohere Embed v3, Voyage, Jina, BGE-M3, Nomic
Vector DB	벡터를 저장·검색	Pinecone, Weaviate, Qdrant, Chroma, pgvector
Rerank	검색 결과를 다시 정렬	Cohere Rerank, Voyage rerank, ColBERT
LLM	답변 생성	GPT-4o, Claude 4, Gemini 2.5, Llama 4

각 레이어에서 선택은 독립적이다. 그래서 RAG는 결국 6개 결정의 곱이 된다.

14장 · Ingest — 가장 과소평가된 레이어

"PDF를 어떻게 파싱하느냐"가 RAG 품질의 50%를 결정한다.

Unstructured.io. OSS + commercial. PDF·docx·HTML·이메일·이미지를 구조화된 element list로. partition_pdf의 hi_res 모드는 layout-aware. 2024~2025년에 사실상 표준.

LlamaParse. LlamaIndex의 매니지드. 복잡한 표·다단 PDF에 강함. 페이지당 과금( $0.003~$ 0.03).

Docling. IBM이 2024년 공개한 OSS. PDF·docx·xlsx·PPTX·HTML·이미지 → JSON·Markdown. layout-aware. Apache 2.0. 표가 강한 문서에 좋다.

Apache Tika. 클래식. 모든 포맷을 처리하지만 layout-aware는 아니다. 단순 텍스트 추출에 OK.

Marker. OCR + LLM 후처리. 학술 논문·복잡한 PDF에 강함.

선택 가이드. 표·차트가 많으면 Docling·LlamaParse. 단순 텍스트면 Unstructured·Tika. 스캔본이면 Marker.

15장 · Embed — 임베딩 모델 비교 매트릭스

모델	차원	가격 (1M 토큰)	다국어	최대 입력
OpenAI text-embedding-3-small	1536	$0.02	100+	8K
OpenAI text-embedding-3-large	3072	$0.13	100+	8K
Cohere Embed v3 (English)	1024	$0.10	영어 강함	512 토큰
Cohere Embed v3 multilingual	1024	$0.10	100+	512 토큰
Voyage voyage-3	1024	$0.06	100+	32K
Voyage voyage-3-large	2048	$0.18	100+	32K
Jina embeddings v3	1024	$0.018	89개 언어	8K
BGE-M3	1024	OSS (셀프호스트)	100+	8K
Nomic Embed v1.5	768	OSS (셀프호스트)	100+	8K

선택 가이드. 한국어·일본어 섞이면 Voyage 또는 Cohere multilingual. 영어만이면 OpenAI text-embedding-3 또는 Cohere v3. 셀프호스트 가능해야 하면 BGE-M3 또는 Nomic.

MTEB 리더보드(Massive Text Embedding Benchmark)가 표준 비교점. 2026년 5월 기준 상위는 NVIDIA NV-Embed-v2, BGE-multilingual-gemma2, voyage-3-large, OpenAI text-embedding-3-large 순으로 자주 보인다(작업·언어에 따라 다름).

16장 · Rerank — RAG 품질의 마지막 30%

벡터 검색은 top-k를 가져온다(예: 50개). Rerank는 그중 진짜 관련 있는 5개를 다시 골라낸다.

Cohere Rerank 3. 가장 많이 쓰이는 매니지드. 영어·다국어. 1K 쿼리당 $2.

Voyage rerank-2. Voyage의 reranker. 가격은 Cohere와 비슷.

ColBERT / ColBERT v2. OSS rerank 모델. late-interaction 방식. 셀프호스트 가능. RAGatouille로 쉽게 쓸 수 있다.

왜 필요한가. 벡터 검색은 "의미적 유사도"를 보지만, 진짜 답에 필요한 건 "이 쿼리에 대한 정답을 포함하는 청크"다. Rerank가 이 갭을 줄인다. 실측상 Rerank는 nDCG@10을 5~15% 올린다.

17장 · Eval — RAG 평가 도구

RAG가 잘 도는지 측정 안 하면 개선이 안 된다. 평가 도구 4개.

Ragas. OSS RAG 평가 프레임워크. faithfulness·answer relevancy·context precision·context recall 같은 메트릭. 가장 표준.

TruLens. OSS + 호스티드. "feedback functions"로 RAG·LLM 앱 평가.

DeepEval. OSS, pytest 스타일. 14+ 메트릭 지원.

Arize Phoenix. OSS observability + eval. RAG 트레이스 시각화에 강함.

평가 메트릭 4개. (1) Faithfulness: 답이 컨텍스트 안에 근거가 있나, (2) Answer Relevancy: 답이 질문에 맞나, (3) Context Precision: 가져온 컨텍스트 중 진짜 관련 있는 비율, (4) Context Recall: 답에 필요한 정보가 컨텍스트에 다 들어있나. 이 4가지가 보통 첫 평가 셋.

18장 · 커넥터 우주 — 어떤 SaaS를 잇는가

엔터프라이즈 검색의 가치는 결국 얼마나 많은 시스템을 묶느냐다. 2026년 표준 커넥터 그룹.

Cloud Drive. Google Drive, OneDrive, SharePoint, Box, Dropbox.

Messaging. Slack, Microsoft Teams, Discord.

개발·이슈. Jira, Confluence, Linear, GitHub, GitLab, Bitbucket, Asana, Monday.

CRM·지원. Salesforce, HubSpot, Zendesk, Intercom, Freshdesk.

문서·노트. Notion, Coda, Quip, Evernote.

이메일. Gmail, Outlook.

Glean은 100+ 커넥터, Onyx는 40+ 커넥터, Notion Atlas는 20+, M365 Copilot Connectors는 100+(파트너 포함). Slack AI는 자기 데이터만.

19장 · 권한 보존 — 엔터프라이즈의 절대 조건

핵심 원칙. "사용자가 원본 시스템에서 볼 수 있는 문서만 답에 들어가야 한다." 이게 깨지면 컴플라이언스가 무너진다.

2개 패턴.

인덱싱 시점에 ACL을 같이 저장. 검색 시점에 user_id에 매칭되는 권한을 필터로 건다. Glean·Onyx가 이 방식.
쿼리 시점에 원본 시스템에 권한 확인. 더 정확하지만 느리다. 라이브 권한 변경에 강하다. Microsoft Copilot이 Graph 권한 모델에 기대는 방식.

도전. Slack 채널 권한, SharePoint 사이트 권한, Jira 프로젝트 권한 — 각 시스템의 권한 모델이 다 다르다. Glean이 100+ 커넥터를 만드는 데 시간이 걸린 이유의 절반이 ACL 모델링이다.

20장 · 데이터 프라이버시 — "내 데이터로 모델 학습 안 함"

엔터프라이즈는 "우리 데이터가 외부 모델 학습에 안 쓰이는가"가 두 번째 절대 조건.

OpenAI Enterprise. API·Enterprise·Team 데이터는 학습에 안 쓰임(공식 조항). Anthropic Claude Enterprise. API·Enterprise 데이터 학습 안 함. Google Gemini for Workspace. Workspace 데이터 학습 안 함. Microsoft Copilot. 테넌트 데이터 학습 안 함.

그리고 데이터 거주(residency). EU·일본·한국 회사는 데이터를 자국·자권역에 보관해야 하는 경우가 많다. Microsoft EU Data Boundary, Anthropic의 region 옵션, Google Cloud의 region이 답.

셀프호스트가 답일 때. 정부·의료·금융 일부에서는 외부 API 자체가 불가. Onyx 같은 OSS + 셀프호스트 LLM(Llama 4·Qwen 3) 조합이 유일한 길.

21장 · 한국·일본 엔터프라이즈 도구

한국. Channel Talk(고객지원·CRM), 잔디(Jandi, Slack 대안), Naver Cloud Works(엔터프라이즈 협업), 카카오워크(Kakao Work) AI, Goorm(협업 코딩). 이들의 데이터를 커넥터로 가져오는 글로벌 도구는 거의 없다. Onyx에 커넥터 추가하거나, 자체 RAG을 짓는 게 현실.

일본. Cybozu Garoon / Office(엔터프라이즈 그룹웨어), Kintone(저코드, Cybozu), Sansan(명함·CRM) + Sansan ContractOne(계약 검색), Talknote(엔터프라이즈 메시징). 일본 기업이 자체 도구 의존도가 높아서 글로벌 SaaS 검색이 한정적이다.

현실 옵션. (a) Glean·Microsoft를 도입하되 자국 도구는 별도, (b) Onyx 셀프호스트 + 자국 도구 커넥터 자작, (c) 자국 SaaS 벤더가 AI 검색을 내장하기를 기다림(Channel Talk·잔디 일부 진행 중).

22장 · 비용 비교 — 시트당 얼마인가

2026년 5월 기준 대략적인 시트당/월 비용.

도구	시트당 월	비고
Glean	$40~$ 80	협상, 큰 디플로이는 더 낮을 수 있음
Microsoft 365 Copilot	$30	M365 라이선스 별도 필요
Gemini for Workspace	$20 (Business),$ 30+ (Enterprise)	Workspace 라이선스 별도
Slack AI	$10	Slack 플랜 별도
Notion AI	$10	Notion Business/Enterprise 별도
Atlassian Rovo	$20 (추정)	Atlassian Cloud 별도
Guru	$15 (Builder)	Enterprise 협상
ChatGPT Team	$25 (2시트+)
ChatGPT Enterprise	협상, ~$60+
Claude Enterprise	협상
Hebbia	협상, 고가	리서치 특화
Perplexity Enterprise	$40
Onyx (셀프호스트)	인프라 비용만	LLM·embed 추가

총체적 비용. 1,000명 회사 기준 Glean이 연 $50만~$ 100만. M365 Copilot이 연 $36만(시트당$ 30 × 12개월 × 1000). Onyx 셀프호스트는 인프라 $5만 + LLM/embed 사용량($ 수만 ~ 수십만, 사용량에 따라).

23장 · 빌드 vs 바이 — 결정 트리

언제 사고, 언제 짓나.

바이(Glean·M365·Atlas) 가 맞을 때.

100시트 이상이고 IT가 운영을 맡고 싶지 않을 때.
커넥터 30+가 필요할 때.
보안 인증(SOC 2·ISO·HIPAA)이 필요할 때.
"9개월 안에 보여줄 수 있는 ROI"가 우선일 때.

빌드(Onyx 셀프호스트, 또는 자체 RAG)가 맞을 때.

데이터 주권이 절대일 때(국방·금융·의료의 일부).
한국·일본 자국 도구 비중이 높아서 글로벌 SaaS 커넥터가 안 맞을 때.
도메인 특화 임베딩·rerank가 필요할 때(법률·생명과학).
엔지니어링 팀이 RAG 운영을 감당할 수 있을 때(2~5명 풀타임).

하이브리드가 흔하다. Glean을 전사 검색으로 + Onyx를 보안 특수 도메인에 + 자체 RAG을 제품 안에 임베드. 이게 2026년 대기업의 현실 패턴.

24장 · 첫 도입 체크리스트 — 12개 항목

상위 5개 데이터 소스 파악. Slack? Confluence? Drive? Notion? Jira? — 어디에 우리 회사 지식이 사나.
사용자 수 추산. 시범 100, 전사 1,000 같은 단위로.
권한 모델 검토. 각 소스의 ACL이 어떻게 생겼나, 보존이 가능한가.
데이터 거주 요구사항. 한국·EU·일본 데이터 거주 의무가 있나.
현 LLM 계약. OpenAI·Anthropic·Google 중 누구와 이미 계약이 있나.
예산 범위. 시트당 $10~$ 80, 100~10K 시트 → 연 $만~$ 백만.
벤더 3개 시범 PoC. Glean·Microsoft·Atlas·Onyx 중 3개에 같은 쿼리 100개 던지고 답을 비교.
평가 메트릭. "직원이 답을 찾는 데 걸린 시간" 베이스라인 측정.
보안 검토. SOC 2 Type II, ISO 27001, DPA·SCC.
운영 책임자. 누가 인덱스 헬스·커넥터 장애·권한 변경을 챙기나.
롤아웃 계획. 100명 시범 → 부서 단위 → 전사. 3~6개월.
성공 메트릭. 검색 시간 감소(목표 30%+), 답변 만족도, 채택률(MAU/시트).

25장 · 안티패턴 10가지

"전사 일괄 도입." 권한·문서 품질 문제가 한꺼번에 드러난다. 100명 시범 먼저.
"검색 결과만 보고 평가." 사용자 행동(클릭률·재검색률)을 같이 봐야 한다.
"커넥터 다 켜고 시작." 노이즈 많은 소스(개인 메모·DM)는 후에. 핵심 위키부터.
"ACL을 후순위로." 한 번 권한 새면 신뢰가 무너진다. 1주차 우선.
"하나의 임베딩 모델로 모든 언어." 한국어·일본어 섞이면 다국어 임베딩 필수.
"rerank 생략." top-50 → top-5 좁히는 단계 없이는 답 품질이 낮다.
"환각 평가 안 함." Faithfulness 메트릭을 매주.
"한 번 인덱스 만들고 끝." 문서는 계속 업데이트. 변경 감지·재인덱싱 파이프.
"피드백 루프 없음." 사용자가 "도움 안 됨"을 누를 곳이 있어야 한다.
"챗봇 ≠ 검색." "어떤 답이 맞는지" 모르는 사용자에게 챗봇만 주면 헛돈다. 출처 링크가 답의 50%.

에필로그 — 검색은 다시 차별화 영역이다

2010년대 후반, 엔터프라이즈 검색은 "끝난 시장"으로 여겨졌다. SharePoint Search·Confluence Search가 충분히 좋다고 가정됐다. 실제로는 모두가 불만이었지만 대안이 없었다.

2026년, 그 가정이 깨졌다. LLM과 임베딩이 결합한 RAG가 처음으로 "사내의 모든 문서를 자연어로 묻는다"를 가능하게 했다. 그리고 검색은 다시 차별화 영역이다. Glean이 $4.6B 밸류를 받는 이유, Microsoft가 Copilot에 모든 것을 거는 이유다.

핵심 통찰. 검색은 최종 사용자에게 가장 가까운 인터페이스다. 사용자는 그 위에서 모든 일을 한다. 그래서 검색을 잘 하는 회사는 곧 "직원의 일하는 OS"를 만든 것이다. Glean·Microsoft·Atlassian이 노리는 게 이것이다.

우리 팀이 할 일. (1) 첫 도입은 100명 시범으로 작게. (2) ACL·평가·rerank 같은 기반을 일찍. (3) 빌드 vs 바이는 한 번 결정으로 끝나지 않음 — 도메인별로 다르다. (4) 사용자 만족도를 매주 측정.

이 시장은 2030년까지 매년 30%+ 성장 예상이다. 검색을 잘 하는 회사가 일을 잘 하는 회사다. 2026년에는 이미 그렇다.

12개 항목 체크리스트

다음 글 예고

다음에는 "RAG 평가 파이프라인 — Ragas·TruLens·Phoenix로 RAG 품질을 매일 측정하기"를 다룰 예정이다.

참고 / References

Glean — https://www.glean.com
Glean Series E funding 2024 — https://www.glean.com/blog/series-e
Microsoft 365 Copilot — https://www.microsoft.com/en-us/microsoft-365/copilot
Microsoft Copilot Studio — https://www.microsoft.com/en-us/microsoft-copilot/microsoft-copilot-studio
Atlassian Rovo — https://www.atlassian.com/software/rovo
Notion AI — https://www.notion.so/product/ai
Slack AI — https://slack.com/features/ai
Google Gemini for Workspace — https://workspace.google.com/solutions/ai/
Guru — https://www.getguru.com
Coveo — https://www.coveo.com
Lucidworks Fusion — https://lucidworks.com
Elastic vector search — https://www.elastic.co/elasticsearch/vector-search
Hebbia — https://www.hebbia.com
Perplexity Enterprise — https://www.perplexity.ai/enterprise
You.com — https://you.com
Anthropic Claude Enterprise — https://www.anthropic.com/enterprise
ChatGPT Enterprise — https://openai.com/enterprise
Onyx (Danswer) — https://github.com/onyx-dot-app/onyx
Quivr — https://github.com/QuivrHQ/quivr
Khoj — https://github.com/khoj-ai/khoj
LibreChat — https://github.com/danny-avila/LibreChat
AnythingLLM — https://github.com/Mintplex-Labs/anything-llm
Unstructured.io — https://unstructured.io
LlamaParse — https://www.llamaindex.ai/llamaparse
Docling (IBM) — https://github.com/DS4SD/docling
OpenAI text-embedding-3 — https://openai.com/index/new-embedding-models-and-api-updates/
Cohere Embed v3 — https://cohere.com/embed
Voyage AI — https://www.voyageai.com
Jina Embeddings v3 — https://jina.ai/embeddings/
BGE-M3 — https://huggingface.co/BAAI/bge-m3
Pinecone — https://www.pinecone.io
Weaviate — https://weaviate.io
Qdrant — https://qdrant.tech
pgvector — https://github.com/pgvector/pgvector
Cohere Rerank — https://cohere.com/rerank
ColBERT v2 — https://github.com/stanford-futuredata/ColBERT
Ragas — https://github.com/explodinggradients/ragas
TruLens — https://www.trulens.org
DeepEval — https://github.com/confident-ai/deepeval
Arize Phoenix — https://github.com/Arize-ai/phoenix
MTEB Leaderboard — https://huggingface.co/spaces/mteb/leaderboard