- Published on
2026년의 문서 AI는 더 이상 "Tesseract로 텍스트 뽑기"가 아니다. Mistral OCR(2025.3) 같은 전용 API, Marker / Surya / Docling / OlmoOCR 같은 오픈소스 PDF-to-Markdown 엔진, LayoutLMv3·Donut 같은 사전학습 문서 모델, Pixtral 12B·Florence-2 같은 멀티모달 LLM이 모두 같은 문제(스캔된 PDF에서 구조와 의미를 뽑기)에 다른 접근으로 달려든다. 이 글은 13개 후보를 OCR / 레이아웃 / 추출 / RAG-ingestion 네 단계로 정렬하고, 청구서·계약서·논문·RAG 각각에 무엇을 골라야 할지까지 정리한다.