Published on2026년 3월 1일LLM 추론 최적화: vLLM과 TensorRT-LLM 심층 분석llminferencevllmtensorrt-llmoptimizationvLLM과 TensorRT-LLM 공식 문서를 기반으로 PagedAttention, Continuous Batching, 양자화 등 LLM 추론 최적화 핵심 기술을 분석한다.