BFCL(Berkeley Function Calling Leaderboard)의 모든 것! 벤치마크 카테고리(Simple/Multiple/Parallel/Relevance/AST), 평가 메트릭, 모델 성능 비교(Claude/GPT/Gemini/Llama), 자체 모델 평가 방법, Tool Calling 개선 전략.
AI Agent의 핵심 기능인 Function Calling과 Tool Use 패턴을 실전 중심으로 구현합니다. OpenAI·Anthropic·LangChain의 도구 호출 API, 오류 처리·재시도 전략, 프롬프트 인젝션 방어, MCP 표준까지 프로덕션 챗봇을 위한 완벽 가이드입니다.
LLM 구조화된 출력의 핵심 원리인 Constrained Decoding부터 JSON Schema 기반 출력 제어, Outlines·XGrammar·llguidance 엔진 비교, Function Calling 통합, 그리고 프로덕션 환경 적용 전략까지 다루는 실전 가이드.