Gemini

All Posts

Published on
2026년 5월 16일
비전-언어 모델(VLM) 2026 완벽 가이드 - CLIP · LLaVA · InternVL3 · Qwen2.5-VL · GPT-4o · Gemini 2.5 · Claude 4.7 · DINOv2 · SAM 2 · Florence-2 심층 분석
vision-language-models vlm clip llava internvl qwen-vl gpt-4o gemini claude dinov2 sam florence multimodal foundation-models
2026년 5월 기준 비전-언어 모델(VLM)의 모든 것을 한 글에 담는다. CLIP 계열(SigLIP, EVA-CLIP)부터 오픈 VLM(LLaVA-NeXT, InternVL3, Qwen2.5-VL, Pixtral, Molmo, Idefics3, MiniCPM-V), 폐쇄형(GPT-4o, Claude 4.7, Gemini 2.5), 비전 파운데이션(DINOv2/v3, SAM 2, Florence-2), 학습 레시피, 평가(MMMU, MathVista, ChartQA, DocVQA), OCR-centric VLM, 비디오 VLM, vLLM/SGLang 서빙, 그리고 한국·일본 VLM 씬까지 깊이 정리한다.
Published on
2026년 5월 14일
Slack 봇으로 AI 팀원 만들기 — Claude·Gemini·OpenClaw 연동 + MCP로 도구 확장 (2026 핸즈온)
slack-bot llm claude gemini openclaw mcp bolt-sdk ai-agent chatops hands-on automation
AI를 가장 레버리지 높게 배포하는 표면은 IDE가 아니라 Slack이다 — 팀 전체가, 일이 일어나는 곳에서 쓴다. 이 글은 따라 하는 핸즈온이다. Slack 앱을 만들고, Bolt SDK로 멘션에 응답하는 최소 봇을 띄우고, Claude·Gemini·OpenClaw 게이트웨이를 연동하고, 스레드 컨텍스트를 다루고, MCP로 봇에 GitHub·Jira·DB 같은 도구를 쥐여주고, 스트리밍 UX·프로덕션 운영·Prompt Injection 방어까지.
Published on
2026년 4월 12일
Gemini 2.5 개발자 실전 가이드: Pro, Flash, Flash-Lite를 어떻게 고를까
google gemini gemini-2-5 coding agentic-coding reasoning long-context multimodal google-ai-studio vertex-ai 2026-04
2025년 3월 25일 공개된 Gemini 2.5를 기준으로, Pro, Flash, Flash-Lite 중 무엇을 선택해야 하는지, reasoning 모델이 워크플로를 어떻게 바꾸는지, 그리고 팀이 실제로 무엇을 배포해야 하는지를 실무 관점에서 정리합니다.
Published on
2026년 3월 25일
BFCL 벤치마크 완전 가이드 2025: Tool Calling 성능 평가, 리더보드 분석, 모델 비교
bfcl benchmark tool-calling function-calling evaluation leaderboard llm claude gpt gemini 2026-03
BFCL(Berkeley Function Calling Leaderboard)의 모든 것! 벤치마크 카테고리(Simple/Multiple/Parallel/Relevance/AST), 평가 메트릭, 모델 성능 비교(Claude/GPT/Gemini/Llama), 자체 모델 평가 방법, Tool Calling 개선 전략.
Published on
2026년 3월 25일
LiteLLM 완전 가이드 2025: 100+ LLM을 하나의 API로 통합하는 프록시 서버
litellm llm api proxy openai anthropic gemini cost-management load-balancing ai-infrastructure 2026-03
LiteLLM의 모든 것! 100+ LLM 통합 API, OpenAI 호환 프록시 서버, 비용 추적/예산 관리, 로드 밸런싱/폴백, 모델 라우팅, 가상 키, 레이트 리밋, Guardrails, 프로덕션 배포(Docker/K8s).
Published on
2026년 3월 22일
AI 프롬프트 엔지니어링 완전 가이드: 개발자가 알아야 할 프롬프트 기법 30선
prompt-engineering ai llm chatgpt claude gemini developer coding 2026-03
Zero-shot부터 Chain-of-Thought, Tree-of-Thought, ReAct, Few-shot, Self-Consistency까지 — 개발자를 위한 프롬프트 엔지니어링 30가지 기법을 실전 예시와 함께. Claude, GPT-4, Gemini에서 최대 성능을 끌어내는 방법.
Published on
2026년 3월 21일
2025년 3월 테크·AI·K-POP 위클리 다이제스트: GTC부터 BTS 컴백까지
culture ai kpop nvidia gtc mcp deepseek gemini weekly-digest open-source benchmark 2026-03
NVIDIA GTC 2025 Blackwell Ultra 발표, Gemini 2.5 Pro 등장, MCP의 업계 표준화, DeepSeek-R1 오픈소스 충격, BTS 5년만의 완전체 컴백, JENNIE 솔로 앨범 밀리언셀러 등 2025년 3월 테크·AI·K-POP 핵심 트렌드를 한눈에 정리합니다.
Published on
2026년 3월 17일
Gemini API를 프로덕션에 올릴 때 필요한 Prompt, Guardrails, Evaluation
gemini generative-ai ai llmops prompt-engineering evaluation 2026-03
Gemini API를 실서비스에 붙일 때 필요한 프롬프트 설계, structured output, safety 정책, 평가 루프, 비용 통제 방법을 운영 관점에서 정리한 가이드입니다.
Published on
2026년 3월 17일
멀티모달 AI 완전 정복: CLIP, LLaVA, GPT-4V, Gemini Vision 마스터하기
multimodal vision-language clip llava gpt-4v gemini deep-learning 2026-03
멀티모달 AI의 기초부터 최신 비전-언어 모델까지 완전히 마스터하는 가이드. CLIP, BLIP-2, LLaVA, InstructBLIP, GPT-4V, Gemini Vision, Claude Vision 활용법과 멀티모달 RAG까지 실전 코드로 배웁니다.
Published on
2026년 3월 17일
LLM 애플리케이션 개발 실전 가이드: ChatGPT API, Claude API, Gemini API 마스터
llm openai claude gemini api application-development 2026-03
LLM API를 활용해 실제 애플리케이션을 개발하는 완전 실전 가이드. OpenAI, Anthropic Claude, Google Gemini API 활용법, 스트리밍, 함수 호출, 구조화된 출력, 비용 최적화, 그리고 프로덕션 베스트 프랙티스까지 상세히 다룹니다.

Gemini

gemini (10)