Skip to content
Published on

2025년 3월 테크·AI·K-POP 위클리 다이제스트: GTC부터 BTS 컴백까지

Authors

들어가며

2025년 3월은 테크 업계에 굵직한 이벤트가 쏟아진 달이었다. NVIDIA GTC에서 차세대 AI 칩 로드맵이 공개되고, Google이 Gemini 2.5 Pro로 벤치마크 1위를 탈환했으며, OpenAI가 Anthropic의 MCP를 공식 채택하면서 AI 에코시스템의 판도가 바뀌었다. K-POP 씬에서는 BTS가 5년 만에 완전체로 컴백하며 전 세계를 흔들었고, JENNIE의 솔로 앨범이 밀리언셀러를 달성했다.

이 글에서는 IT 뉴스, AI 모델·논문, 오픈소스 트렌드, 주요 IT 컨퍼런스, 그리고 K-POP까지 2025년 3월의 핵심 흐름을 한눈에 정리한다.


1. NVIDIA GTC 2025: AI 칩 전쟁의 새 국면

1.1 Blackwell 풀 프로덕션 + Blackwell Ultra

Jensen Huang의 GTC 2025 키노트에서 가장 주목할 발표는 Blackwell 아키텍처의 풀 프로덕션 소식이었다. Hopper 대비 40배 성능 향상을 달성했으며, 2025년 하반기에는 Blackwell Ultra가 출시된다.

항목Blackwell Ultra vs Blackwell
FP4 추론1.5배 향상
메모리1.5배 증가
대역폭2배 향상

1.2 Vera Rubin 플랫폼 (2026)

천문학자 Vera Rubin의 이름을 딴 차세대 플랫폼이 2026년 하반기 출시 예정이다.

  • Vera CPU: ARM 기반 88코어
  • Rubin GPU: Blackwell Ultra 대비 추론 5배, 학습 3.5배 성능
  • NVLink 6, ConnectX-9 SuperNIC, BlueField-4 DPU 등 풀스택 구성

1.3 로드맵: Rubin Ultra(2027) → Feynman(2028)

NVIDIA는 연간 칩 출시 케이던스를 확립했다.

2025 H2: Blackwell Ultra
2026 H2: Vera Rubin (추론 5x, 학습 3.5x vs Blackwell)
2027 H2: Rubin Ultra (Blackwell Ultra 대비 14x)
2028:    Feynman (리처드 파인만에서 명명)

핵심 메시지는 명확하다. GPU뿐 아니라 CPU가 AI 데이터센터 아키텍처의 중심으로 부상하고 있으며, Agentic AI와 Physical AI가 주요 워크로드로 자리잡고 있다.

편집자 코멘트: NVIDIA가 연간 칩 출시 케이던스를 약속한 건 인텔이 Tick-Tock 전략으로 반도체 산업을 지배하던 시절을 떠올리게 한다. 차이가 있다면, 이번에는 고객들이 매년 수십억 달러짜리 데이터센터 인프라를 교체해야 한다는 점이다. Vera CPU의 커스텀 ARM 코어("Olympus")는 Grace 대비 2배 성능을 목표로 하며, 이는 NVIDIA가 더 이상 GPU 회사가 아니라 풀스택 데이터센터 회사로 진화하고 있음을 의미한다.


2. AI 모델 전쟁: 2025년 3월 스냅샷

2.1 주요 모델 릴리스

Gemini 2.5 Pro Experimental (3월 25일)

Google이 "thinking model"로 내놓은 Gemini 2.5 Pro가 벤치마크를 석권했다.

  • AIME 2024: 92.0%
  • AIME 2025: 86.7%
  • GPQA Diamond: 84.0%
  • LMArena에서 2위와 약 40포인트 차이로 1위

Claude 3.7 Sonnet (2월 24일)

Anthropic의 첫 하이브리드 추론 모델. 일반 LLM 모드와 Extended Thinking 모드를 하나의 모델에서 전환 가능하다.

  • 최대 128K 출력 토큰 (기존 대비 15배)
  • SWE-bench Verified 신기록
  • Claude 3.5 Sonnet과 동일 가격 (입력 3달러/출력 15달러 per 1M tokens)

GPT-4.5 "Orion" (2월 27일)

코드명 Orion. 순수 추론보다는 감성 지능과 대화 품질에 초점을 맞춘 모델이다.

  • MMLU: 85.1%
  • SimpleQA: 62.5% (GPT-4o 38.6% 대비 대폭 향상)
  • 할루시네이션 비율: 37.1% (GPT-4o 59.8% 대비 크게 감소)

DeepSeek-R1 (1월 20일)

2025년 초 가장 큰 충격을 준 모델. 671B 파라미터 MoE(37B 활성) 모델이 순수 강화학습만으로 OpenAI o1급 수학·코드·추론 성능을 달성했다. 보고된 학습 비용은 약 820만 달러 — 동급 성능의 모델 대비 95% 저렴하다. 1.5B~70B 증류 버전까지 오픈소스로 공개하며 중국 AI 생태계에 거대한 파급 효과를 일으켰다. "돈으로 지능을 살 수 있다"는 스케일링 법칙의 근본 전제에 의문을 던진 사건이다.

2.2 벤치마크 비교 (2025년 3월 기준)

모델                | MMLU   | GPQA Diamond | AIME 2025 | 특징
--------------------|--------|-------------|-----------|------------------
Gemini 2.5 Pro      | ~90+   | 84.0%       | 86.7%     | LMArena 1위
Claude 3.7 Sonnet   | ~88    | 상위권       | 상위권     | 하이브리드 추론
GPT-4.5             | 85.1%  | 71.4%       | -         | 대화 품질 특화
DeepSeek-R1         | ~90    | 상위권       | o1급       | 671B MoE, 오픈소스
Qwen 2.5-72B        | 상위권  | 상위권       | -         | Llama-3.1-405B 능가

주목할 트렌드: 전통적 벤치마크(MMLU, HumanEval, GSM8K)는 90% 이상으로 포화 상태다. 업계는 GPQA Diamond, AIME 2025, FrontierMath, SWE-bench Verified 등 더 어려운 평가 기준으로 이동하고 있다.

2.3 Chatbot Arena 수렴 현상

LMSys Chatbot Arena에서 상위 1위와 10위의 격차가 **5.4%**로 좁아졌고, 1위와 2위 격차는 2023년 4.9%에서 2024년 **0.7%**로 급감했다. 모델 간 성능 차이가 점점 줄어들면서 사용성, 가격, 에코시스템이 차별화 요인이 되고 있다.

편집자 코멘트: 벤치마크 수렴이 의미하는 바를 냉정하게 따져보자. 2023년에는 "최고 모델"이 확실했다. 2025년 3월에는 상위 5개 모델 중 어떤 것을 써도 체감 차이가 미미하다. 이는 AI 모델이 commodity화되고 있다는 신호이며, 진짜 경쟁은 도구 통합(MCP, 에이전트 프레임워크), 가격(DeepSeek가 증명한 것처럼), 그리고 개발자 경험으로 이동하고 있다. 오픈소스 진영에서는 Meta의 Llama 4 Behemoth(288B MoE, Apache 2.0 라이선스)가 수십억 달러의 R&D를 무료로 풀어버리며 이 commodity화를 가속하고 있다.


3. 핫 논문과 연구 트렌드

3.1 DeepSeek-R1: 순수 RL로 추론 능력 유도

"Incentivizing Reasoning Capability in LLMs via Reinforcement Learning" — 감독 학습 없이 순수 강화학습만으로 체인 오브 쏘트(CoT) 추론을 유도할 수 있다는 것을 증명한 논문. 오픈소스 추론 모델 개발의 물꼬를 텄다.

3.2 Inference-Time Compute Scaling

OpenAI의 연구로, 추론 시점에 더 많은 컴퓨팅을 투입하면 예측 가능한 성능 향상을 얻을 수 있다는 스케일링 법칙을 제시했다. o1/o3 모델의 이론적 근거가 되는 핵심 연구다.

3.3 RLVR (Reinforcement Learning from Verification)

검증 가능한 정답과 비교하여 강화학습하는 전략. 2025년 추론 모델 학습의 핵심 패러다임으로 자리잡았다.

3.4 Chain-of-Thought에 대한 재평가

Wharton 연구에 따르면, CoT 프롬프팅의 효과는 모델마다 크게 다르다. 비추론 모델에서는 적당한 개선을 보이지만, 추론 모델에서는 시간 대비 한계적 이득만 제공한다.


4. 오픈소스·라이브러리·프로젝트 트렌드

4.1 MCP(Model Context Protocol) — 업계 표준으로

Anthropic이 2024년 11월 발표한 MCP가 8개월 만에 GitHub 37,000 스타를 달성했다. 결정적 전환점은 2025년 3월 26일 OpenAI의 MCP 공식 채택이다. ChatGPT, Agents SDK, Responses API에 MCP를 통합하면서 사실상 업계 표준이 되었다. 이후 Google DeepMind와 Microsoft도 합류하면서, Anthropic-OpenAI-Google-Microsoft라는 AI 빅4가 하나의 프로토콜 아래 뭉치는 전례 없는 수렴이 일어났다.

2025년 12월, Anthropic은 MCP를 Linux Foundation 산하 **Agentic AI Foundation(AAIF)**에 기부했다. Block의 goose, OpenAI의 AGENTS.md와 함께 AAIF의 창립 프로젝트가 되면서, 벤더 주도 스펙에서 커뮤니티 거버넌스 표준으로 진화했다.

작은 오픈소스 실험이 12개월도 안 되어 사실상의 업계 표준이 된 것은, AI 생태계의 속도가 웹 표준의 그것을 추월했다는 증거다.

4.2 주목할 오픈소스 프로젝트

  • Dify: 멀티 모델 지원, 챗봇, 에이전트 워크플로우, RAG 시스템을 지원하는 AI 워크스페이스. 양방향 MCP 지원.
  • shadcn/ui: 복사-붙여넣기 방식의 접근 가능한 React 컴포넌트 라이브러리. 폭발적 성장 지속.
  • AI 에이전트 프레임워크: AutoGen, CrewAI, LangGraph 등 멀티 에이전트 오케스트레이션 도구가 급부상.

4.3 GitHub 기록

2025년 3월, GitHub에서 한 달간 255,000명의 첫 오픈소스 기여자가 기록되었다. GitHub 상위 10개 급성장 리포지토리 중 6개가 AI 인프라 프로젝트였다.

4.4 Vibe Coding의 부상

Andrej Karpathy가 2025년 2월에 제안한 개념이다. AI가 생성한 코드를 세세히 리뷰하지 않고, 결과물의 "느낌"으로 판단하며 개발하는 방식을 뜻한다. Y Combinator W25 배치의 25%가 코드베이스의 95%를 AI로 생성했다고 보고했다. 이 용어는 2025년 Collins English Dictionary 올해의 단어로 선정되기까지 했다.

하지만 숙취(hangover)도 빨랐다. CodeRabbit의 2025년 12월 분석(470개 GitHub PR 대상)에 따르면, AI 공동작성 코드는 인간 작성 코드 대비 1.7배 많은 주요 이슈를 포함했으며, 보안 취약점은 2.74배 높았다. "Vibe Coding"이 프로토타이핑에는 혁명적이지만, 프로덕션 코드에서는 기술 부채의 새로운 원천이 될 수 있다는 경고다.


5. 주요 IT 컨퍼런스 하이라이트

5.1 AWS Summit 2025

AWS Summit New York (7월)

  • Amazon Bedrock AgentCore: AI 에이전트 신속 배포·스케일링
  • Strands Agents: 수개월 걸리던 에이전트 개발을 수시간으로 단축
  • Amazon EKS: 클러스터당 100,000 노드 스케일링 (Trainium 160만 개 또는 NVIDIA GPU 80만 개)
  • AI 인프라 투자: 펜실베이니아·노스캐롤라이나에 300억 달러 투자 약속

5.2 CES 2025 (1월)

  • NVIDIA Cosmos: 로봇·자율주행을 위한 Physical AI 플랫폼
  • 휴머노이드 로봇 러시: 1X Neo(2만 달러 가정용), LG CLOiD, Unitree G1
  • 로보락 AI 청소기: 로봇 팔로 바닥의 물체를 감지·이동

5.3 MWC 2025 (2~3월)

  • Samsung Galaxy S25 Edge: 역대 가장 얇은 Galaxy S
  • Galaxy AI: Gemini 통합, AI 카메라 프로세싱
  • Project Moohan: 삼성 첫 Android XR 헤드셋

5.4 Google I/O 2025 (5월)

  • Gemini 앱 대규모 업데이트: Veo 3, Imagen 4, Deep Research, Canvas
  • AI Mode: Google 검색에 Gemini 모델 통합
  • Jules: Google의 자율 코딩 에이전트 퍼블릭 베타. GitHub 리포와 직접 연동되며, Cloud VM을 자동 생성해 코드베이스 전반에 걸친 수정, 테스트 실행, PR 생성까지 자율적으로 수행한다.
  • Google Beam: AI 기반 몰입형 화상 통화 (기존 Project Starline)
  • Gemini 2.5 Flash Native Audio: 24개 언어로 음성, 톤, 속도를 제어하는 에이전틱 음성 앱 개발 가능

6. GeekNews·Hacker News 화제의 토픽

6.1 GeekNews (news.hada.io)

  • GPT-4o 이미지 생성 기능과 지브리풍 변환 바이럴
  • ChatGPT 주간 활성 사용자 8억 명 돌파
  • GEO(Generative Engine Optimization): 기존 SEO의 미래에 대한 뜨거운 논쟁
  • 의료 AI: Google의 AMIE 시스템 (종합 질환 관리)

6.2 Hacker News

  • Simon Willison이 3년 연속 HN 최고 인기 블로거로 선정 (AI 커버리지 공로)
  • MCP 논쟁: "MCP — 반짝 유행인가 미래 표준인가?" 글이 LangChain/LangGraph 핵심 멤버들의 열띤 토론을 촉발
  • 독일 공공기관 ODF 의무화, 오레곤 학교 휴대폰 금지 등 정책 토픽도 활발

7. AI 철학과 윤리

7.1 주요 심포지엄

  • Loyola 디지털 윤리 심포지엄 (3월 14일): "접근 가능한 지능: 더 윤리적인 현재를 위한 설계" — AI 설계가 효율성만큼 인간성에도 집중해야 한다는 메시지.
  • K and L Gates-CMU 컨퍼런스 (3월 10~11일): 생성 AI 거버넌스의 강점과 약점을 산학관이 함께 논의.
  • UNESCO 글로벌 AI 윤리 포럼 (GFEAI) 2025: 국제 AI 거버넌스 논의.

7.2 핵심 담론

  • AI 정렬(Alignment)과 편향: 좁은 AI가 AGI로 발전할수록 편향이 소수자 집단에 기하급수적으로 해로울 수 있다는 우려.
  • MIT 철학 + AI 연구: AI 실존적 위험, 자유의지, 불확실성 하의 의사결정, 장기적 책임/규제에 대한 심층 연구.
  • 글로벌 AI 거버넌스: 문화적 차이, 지정학, 인간중심주의를 넘어서는 진정한 글로벌 AI 윤리가 필요하다는 논문이 AI and Ethics 저널에 게재.

8. K-POP: 2025년 3월 주요 뉴스

8.1 BTS 5년 만의 완전체 컴백

2025년 3월 최대의 문화 이벤트. 앨범 **"Arirang"**이 3월 20일 발매되었으며, 3월 21일 서울 광화문 광장에서 무료 콘서트가 열려 Netflix로 전 세계에 라이브 스트리밍되었다. 82개 도시 월드투어는 모든 공연이 이미 매진되었다.

8.2 JENNIE — "Ruby" 밀리언셀러

3월 7일 발매된 JENNIE의 정규 1집 "Ruby"는 15개 트랙으로 구성되며, Childish Gambino, Dua Lipa, Kali Uchis 등과 협업했다. UK 앨범 차트 3위 (K-POP 여성 솔로이스트 최고 기록)를 기록하고, 전 세계 100만 장 이상 판매되었다.

8.3 Stray Kids: 빌보드 역사 새로 쓰다

Stray Kids가 8개 연속 앨범을 빌보드 200 1위로 데뷔시키며 70년 빌보드 역사를 새로 썼다. 역대 어떤 아티스트도 달성하지 못한 기록이다.

8.4 그 외 주요 컴백

아티스트앨범/싱글날짜
LE SSERAFIMHOT (5th Mini Album)3월 14일
NMIXXFe3O4: FORWARD (4th EP)3월 17일
THE BOYZUnexpected (3rd Full Album)3월 17일
j-hopeMona Lisa3월 21일
Rose ft. Bruno MarsAPT (20억 스트리밍 돌파)지속

8.5 K-POP과 기술의 융합

가상 아이돌 PLAVE가 Billboard Global 200에 진입하며 최초의 디지털 아티스트 기록을 세웠다. Unreal Engine 5 기반 리얼타임 모션캡처 + AI 표정 보정 기술을 활용하며, 2집 EP 첫 주 56만 장을 판매했다. 2025년 11월에는 BTS·BLACKPINK급 대형 아티스트만 사용하던 고척 스카이돔에서 3만 7천 명 규모의 콘서트를 매진시켰다 — 가상 그룹으로서는 세계 최초의 기록이다.

Galaxy Corporation은 실제 무대에서 공연하는 휴머노이드 로봇 아이돌을 개발 중이며, JYP 엔터테인먼트는 AI 아티스트 개발에 본격 착수했다. 글로벌 가상 인간/아바타 시장은 150억 달러 규모로 성장할 전망이다.

PUBG x G-Dragon 협업으로 게임과 K-POP의 크로스오버가 실현되었으며, Netflix x BTS 파트너십은 스트리밍 플랫폼과 K-POP의 새로운 결합 모델을 제시했다.


마무리: 3월의 키워드는 "수렴과 확장"

2025년 3월을 관통하는 키워드는 **수렴(Convergence)**과 **확장(Expansion)**이다.

수렴: AI 모델 성능이 상향 평준화되면서 벤치마크는 의미를 잃어가고 있다. MCP가 업계 표준으로 통합되며 "어떤 모델을 쓰느냐"보다 "어떤 도구와 연결하느냐"가 핵심 경쟁력이 되었다. K-POP과 테크는 PLAVE의 고척돔 매진, 휴머노이드 로봇 아이돌 개발을 통해 하나의 엔터테인먼트 생태계로 녹아들고 있다.

확장: NVIDIA의 연간 칩 출시 케이던스는 데이터센터의 "무어의 법칙"을 재정의하고 있다. AI 에이전트는 단일 도구에서 다중 에이전트 오케스트레이션으로 진화하며, Vibe Coding은 "누가 코드를 작성하는가"라는 근본적 질문을 던지고 있다.

개인적 전망: 주목해야 할 3가지

  1. 에이전트 인프라 전쟁이 온다. MCP가 표준이 된 이상, 다음 전장은 "에이전트를 어떻게 배포하고, 모니터링하고, 과금하느냐"다. AWS Bedrock AgentCore, Google Jules, Anthropic의 Claude Code가 이 시장을 선점하려 하고 있다.

  2. 오픈소스 AI의 commodity 가속. DeepSeek가 820만 달러로 o1급 성능을 증명하고, Meta가 Llama 4를 Apache 2.0로 풀어버린 이상, 폐쇄형 모델의 프리미엄은 빠르게 줄어들 것이다. 차별화는 모델 자체가 아니라 데이터 파이프라인, 도메인 특화 파인튜닝, 그리고 에이전트 워크플로우에서 나올 것이다.

  3. K-POP은 테크 산업의 리트머스 테스트다. 가상 아이돌, 로봇 퍼포머, AI 생성 콘텐츠가 가장 먼저 대중적 성공을 거두는 곳이 엔터테인먼트다. PLAVE가 증명한 "스크린 너머의 팬덤"은 AI 에이전트가 인간과 관계를 맺는 방식의 프리뷰이기도 하다.


이 글은 2025년 3월 기준 공개된 정보를 바탕으로 작성되었으며, 일부 후속 발전 사항(MCP의 Linux Foundation 기부, Vibe Coding 비판 등)을 추가했습니다. 벤치마크 수치와 제품 사양은 공식 발표 기준이며, 실제 성능은 환경에 따라 다를 수 있습니다.