DeepSeek-V2의 MLA(Multi-head Latent Attention)와 DeepSeekMoE, V3의 FP8 학습과 보조 손실 없는 로드 밸런싱, R1의 강화학습 기반 추론 능력까지 — DeepSeek 시리즈의 아키텍처 혁신과 학습 방법론을 논문 기반으로 심층 분석한다.
Tencent HunyuanVideo(13B)와 Lightricks LTX-2(19B)의 아키텍처, 학습 방법론, 성능 벤치마크를 심층 분석하고, Wan 2.1/CogVideoX/Mochi 등 오픈소스 비디오 생성 모델 생태계 전체를 비교하며 실전 활용 가이드를 제공한다.