Skip to content

Language Learning Quiz

Based on: Sparse Mixture of Experts(MoE) 아키텍처 심층 분석: 설계 원리부터 DeepSeek-V3·Qwen3까지

Do you know this expression?

Mixture of Experts (MoE)
전문가 혼합 모델

여러 전문가 네트워크 중 일부만 선택적으로 활성화하여, 파라미터 수는 크지만 실제 연산량은 적은 조건부 계산 아키텍처

Tap to flip