Published on2026년 6월 16일Systolic Array와 Dataflow 아키텍처 — TPU의 심장 원리gpu-cudasystolic-arraydataflowtpuai-hardwarematrix-multiplyacceleratorAI 가속기의 핵심 연산인 행렬곱을 효율적으로 처리하는 systolic array의 동작 원리를 ASCII 다이어그램과 함께 깊이 파헤칩니다. weight-stationary와 output-stationary 같은 dataflow 전략, 데이터 재사용과 에너지, 텐서코어와의 비교, 컴파일러 매핑까지 TPU의 심장 원리를 정리합니다.