Memory-wall

Published on
2026년 6월 16일
Cerebras 웨이퍼스케일 딥다이브 — 칩 하나에 모델 전체를
cerebras wafer-scale ai-hardware memory-wall inference wse-3
웨이퍼 한 장을 통째로 하나의 칩으로 만든 Cerebras WSE-3의 설계를 깊게 파헤칩니다. 메모리 월을 우회하는 온칩 SRAM 중심 구조, 결함 허용 설계, 실시간 추론 성능, 그리고 GPU 클러스터 대비 장단점을 정리합니다.
Published on
2026년 6월 16일
인메모리 컴퓨팅 원리 — 메모리에서 연산하기
in-memory-computing compute-in-memory ai-hardware crossbar reram memory-wall
데이터를 연산 유닛으로 옮기는 대신, 메모리 안에서 직접 연산하는 compute-in-memory(CIM)의 원리를 깊게 정리합니다. 크로스바 어레이로 행렬곱을 한 번에 푸는 방법, 아날로그와 디지털 방식의 차이, 정밀도와 노이즈의 트레이드오프, 그리고 2026년 연구 동향과 상용화 과제를 다룹니다.
Published on
2026년 6월 16일
메모리 월과 HBM — AI 성능을 가르는 진짜 병목
memory-wall hbm bandwidth roofline inference ai-hardware quantization
연산은 싸지고 데이터 이동은 비싸진 시대, AI 성능의 진짜 병목은 메모리입니다. 메모리 월 개념부터 HBM 세대, roofline 모델과 산술 강도, KV 캐시, 양자화로 대역폭을 절감하는 법까지 개발자 관점에서 정리합니다.

Cerebras 웨이퍼스케일 딥다이브 — 칩 하나에 모델 전체를