- Published on
AI 하드웨어 가속기 2026 — NVIDIA Blackwell / AMD Instinct MI400 / Google TPU Trillium / Cerebras WSE-3 / Groq LPU / Tenstorrent / Etched Sohu / Furiosa / Rebellions 심층 가이드
ai-hardwaregpuacceleratornvidia-blackwellb100b200gb200b300rubinamd-instinctmi300xmi325xmi355xmi400-heliosintel-gaudi-3falcon-shoresapple-m5apple-ac1google-tputrilliumcerebras-wse-3groq-lpusambanova-sn40ltenstorrentwormholeblackholeetched-sohutrainium-2inferentia-3matxtachyuma18-prosnapdragon-8-gen-4dimensity-9400tensor-g5hbm3ehbm4nvlinkcxlsamsung-hynix-hbmfuriosa-airebellions-sapeongraphcore-softbankpreferred-networks-mn-3rapidus2026deep-dive
2026년 AI 하드웨어는 더 이상 NVIDIA 한 곳의 이야기가 아니다. Blackwell(B100/B200/GB200 NVL72/B300)이 GTC 2024에서 등장하고, 2026년 9월 Rubin이 예고된 가운데 AMD Instinct는 MI300X에서 MI355X를 거쳐 MI400 Helios까지 진격했다. Intel Gaudi 3가 마지막 별도 라인으로 출하되고 Falcon Shores 합류가 루머링되며, Apple은 M5/M5 Pro와 함께 AC1 서버 칩을 2026년 봄에 띄운다. Google TPU는 v5p와 Trillium(v5/v6)으로 Gemini 학습을 지탱하고, Cerebras WSE-3는 4조 트랜지스터의 웨이퍼 스케일을, Groq LPU는 순차 추론 속도를, SambaNova SN40L은 Reconfigurable Dataflow를, Tenstorrent는 Jim Keller가 이끄는 RISC-V 오픈 아키텍처를 들고 나왔다. Etched Sohu는 transformer 전용 ASIC을 2024년 6월에 공개했고, AWS Trainium 2와 Inferentia 3는 자체 칩 시대를 열었으며, MatX와 Tachyum Prodigy 같은 신예가 뒤따른다. 폰 NPU 진영의 Apple A18 Pro, Snapdragon 8 Gen 4, MediaTek Dimensity 9400, Google Tensor G5까지 — NVLink 5/6, PCIe Gen 6/7, CXL, HBM3E/HBM4, 그리고 액체 냉각 데이터센터의 풍경을 한국(FuriosaAI, Rebellions)과 일본(SoftBank Graphcore, Preferred Networks MN-3, Rapidus 2nm)의 시각에서 종합 정리한다.