- Published on
"한글이 깨진다", "이모지가 2글자로 세진다", "맥에서 복사한 파일명이 윈도우에서 다르다" — 이 모든 괴현상의 범인은 Unicode다. 8비트 ASCII에서 UTF-8 가변 길이 인코딩까지의 진화, 코드포인트와 그래핌 클러스터의 차이, NFC/NFD/NFKC/NFKD 4가지 정규화, 이모지 ZWJ 시퀀스의 놀라운 구조, 그리고 한글이 특별한 이유까지 — 현대 소프트웨어의 기반인 Unicode를 진짜로 이해해 봅시다.