브라우저 AI 실험실
Browser AI Lab
서버 없이 브라우저에서 돌아가는 진짜 AI — 감정 분석(별점 1~5), 임베딩 유사도 히트맵, 한↔영 번역, 제로샷 분류, 영어 요약을 Transformers.js(WebGPU/WASM)로 실행합니다. 모델은 브라우저에 캐시되고 입력 텍스트는 어디에도 전송되지 않습니다.
🤖 서버 없이 브라우저에서 실행되는 진짜 AI실행 환경 감지 중…🔒 입력 텍스트는 어디에도 전송되지 않음
다국어 감정 분석 (1~5점)Xenova/bert-base-multilingual-uncased-sentiment약 161 MB · q8 양자화
리뷰 텍스트를 별점 1~5개로 분류합니다. 다국어 BERT 기반이라 한국어도 처리합니다.
🗂 모델 관리
로드된 모델 합계 약 0 MB- 다국어 감정 분석 (1~5점)Xenova/bert-base-multilingual-uncased-sentiment약 161 MB
- 문장 임베딩 (영어 중심)Xenova/all-MiniLM-L6-v2약 22 MB
- 문장 임베딩 (다국어)Xenova/paraphrase-multilingual-MiniLM-L12-v2약 113 MB
- 번역 한국어 → 영어Xenova/opus-mt-ko-en약 108 MB
- 번역 영어 → 한국어 (대용량)Xenova/m2m100_418M약 603 MB
- 제로샷 분류 (NLI)Xenova/nli-deberta-v3-xsmall약 83 MB
- 영어 기사 요약Xenova/distilbart-cnn-6-6약 271 MB
🔒 모델은 huggingface.co에서 다운로드되어 브라우저(Cache Storage)에 캐시됩니다. 입력 텍스트는 어디에도 전송되지 않습니다. 언로드하면 메모리에서 해제되지만 캐시된 파일은 남아 있어 다시 로드해도 재다운로드하지 않아요.
⚙️ 작동 원리
- PyTorch로 학습된 모델을 ONNX 포맷으로 변환한 것(Xenova 변환본)을 huggingface.co CDN에서 받아 브라우저에 캐시합니다.
- 추론은 ONNX Runtime Web이 담당합니다 — 기본은 WebAssembly(WASM, CPU)이고, 지원 브라우저에서는 WebGPU로 가속을 시도한 뒤 실패하면 WASM으로 자동 폴백합니다.
- 서버·API 키·요청당 비용이 전부 없습니다. 모든 모델은 8bit 양자화(q8) 버전이라 표기된 용량만 내려받아요.
이런 온디바이스 AI가 궁금하다면 블로그에서 AI Engineer 관련 글을 검색해 보세요.