Chaos and Order

💡 왼쪽 원문을 읽으면서 오른쪽에 따라 써보세요. Tab 키로 힌트를 받을 수 있습니다.

프롤로그 — Lemonade IPO 5년, 그리고 K-ICS 시대

2020년 7월 Lemonade가 NYSE에 상장했을 때, 월스트리트의 반응은 두 가지였다. "보험사가 SaaS PER을 받는 게 말이 되나"와 "이제 보험은 소프트웨어다." 그로부터 6년이 지난 2026년, 그 질문은 결론에 가까워졌다. 인수(underwriting)와 보험금 지급(claims)의 코어 로직이 알고리즘으로 옮겨갔다.

미국에서는 Lemonade·Root·Hippo·Ladder·Bestow·Ethos가 자기 카테고리를 만들었고, Policygenius·The Zebra·Insurify·Gabi는 비교 마켓플레이스로 자리 잡았다. 전통사도 손을 놓고 있지 않다 — AIG·Allstate·State Farm·Geico는 ML 기반 pricing 엔진을 자체 구축했고, MetLife·Prudential은 ML로 의료 underwriting을 가속한다.

한국에서는 2023년 K-ICS(신지급여력제도)가 본격 시행되면서 보험사가 자산·부채를 시가 평가하게 됐다. 자본 효율을 높이려면 인수의 정확도와 속도가 핵심이 됐고, 삼성생명·교보생명·한화생명이 AI 인수를 도입했다. 손해보험에서는 KB손해보험·현대해상이 사기 탐지 AI를, 캐롯손해보험은 텔레매틱스 기반 퍼마일(per-mile) 자동차보험을 운영한다.

일본은 ソルベンシー2 호환을 거쳐 일본판 ICS(Insurance Capital Standard) 도입을 2025-2027년 사이에 단계적으로 진행 중이다. 다이이치생명의 himawari AI, 일본생명(日本生命)의 AI 인수, ライフネット生命의 인터넷 전용 종신보험, SBI 손해보험의 자동차 보험 사기 탐지가 대표 사례다.

이 글은 이 지도를 그린다. 무엇이 인수(underwriting)이고, 왜 AI로 바뀌었고, 어떤 알고리즘이 쓰이며, 어떻게 검증하고, 어떻게 규제되는지.

1장 · 전통 underwriting vs AI underwriting

전통적 인수 프로세스는 길었다. 종신보험 한 건이 청약에서 발행까지 보통 4-6주가 걸렸다. 인수자가 청약서·건강 진단서·소득 증빙·신용 보고서·MIB(Medical Information Bureau) 기록·약물 데이터베이스(Milliman IntelliScript)를 수작업으로 검토했기 때문이다.

AI 인수는 이 흐름을 두 갈래로 바꿨다.

차원	전통 underwriting	AI underwriting
처리 시간	종신보험 4-6주, 자동차 1-3일	종신 즉시-72시간, 자동차 즉시
데이터	청약서·건진·MIB·서면 면담	청약서 + 텔레매틱스·IoT·의료 API·소셜 시그널
알고리즘	룰 기반 + 인수자 재량	GBM/XGBoost·neural net + 룰 가드레일
보험금 처리	조정자 수작업	NLP·CV 자동 트리아주, 일부 즉시 지급
가격	연령·성별·위험군 평균	개인화·다이내믹
사기 탐지	사후 조정자 + 외부 SIU	모델 기반 사전·실시간 탐지
규제	룰 명문화 가능	NAIC AI Bulletin·EU AI Act·국내 가이드라인

핵심은 데이터의 폭과 신선도다. 전통은 청약 시점의 정적 데이터에 의존하지만, AI는 텔레매틱스·IoT·웨어러블이 만들어내는 시계열 시그널을 활용한다. 그래서 가격이 단지 더 정교해지는 게 아니라, "안전운전을 하면 보험료가 내려가는" 행동 인센티브가 가격 모델에 직접 들어간다.

2장 · Lemonade — Maya·Jim·`<3초` 보험금 지급

Lemonade는 2015년 뉴욕에서 시작했다. 핵심은 두 가지 — 챗봇 인수와 고정 수수료 P2P 모델.

Maya: 청약 챗봇. 30초 안에 가입을 끝내는 게 목표. 거주지·재산 가치·이전 보험 이력을 묻고 즉시 견적.
Jim: 클레임 챗봇. 사고 신고를 받고, AI로 사진·문서·진술을 검증해 자동 지급. 가장 빠른 기록은 <3초.

Lemonade의 P2P 모델은 보험료의 25%를 고정 수수료로 가져가고, 나머지에서 클레임을 지급한 후 남은 차액을 자선단체로 보낸다(Giveback). 이 구조 덕분에 클레임 부인(claim denial) 인센티브가 약해진다.

핵심 모델은 사기 탐지에 집중되어 있다. AI Jim은 클레임 신고 영상을 분석해 18가지 antifraud 신호를 추출하고, threshold 위면 즉시 지급, 아래면 사람 조정자로 라우팅한다.

# Lemonade 스타일: 클레임 트리아주 의사결정 모델 (개념 코드)
import numpy as np
from xgboost import XGBClassifier

# 입력 피처: 사용자 시그널 + 클레임 텍스트/메타 + 디바이스 핑거프린트
FEATURES = [
    "policy_age_days",       # 가입 후 일수
    "claim_amount_usd",      # 청구 금액
    "prior_claims_12m",      # 12개월 이전 청구 횟수
    "device_risk_score",     # 디바이스 핑거프린트 위험도
    "geo_risk_score",        # 지역 사고 발생률
    "voice_stress_score",    # 음성 진술 스트레스 신호
    "photo_metadata_anom",   # 사진 EXIF 변조 의심도
    "text_inconsistency",    # 진술 텍스트 일관성
]

model = XGBClassifier(
    n_estimators=600,
    max_depth=5,
    learning_rate=0.05,
    subsample=0.8,
    colsample_bytree=0.8,
    eval_metric="auc",
)

# 모델 예측 → 액션 라우팅
def triage(claim_features, model, auto_threshold=0.05, review_threshold=0.35):
    """auto_threshold 미만은 즉시 지급, 그 이상은 사람 검토."""
    risk = float(model.predict_proba(np.array([claim_features]))[0][1])
    if risk < auto_threshold:
        return {"action": "auto_pay", "risk": risk}
    if risk < review_threshold:
        return {"action": "human_review", "risk": risk}
    return {"action": "siu_investigation", "risk": risk}

<3초 지급의 비밀은 모델이 빠른 게 아니라, 모델이 확률 분포 양 끝에서만 의사결정을 자동화한다는 점이다. 회색 지대는 항상 사람으로 간다.

3장 · Root — 텔레매틱스가 가격을 만든다

Root Insurance(2015, 오하이오)는 가장 공격적인 텔레매틱스 사업자다. 가입 전 사용자가 스마트폰 앱을 켜고 보통 2-3주간 운전을 하면, 그 데이터로 가격이 결정된다. 데이터가 부족하거나 운전 점수가 낮으면 인수 자체를 거절한다.

수집되는 시그널:

가속·감속 패턴
코너링 g-force
핸들링 변동성
야간/심야 주행 비중
휴대전화 사용(주행 중 화면 조작)
통근 거리·고속도로 비율
GPS 기반 누적 마일리지

Root의 모델은 이를 driver_score(0-100)로 압축하고, 지역·차종·연령·신용 같은 전통 시그널과 결합해 가격을 만든다. 가격 모형은 일반화 가법 모델(GAM)과 그래디언트 부스팅의 앙상블이다.

# Root 스타일: 텔레매틱스 driver_score 모델 (개념 코드)
import lightgbm as lgb

TELEMATICS_FEATURES = [
    "hard_brake_per_100mi",
    "hard_accel_per_100mi",
    "cornering_g_p95",
    "night_driving_pct",
    "phone_usage_min_per_100mi",
    "highway_pct",
    "miles_per_week",
    "trip_count_per_week",
]

# 표적은 6개월 내 손해율 (loss ratio)
params = {
    "objective": "regression",
    "metric": "rmse",
    "learning_rate": 0.03,
    "num_leaves": 63,
    "feature_fraction": 0.9,
    "bagging_fraction": 0.8,
    "bagging_freq": 5,
}
booster = lgb.train(params, train_set, num_boost_round=2000)

규제 측면의 쟁점은 차별성이다. NAIC AI Bulletin은 "Proxy discrimination"(우편번호 등 변수가 인종의 대리지표가 되는 것)을 우려한다. Root는 2024년 캘리포니아 DOI(Department of Insurance)와 합의해 일부 시그널의 가중치를 조정했다.

4장 · Hippo — 주택 IoT로 화재·누수를 예방

Hippo Insurance(2015, 캘리포니아)는 주택보험에 IoT를 결합했다. 가입자에게 무료로 스마트 누수 센서·연기 감지기·도어 센서를 보내고, 데이터를 받아 사고를 사전에 막는다. 이 모델은 손해를 지급하는 것보다 손해를 예방하는 게 싸다는 직관에서 출발한다.

핵심 데이터 소스:

항공 사진·위성 이미지(지붕 상태·수목 근접도) — Cape Analytics, ZestyAI API.
정부 화재·범죄·홍수 데이터.
스마트 디바이스 텔레메트리(누수 감지 시 자동 차단 밸브 트리거).
청약 시 셀카로 주택 사진 업로드 → CV 모델이 외관·옥내 상태 판단.

Hippo는 이를 HomeProtect Score로 결합한다. 점수가 일정 이하이면 예방 서비스가 트리거 — 누수 센서 무료 발송, 지붕 검사, 정기 점검 알림.

규제 측면에서 흥미로운 점은 gradient boosting 모델의 가격 결정 영향을 NAIC 가이드라인에 따라 설명 가능하게 만들어야 한다는 것이다. Hippo는 SHAP 값을 청약자에게 reason code로 노출한다.

5장 · Ladder·Bestow·Ethos — 종신보험 인수의 자동화

종신보험 인수의 자동화는 자동차·주택보다 어렵다. 의료 데이터의 비중이 크고, 보장 기간이 길어 잘못된 인수의 손실이 누적되기 때문이다.

Ladder (2017, 캘리포니아): 가입자가 보장 한도를 자유롭게 늘리고 줄일 수 있는 "사다리형" 종신. 인수는 5분 자동, 일부는 paramedic 면담으로 라우팅.
Bestow (2016, 텍사스): API 우선 인프라. 다른 보험사가 Bestow의 인수 API를 호출해 자기 브랜드로 종신보험을 판매할 수 있다(BaaS).
Ethos (2016, 캘리포니아): "혈액검사 없는 종신"을 표방. 의료 검사 없이 의료 데이터베이스·약물 처방·운전 기록 등으로 인수.

이들이 공통으로 사용하는 데이터 파이프라인:

MIB(Medical Information Bureau) 기록
Milliman IntelliScript(약물 처방 데이터)
LexisNexis Risk Solutions(공적 기록·신용)
MVR(Motor Vehicle Records)
청약자의 자기 신고 + 식별자 매칭

-- 종신보험 인수 데이터 마트 — Ladder/Bestow/Ethos 스타일 결합 쿼리
SELECT
  a.applicant_id,
  a.dob,
  a.gender,
  a.smoker_status,
  a.bmi,
  a.requested_coverage_usd,
  m.rx_burden_score,           -- IntelliScript 처방 부담 점수
  l.public_record_flags,       -- LexisNexis 공적 기록 플래그
  v.mvr_violations_24m,        -- 최근 24개월 운전 위반
  mb.mib_alerts                -- MIB 알림
FROM applications a
LEFT JOIN intelliscript m   ON m.applicant_id = a.applicant_id
LEFT JOIN lexisnexis_pub l  ON l.applicant_id = a.applicant_id
LEFT JOIN mvr_records v     ON v.applicant_id = a.applicant_id
LEFT JOIN mib m_bureau mb   ON mb.applicant_id = a.applicant_id
WHERE a.created_at >= '2026-05-01'
  AND a.product_code = 'TERM_LIFE_20Y'

리스크 모델은 일반적으로 다음과 같은 단계로 작동한다.

청약자 식별자(이름·생년월일·SSN tail·주소)로 데이터 소스 매칭.
결측치 처리·이상치 클립.
후보 모델: GBM(XGBoost/LightGBM/CatBoost), 신경망, 룰 기반 가드레일의 앙상블.
SHAP 기반 설명력 산출.
의사결정 룰: 자동 승인 / 자동 거절 / paramedic 면담 / 인수자 검토.

6장 · Policygenius·The Zebra·Insurify — 비교 마켓플레이스

비교 마켓플레이스는 자체적으로 보험을 인수하지는 않지만, 인수 의사결정의 진입점이라는 점에서 중요하다. 사용자가 어떤 회사의 견적을 보는지를 결정한다.

Policygenius (2014, 뉴욕): 종신·건강·주택·자동차·반려동물 보험까지. 2024년 Zinnia(Eldridge)에 인수. 종신보험 매칭에 강함.
The Zebra (2012, 텍사스): 자동차 보험 비교. 200개 이상의 보험사 견적 통합.
Insurify (2013, 매사추세츠): AI 챗봇 Evia. 자동차·생명·주택 비교.
Gabi (2017, 캘리포니아): 사용자의 기존 폴리시 PDF를 업로드받아 자동 비교. 2021년 Experian이 인수.

마켓플레이스는 두 가지 알고리즘으로 동작한다. 하나는 사용자-보험사 매칭 모델(어떤 보험사가 이 사용자에게 견적을 줄 가능성이 높은가), 다른 하나는 랭킹 모델(매칭된 견적을 어떻게 정렬할 것인가). 후자는 사용자 클릭·전환 데이터로 학습된다.

규제 측면의 핵심은 공정성이다. 마켓플레이스가 특정 보험사를 우대해 보여주면 NAIC Unfair Trade Practices Act 위반이 될 수 있다. 그래서 SHAP/LIME 같은 explainability 도구가 마켓플레이스 내부 감사에도 쓰인다.

7장 · 알고리즘 stack — GBM, XGBoost, neural net

2026년 보험 인수 모델의 주력은 여전히 그래디언트 부스팅이다. 신경망은 의료 영상·OCR·NLP에서 보조 역할을 한다.

선택 기준:

표 형식 + 중간 규모 데이터(수십만-수억 행): GBM이 거의 항상 신경망보다 빠르고 정확하다.
이미지·텍스트·시계열 원시 데이터: CNN·트랜스포머가 강하다.
설명력이 핵심: GLM·GAM이 안전. SHAP를 GBM에 붙이는 게 차선.

모델	강점	단점	보험 적용
GLM (Generalized Linear Model)	설명 직관적, 규제 친화	비선형 약함	가격 산출, 액추어리 베이스라인
GAM (Generalized Additive Model)	비선형 + 설명 가능	상호작용 표현 어려움	Root의 driver score
XGBoost / LightGBM / CatBoost	표 데이터 강함, SHAP 호환	추론 비용, 튜닝 부담	종신 인수, 클레임 사기
신경망(MLP)	고차원 상호작용	설명력 약함, 데이터 많이 필요	청약자 임베딩
CNN	영상 분석	데이터·자원 부담	사고 사진, 위성/항공 이미지
트랜스포머	텍스트·시계열	비용·환각	클레임 텍스트, 의료 노트
GLM + GBM 잔차	규제 + 정확도	운영 복잡도	Allstate·Geico 가격

8장 · 텔레매틱스 데이터 처리

텔레매틱스 데이터는 100Hz 단위의 시계열이다. 1년 운전이면 1억 행 이상의 raw가 쌓인다. 보관·전처리·집계가 핵심이다.

전형적 데이터 파이프라인:

수집: 스마트폰 SDK 또는 OBD-II 동글. Kafka로 적재.
세션화: 시동-종료 구간을 trip으로 분할.
품질 필터: GPS 결손, 가속도계 노이즈 제거.
이벤트 라벨링: 급가속·급제동·코너링·정지 등 라벨.
윈도잉: 100마일·7일·30일 윈도우로 집계.
피처 스토어: Feast/Tecton에 적재. 모델 학습·추론에서 동일 피처.

# 텔레매틱스 피처 파이프라인 (개념적 Feast feature view)
- name: telematics_driving_features_7d
  entities: [driver_id]
  ttl: 30d
  source:
    type: kafka
    topic: telematics.events.v1
  features:
    - name: hard_brake_per_100mi
      dtype: float
    - name: hard_accel_per_100mi
      dtype: float
    - name: night_driving_pct
      dtype: float
    - name: phone_usage_min_per_100mi
      dtype: float
    - name: cornering_g_p95
      dtype: float
  online_store: redis
  offline_store: snowflake

운영 이슈는 데이터 신선도다. 견적 시점에 사용자의 driver_score를 즉시 반영하려면 온라인 스토어 latency가 <100ms 이내여야 한다. 한국의 캐롯손해보험과 일본의 SBI 손해보험도 비슷한 아키텍처를 운영한다.

9장 · IoT 주택 데이터 — Hippo·Hippo·Cape Analytics

주택 IoT 데이터는 텔레매틱스보다 데이터 양은 적지만 종류가 많다.

누수 센서: 1분 단위 습도·온도·압력.
연기·일산화탄소 감지기: 알람 이벤트 + 상태 핑.
도어·창문 센서: 개폐 이벤트.
스마트 잠금: 잠금 상태·접근 시도.
항공/위성 이미지: 분기별. 지붕·수목·풀장·구조물.

이걸 모두 결합하면 주택 위험에 대한 2026년형 risk score가 나온다. 손해율 예측뿐 아니라, 사전 개입 트리거에도 쓰인다. Hippo는 사용자에게 알림을 보낸다 — "지붕에 이끼가 자랐습니다. 전문가 점검을 추천합니다."

{
  "policy_id": "HPO-2026-998877",
  "home_risk_features": {
    "roof_age_years": 12,
    "roof_condition_score": 0.62,
    "tree_overhang_score": 0.78,
    "pool_present": true,
    "fire_zone_risk": "moderate",
    "neighborhood_burglary_index": 41,
    "leak_sensors_installed": 4,
    "smoke_detectors_active": 6
  },
  "predicted_loss_ratio_24m": 0.43,
  "premium_discount_applied_pct": 12
}

10장 · 의료 데이터 AI 분석 — 종신보험의 코어

종신보험 인수에서 의료 데이터는 모델의 정확도를 결정한다. 미국에서는 다음 데이터 소스가 표준이다.

MIB: 보험 신청 시 보고된 의료 정보의 산업 공유 DB.
Milliman IntelliScript: 처방전 데이터. 5-7년의 약물 이력.
ExamOne·LabCorp: paramedic 면담 결과(혈액·소변·체질량).
Human API·Health Gorilla: 사용자의 동의 하에 EHR(전자의무기록) 가져오기.
Apple Health·Google Fit: 웨어러블 데이터 (선택).

ML 측면에서는 EHR 텍스트의 NLP가 가장 까다롭다. 의사 노트는 약어·오탈자·축약이 많다. 그래서 보험사는 BERT/clinical BERT 계열을 fine-tune해 사용한다.

흥미로운 사례는 Munich Re·SCOR 같은 재보험사들이 clinical NLP API를 자체 운영하는 것이다. 그들의 모델은 다양한 보험사의 데이터로 학습되어, 단일 보험사의 모델보다 일반화가 잘 된다.

11장 · 자동 보험금 지급 — Lemonade의 `<3초` 비밀

Lemonade의 AI Jim이 <3초 안에 지급할 수 있는 이유는 모델이 빠른 게 아니라 자동 지급의 범위가 좁기 때문이다.

자동 지급 조건의 예:

청구 금액 <$500/mo 수준.
가입 후 90일 경과(churn-and-claim 사기 방지).
클레임 유형이 단순(파손·도난).
진술·증빙의 일관성 점수가 임계 위.
디바이스·지리·행동 핑거프린트가 정상 분포.
단일 보험증권의 12개월 클레임 횟수 <3회.

위 조건 중 하나라도 빠지면 사람 조정자로 라우팅된다. 자동 지급의 핵심은 빠른 결정이 아니라, 빠르게 자동 지급 가능 여부를 판별하는 것이다.

# 자동 클레임 지급 결정 로직 (개념 코드)
from dataclasses import dataclass

@dataclass
class ClaimContext:
    amount_usd: float
    policy_age_days: int
    claim_type: str
    statement_consistency: float
    device_score: float
    geo_score: float
    behavior_score: float
    prior_claims_12m: int

def can_auto_pay(c: ClaimContext) -> bool:
    if c.amount_usd >= 500:
        return False
    if c.policy_age_days < 90:
        return False
    if c.claim_type not in ("damage_simple", "theft_simple"):
        return False
    if c.statement_consistency < 0.85:
        return False
    if c.device_score < 0.7 or c.geo_score < 0.7 or c.behavior_score < 0.7:
        return False
    if c.prior_claims_12m >= 3:
        return False
    return True

12장 · 클레임 사기 탐지 — KB손보·SBI손보의 접근

클레임 사기는 전 세계 손해보험사 손해율의 5-15%를 차지한다고 추정된다. 그래서 사기 탐지(claim fraud detection)는 인수만큼 중요한 ML 적용 영역이다.

전형적 사기 패턴:

동일 차량·운전자의 반복 클레임(soft fraud).
가입 직후 클레임(churn-and-claim).
사고 직후 동시다발 클레임(staged accident).
의료 과잉 진료(provider fraud).
부풀린 손해(inflated claim).

# 사기 탐지: XGBoost + 그래프 임베딩 결합 (개념 코드)
import xgboost as xgb
import shap

FRAUD_FEATURES = [
    "policy_age_days",
    "claim_amount_usd",
    "prior_claims_12m_count",
    "claim_to_premium_ratio",
    "provider_risk_score",       # 동일 의료기관/정비소의 클레임 집중도
    "ring_score",                # 가입자-수리기사-진단의 네트워크 임베딩
    "device_anomaly_score",
    "geo_anomaly_score",
    "text_consistency_score",
]

dtrain = xgb.DMatrix(X_train, label=y_train, feature_names=FRAUD_FEATURES)
params = {
    "objective": "binary:logistic",
    "max_depth": 6,
    "eta": 0.05,
    "subsample": 0.8,
    "colsample_bytree": 0.8,
    "eval_metric": "auc",
    "scale_pos_weight": 30,      # 불균형 라벨
}
booster = xgb.train(params, dtrain, num_boost_round=1500)

# SHAP로 reason code 산출 — NAIC AI Bulletin 대응
explainer = shap.TreeExplainer(booster)
shap_values = explainer.shap_values(X_inference)

한국의 KB손해보험은 2023년부터 AI 사기 탐지 시스템을 운영한다. 손해사정·SIU(Special Investigation Unit) 워크플로우에 ML 점수가 통합돼, 조사관이 우선순위가 높은 케이스부터 검토한다. 일본의 SBI손보·도쿄해상·미쓰이스미토모해상은 같은 패턴이다.

13장 · 그래프 기반 ring fraud 탐지

자동차·의료 사기의 상당 부분은 링(ring) 형태로 일어난다. 동일한 정비공장·의사·변호사·운전자 네트워크가 반복적으로 등장한다. 이건 표 형식 ML로는 잘 안 잡힌다. 그래프가 필요하다.

전형적 그래프 스키마:

노드: 청약자, 클레임, 차량, 정비공장, 의사, 변호사, 보험설계사.
엣지: "청약자—클레임", "차량—사고", "정비공장—수리", "의사—진단", "변호사—대리".

여기에 노드 임베딩(Node2Vec, GraphSAGE, GAT)을 적용해 각 청약자·정비공장의 위험 임베딩을 만든다. 임베딩이 다른 신호와 결합돼 사기 점수에 들어간다.

# Node2Vec 기반 ring score (개념 코드)
from node2vec import Node2Vec
import networkx as nx

# G: 청약자-클레임-정비공장-의사-변호사 등 다중 엣지 그래프
n2v = Node2Vec(G, dimensions=64, walk_length=30, num_walks=200, p=1.0, q=0.5)
model = n2v.fit(window=10, min_count=1, batch_words=4)

# 청약자별 임베딩 → 다른 모델의 피처로 사용
def get_ring_embedding(node_id):
    return model.wv[str(node_id)]

NAIC AI Bulletin 관점에서는 이 모델의 사용도 explainability 의무가 부과된다 — 임베딩 차원만으로는 reason code가 안 된다. 그래서 그래프 기반 점수를 사용할 때는 "이 청약자는 정비공장 X와 12건의 클레임 공유"처럼 자연어 reason을 함께 출력한다.

14장 · NAIC AI Bulletin — 미국 보험 규제의 표준

NAIC(National Association of Insurance Commissioners)는 2023년 12월 Model Bulletin on the Use of Artificial Intelligence Systems by Insurers를 발표했다. 2026년 현재 거의 모든 주가 채택하거나 채택을 진행 중이다.

핵심 의무:

AI 시스템 거버넌스 프로그램(AISGP): 이사회·경영진 단위의 거버넌스 명문화.
데이터·모델 위험 평가: 데이터 출처, 편향, 정확도, 안정성.
벤더 거버넌스: 외부 벤더 AI 사용 시도 보험사의 책임.
테스트·검증·모니터링: 출시 전 검증과 운영 중 모니터링.
소비자 보호: reason code 제공, 인간 검토 경로.
기록 보관: 모델 결정 이력 추적 가능.

# NAIC AI Bulletin 요구사항 매핑 (개념 yaml)
ai_system: claim_triage_v3
deployment_state: production
governance:
  owner: chief_risk_officer
  review_cycle_days: 90
  board_review_required: true
risk_assessment:
  data_sources:
    - claim_intake_form
    - device_telemetry
    - third_party_geo_risk
  bias_metrics:
    - demographic_parity
    - equal_opportunity
  fairness_threshold: 0.05
testing:
  backtest_window_months: 12
  shadow_test_required: true
  champion_challenger_required: true
monitoring:
  drift_alert_psi_threshold: 0.2
  performance_alert_auc_drop: 0.03
consumer:
  reason_code_required: true
  adverse_action_letter_template: AAL-2026-V2
  human_review_path: /claims/escalate
records_retention_years: 7

NAIC Bulletin은 EU AI Act보다는 가볍지만, 실효성은 강하다 — 주 보험청이 즉시 검사·과징금이 가능하다. 2025년 캘리포니아·코네티컷·뉴욕이 첫 검사 라운드를 진행했다.

15장 · EU AI Act — 보험 인수는 high-risk

EU AI Act는 2024년 발효되어 2026년 본격 적용 중이다. 보험 인수에 직접적인 의미는 두 가지 카테고리에 있다.

High-risk AI: 생명·건강보험 인수, 가격 책정. Annex III에 명시.
Limited risk: 챗봇·고객 지원. 투명성 의무.

High-risk AI의 의무:

Risk management system (Article 9)
Data governance (Article 10): 학습·검증 데이터의 품질, 편향 검토.
Technical documentation (Article 11)
Record-keeping (Article 12): 로그 보존.
Transparency (Article 13): 사용자에게 AI 사용 고지.
Human oversight (Article 14): 최종 결정 권한.
Accuracy, robustness, cybersecurity (Article 15)
Quality management system (Article 17)
CE marking & registration (Article 49, 60)

벌금은 매출의 7% 또는 €35M 중 큰 금액. 보험사 입장에서 이건 거의 클래스 액션 수준의 리스크다.

EIOPA(European Insurance and Occupational Pensions Authority)는 보험 특화 가이드라인을 2025년 발표했다. 한국 금감원과 일본 금융청은 이를 참조해 자국 가이드라인을 운영한다.

16장 · explainability — SHAP·LIME·counterfactual

NAIC와 EU AI Act가 공통으로 요구하는 게 설명력이다. 2026년의 보험 ML 스택은 SHAP가 기본이고, LIME과 counterfactual이 보조다.

SHAP (SHapley Additive exPlanations): 모델 출력을 피처별 기여도로 분해. 글로벌·로컬 모두 가능. TreeSHAP는 GBM에서 정확.
LIME (Local Interpretable Model-agnostic Explanations): 임의의 모델 주위에 로컬 선형 모델을 적합. 모델 무관.
Counterfactual: "어떤 피처가 어떻게 바뀌면 결정이 달라지나"를 제시. DiCE·Wachter 등.

실무에서는 SHAP 값을 reason code로 변환하는 매핑 테이블을 운영한다.

# SHAP → 자연어 reason code 매핑 (개념 코드)
REASON_CODES = {
    "claim_amount_usd": "청구 금액이 평균 대비 상위 분위에 해당합니다.",
    "policy_age_days": "보험 가입 후 경과 기간이 짧습니다.",
    "prior_claims_12m_count": "최근 12개월 청구 횟수가 많습니다.",
    "provider_risk_score": "관련 의료기관/정비소의 청구 빈도가 높습니다.",
    "ring_score": "네트워크 분석상 다수 청구가 연결되어 있습니다.",
}

def shap_to_reason_codes(shap_values, feature_names, top_k=3):
    pairs = sorted(zip(feature_names, shap_values), key=lambda p: -abs(p[1]))
    codes = []
    for name, val in pairs[:top_k]:
        reason = REASON_CODES.get(name, name)
        codes.append({"feature": name, "shap": float(val), "reason": reason})
    return codes

소비자에게는 SHAP 값 그대로가 아니라 자연어 reason 3-5개를 보여준다. 이건 미국 Fair Credit Reporting Act(FCRA)의 adverse action notice 요구와도 부합한다.

17장 · 모델 모니터링과 drift

모델이 출시되면 모니터링이 필요하다. 데이터 분포가 변하면 정확도가 떨어지고, 그게 손해율 악화나 차별 신호로 이어진다.

2026년 표준 운영 지표:

PSI (Population Stability Index): 학습 시점과 운영 시점의 피처 분포 차이.
CSI (Characteristic Stability Index): 모델 출력 분포 변화.
Performance metrics: AUC, KS, calibration.
Fairness metrics: demographic parity, equal opportunity, calibration by group.
Volume: 클레임/견적 건수, 거절률.

이를 Evidently AI, Arize, Fiddler, WhyLabs 같은 ML observability 도구로 본다. 한국에서는 삼성SDS의 BrightICS, 일본에서는 자체 구축이 많다.

알람 룰의 예:

지표	임계	액션
PSI	`>0.2`	데이터 검토
PSI	`>0.25`	재학습 검토
AUC 하락	`>0.03`	챔피언/챌린저 비교
거절률 변동	`>5%`	비즈니스 검토
그룹별 캘리브레이션 차	`>5%`	bias 조사
Reason code 분포 변화	`>10%`	설명력 회귀 점검

재보험사는 보험사의 보험사다. 큰 손해를 분담하고, 자본 부담을 분산시킨다. 2026년의 새로운 흐름은 재보험사가 AI 모델 자체를 분담한다는 점이다.

Munich Re: aiSure — 모델의 손실에 대해 재보험 커버리지 제공. AI 모델이 예측 실패로 손실을 낼 때 그 손실을 커버.
Swiss Re: Magnum — 디지털 인수 플랫폼. 보험사가 호출해 종신 인수 의사결정을 받음.
SCOR: Velogica·SCOR Velogica — Magnum과 유사한 인수 자동화.

재보험사는 글로벌 데이터를 보유해 학습 데이터가 크다. 단일 보험사의 모델보다 일반화가 좋고, 특히 신생 보험사는 자체 데이터가 부족해 재보험사의 인수 모델을 그대로 쓰는 경우가 많다.

규제 측면에서 Munich Re의 aiSure는 NAIC Bulletin·EU AI Act의 벤더 거버넌스 의무를 다소 완화하는 효과를 낸다. 보험사가 자체 검증 + 재보험사 커버리지를 결합하면 리스크가 분산된다.

19장 · K-ICS와 한국 AI 인수 — 삼성생명·교보·한화·KB손보·현대해상

한국의 신지급여력제도 K-ICS는 2023년 1월 시행됐다. 보험사의 자산·부채를 시가로 평가해 RBC(Risk-Based Capital) 비율을 산출한다.

K-ICS RBC 비율의 핵심 식 (개념):

RBC ratio = (자본 - 보유위험) / (요구자본)

이때 보유위험은 보험·시장·신용·운영·집중 위험을 시뮬레이션으로 결합한다. AI 인수의 정확도가 떨어지면 보험위험이 커지고 요구자본이 커진다.

대표 사례:

삼성생명: AI 인수 시스템(자체명 비공개) 도입. paramedic 없이 자동 인수 비중을 확대.
교보생명: 의료 데이터 기반 인수 자동화.
한화생명: 청약 채널 디지털화 + 인수 자동화.
KB손해보험: AI 사기 탐지(자체 운영) + 자동차 보험 손해사정 자동화.
현대해상: 차량 손해 평가 AI(차량 사진으로 손상 견적).
DB손해보험: 텔레매틱스 자동차 보험 운영.
삼성화재: 다이렉트 채널의 AI 가격 결정 운영.
캐롯손해보험: 한화·SK가 합작. 퍼마일(Per-Mile) 자동차 보험. 텔레매틱스 표준.

금융감독원은 2024년 "금융분야 AI 가이드라인"을 발표했다. 보험사는 AI 인수 시스템에 대해 영향평가·기록 보관·소비자 보호 의무가 부과된다.

# 한국 금감원 AI 가이드라인 매핑 (개념적)
financial_ai_system: life_underwriting_v2
target_business: 종신보험_자동심사
impact_assessment:
  consumer_impact: high
  fairness_check_required: true
governance:
  model_governance_committee: true
  review_cycle_days: 180
records:
  retention_years: 5
consumer:
  algorithm_explainability_required: true
  human_review_path_url: https://example.kr/underwriting/escalate
incident_reporting:
  to_fss_within_days: 5

20장 · 일본의 AI 인수 — 다이이치생명·일본생명·ライフネット·SBI

일본은 보수적이지만 인구 감소·고령화로 보험 시장이 변화 중이다. AI 인수의 도입은 미국·한국보다 한 박자 늦지만 확실히 진행 중이다.

대표 사례:

다이이치생명(第一生命): himawari AI — 보험금 청구 사진 분석으로 자동 지급 일부 도입. paramedic 없는 종신 인수 확대.
일본생명(日本生命): 자체 AI 인수 운영. NTT Data와 협업.
明治安田生命(Meiji Yasuda): 그룹 종신·연금의 ML 가격 결정.
住友生命(Sumitomo Life): 건강 증진형 보험 Vitality(남아공 Discovery와 협업) — 웨어러블 데이터를 가격에 반영.
ライフネット生命(LIFENET): 인터넷 전용. 청약 5분, 인수 빠름.
SBI 損害保険: 자동차 보험 사기 탐지 AI.
東京海上日動(Tokio Marine): 클레임 자동화·기업 보험 AI.
三井住友海上(MS&AD): 차량 손해 사정 AI.

일본 금융청은 2025년 "保険AIガバナンスガイドライン"을 발표했다. EIOPA와 NAIC를 참조해 만들었고, 일본판 ICS 도입 일정과 맞물려 단계 도입 중이다.

일본판 ICS는 IAIS(국제보험감독자협의회)의 ICS 2.0을 토대로, 일본의 시장 구조에 맞춘 자본 규제다. 2025-2027년 사이에 시행, 2030년 본격 적용 예정. K-ICS와 마찬가지로 보험사의 인수 정확도가 자본 부담에 직접 영향을 준다.

21장 · 차별·편향 — proxy discrimination의 함정

AI 인수의 가장 큰 규제 쟁점은 차별이다. NAIC, EU AI Act, 한국 금감원, 일본 금융청 모두가 우려하는 부분이다.

핵심 개념:

Disparate treatment: 명시적으로 보호 속성(인종·성별·종교 등)을 사용. 거의 항상 위법.
Disparate impact: 명시적으로 사용 안 했지만, 결과적으로 보호 그룹에 불리한 영향. 미국에서는 ECOA·Fair Housing Act 등이 적용.
Proxy discrimination: 보호 속성과 강하게 상관된 변수(우편번호·성씨 패턴·차종)를 사용해 사실상 차별. NAIC AI Bulletin의 핵심 우려.

검증 방식:

# 편향 검증 — demographic parity / equal opportunity 점검
import pandas as pd

def fairness_report(df, score_col, label_col, group_col, threshold=0.5):
    df = df.copy()
    df["pred"] = (df[score_col] >= threshold).astype(int)
    out = []
    for g, sub in df.groupby(group_col):
        pos_rate = sub["pred"].mean()
        tpr = ((sub["pred"] == 1) & (sub[label_col] == 1)).sum() / max(
            (sub[label_col] == 1).sum(), 1
        )
        fpr = ((sub["pred"] == 1) & (sub[label_col] == 0)).sum() / max(
            (sub[label_col] == 0).sum(), 1
        )
        out.append({"group": g, "pos_rate": pos_rate, "tpr": tpr, "fpr": fpr})
    return pd.DataFrame(out)

실무에서는 학습 데이터에서 보호 속성을 직접 빼는 게 아니라, 인지하고 검증하는 게 우선이다. 그 후 우편번호 같은 강한 proxy를 제거하거나 가중치를 조정한다.

22장 · 가격 차별 vs 가격 개인화 — 어디까지가 합법인가

보험 가격은 위험에 기반한 차별이 합법이다. 그 차별이 보호 속성과 무관한 경우에 한해서다. 그래서 다음과 같은 흐름이 표준이 됐다.

시그널	합법 (US/EU/KR/JP 대부분)	주의	거의 불법
운전 기록	합법	—	—
신용 점수	미국 일부 주 합법, 캘리포니아 등은 자동차에서 금지	—	일부 EU 국가
우편번호	합법	proxy 가능	—
직업	합법	—	—
성별	미국 일부 주 합법	EU 2012 Test-Achats 판결 후 금지	EU
인종·종교	—	—	모두 불법
텔레매틱스	합법	proxy 검증 필요	—
웨어러블	합법 (동의 시)	의료 데이터 보호	—
소셜 데이터	미국 일부 합법	광범위 우려	EU 강한 제약

EU의 Test-Achats 판결은 2012년에 성별 차별을 보험 가격에 사용 못 하게 했다. 그 결과 EU의 자동차·생명·건강 보험은 성별 무관 가격이 표준이다. 미국은 주별로 다르다.

23장 · 종합 비교 — US/EU/KR/JP 규제 매트릭스

항목	US (NAIC)	EU (AI Act + EIOPA)	KR (FSS)	JP (FSA)
AI 인수 분류	모델 규제 가이드라인	High-risk AI	금융 AI 가이드라인	보험 AI 가이드라인
위반 시	주별 과징금·면허 정지	매출 7% 또는 35M EUR	시정명령·과징금	행정처분
설명력	reason code 필수	Article 13/14	설명 가능성 의무	透明性 의무
인간 감독	의무	Article 14	인간 검토 경로	인간 검토 경로
기록 보관	6-7년	Article 12	5년	5년
자본 규제	RBC	Solvency II	K-ICS	일본판 ICS
편향 모니터링	의무	Article 10	의무	의무
벤더 책임	보험사 책임	Article 16, 28	보험사 책임	보험사 책임
외부 데이터	FCRA 등	GDPR	개인정보보호법	個人情報保護法

24장 · 운영 체크리스트 — 새 AI 인수 모델을 출시하기 전에

마지막으로 실무 체크리스트.

데이터 출처 문서화: 모든 학습·검증 데이터의 출처·라이선스·동의 기록.
편향 검토: demographic parity, equal opportunity, calibration by group.
proxy 점검: 우편번호·차종·직업 등 강한 proxy의 SHAP 영향도 측정.
설명력: SHAP 기반 reason code 5개 이상.
인간 검토 경로: 거절·고위험 케이스의 escalation 워크플로우.
챔피언/챌린저: 새 모델은 트래픽의 5-10%부터 시작.
PSI/AUC 모니터링: 데이터·성능 drift 알림.
재학습 주기: 분기·반기 단위.
벤더 거버넌스: 외부 모델 사용 시 SLA·테스트 결과 기록.
사고 대응: 모델이 잘못된 결정을 했을 때의 환수·보상·재처리 SOP.
로그 보관: 결정의 입력·출력·모델 버전을 추적 가능하게 저장.
소비자 공지: AI 사용 사실·이의 신청 경로 명시.
규제 보고: NAIC/EIOPA/금감원/금융청 보고 양식·주기.
자본 영향: K-ICS·일본판 ICS·Solvency II 자본 부담 시뮬레이션.

이 14개가 2026년의 표준이다. 무엇보다 중요한 건 AI 인수의 효율성과 책임성이 같은 무게를 갖는 것이다. 빠른 견적과 자동 지급이 가능해진 만큼, 잘못된 결정의 사회적 비용도 같이 커졌다. Lemonade의 <3초 지급은 마케팅 카피이지만, 그 뒤에는 14개의 가드레일이 있다.

References

Lemonade — https://www.lemonade.com/
Root Insurance — https://www.root.com/
Hippo — https://www.hippo.com/
Ladder — https://www.ladderlife.com/
Bestow — https://www.bestow.com/
Ethos — https://www.ethoslife.com/
Policygenius — https://www.policygenius.com/
The Zebra — https://www.thezebra.com/
Insurify — https://insurify.com/
NAIC AI Model Bulletin — https://content.naic.org/sites/default/files/inline-files/2023-12-4%20Model%20Bulletin_Adopted_0.pdf
NAIC Home — https://www.naic.org/
EIOPA — https://www.eiopa.europa.eu/
EU AI Act — https://artificialintelligenceact.eu/
Munich Re aiSure — https://www.munichre.com/
Swiss Re Magnum — https://www.swissre.com/
SCOR Velogica — https://www.scor.com/
손해보험협회 (KGIA) — https://www.kgia.or.kr/
생명보험협회 (KLIA) — https://www.klia.or.kr/
일본생명보험협회 — https://www.seiho.or.jp/
다이이치생명 — https://www.dai-ichi-life.co.jp/
ライフネット生命 — https://www.lifenet-seimei.co.jp/
SHAP (SHapley Additive exPlanations) — https://shap.readthedocs.io/
LIME — https://github.com/marcotcr/lime
Cape Analytics — https://capeanalytics.com/
ZestyAI — https://zesty.ai/