- Published on
합성 미디어 탐지 & 콘텐츠 진정성 2026 — C2PA / Content Credentials / JPEG Trust / TrueMedia.org / Sensity / SynthID / Reality Defender / GPTZero 심층 가이드
- Authors

- Name
- Youngju Kim
- @fjvbn20031
프롤로그 — 진짜냐는 질문이 인프라가 된 해
2024년까지는 "이 사진 진짜야?"라고 묻는 일이 가십이었다. 2026년에는 그 질문이 인프라다. 신문사는 사진을 사기 전에 출처 메타데이터를 확인한다. 보험사는 손해 사정 사진의 카메라 서명을 검증한다. 대학은 과제를 받기 전에 텍스트 탐지를 돌린다. 법원은 동영상 증거에 워터마크 분석을 요구한다. 플랫폼은 업로드 단계에서 SynthID 코드를 읽는다.
물어보지 않으면 큰일 난다는 분위기가 만들어졌다. 그리고 그 분위기를 떠받치는 건 한 사람의 눈이 아니라 표준·도구·정책·학술의 4분 체제다. 이 글은 그 지도를 한 장에 담는다 — 어떤 표준이 진짜 인프라가 됐고, 어떤 도구가 실전에 자리잡았고, 어떤 정책이 무너졌고, 어떤 연구가 다음을 정의하는지.
먼저 큰 그림. 합성 미디어 문제는 둘로 갈린다.
- 진정성(provenance) 측 — "이 콘텐츠는 어디서 왔나? 어떻게 만들어졌나? 변경됐나?" 카메라·편집툴·AI 생성기가 메타데이터로 답한다. C2PA·Content Credentials·JPEG Trust·SynthID·Truepic·Project Origin.
- 탐지(detection) 측 — "이 콘텐츠는 합성인가? 사람이 만들었나?" 모델이 분류로 답한다. TrueMedia.org·Sensity·Reality Defender·DeepMedia·Hive·Optic·Microsoft Video Authenticator·GPTZero·Originality.ai·Copyleaks·TurnItIn.
진정성은 사전적이다 — 만들 때 서명한다. 탐지는 사후적이다 — 이미 만들어진 걸 분류한다. 둘 다 필요하다. 진정성만으로는 서명 없는 콘텐츠를 처리 못 한다. 탐지만으로는 점점 작아지는 분류 오차를 영원히 쫓는다.
1장 · 2026년 합성 미디어 탐지 지도 — 네 분야의 격자
먼저 분류부터. 같은 단어를 다르게 쓰는 사람이 너무 많다.
| 분야 | 주요 플레이어 | 역할 | 출력 |
|---|---|---|---|
| 표준 (Standards) | C2PA, JPEG Trust(ISO 21617), CAI, Project Origin | 메타데이터·암호 서명 규격 | 사양 문서 + 라이브러리 |
| 워터마크 (Watermark) | Google SynthID, OpenAI Sora, Anthropic | 생성물에 보이지 않는 신호 삽입 | 디코더 + 라이선스 |
| 진정성 도구 (Provenance) | Adobe Content Credentials, Truepic, Microsoft Designer | 카메라·편집툴·AI에 C2PA 통합 | 제품 |
| 탐지 SaaS (Detection) | Sensity, Reality Defender, DeepMedia, Hive, Optic, TrueMedia.org | 이미지·영상·오디오 분류 API | 점수 + 리포트 |
| 텍스트 탐지 (Text) | GPTZero, Originality.ai, Copyleaks, TurnItIn | LLM 생성 텍스트 분류 | 확률 + 하이라이트 |
| 비디오 탐지 (Video) | Microsoft Video Authenticator, Sensity, DeepMedia | 영상 합성 분류 | 프레임별 점수 |
| 학술 (Academic) | KAIST, NICT, AISI Japan, MIT Media Lab, Berkeley CITRIS | 새 모델·새 공격·새 방어 | 논문 + 데이터셋 |
핵심 통찰 하나: 2026년의 답은 단일 솔루션이 아니다. 한 콘텐츠에 대해 진정성 메타데이터 + 워터마크 + 분류기 + 사람 검토가 겹쳐 작동한다. 한 층만 보면 항상 속는다. 그래서 이 분야를 배우는 첫 단계는 "어떤 도구가 제일 정확한가"가 아니라 "어떤 층이 무엇을 책임지는가"를 외우는 일이다.
또 하나: 2024-25년의 큰 변화는 워터마크가 "재밌는 연구"에서 "기본 옵션"으로 바뀐 점이다. OpenAI Sora 생성 영상에는 워터마크가 박혀 나온다. Google의 Imagen·Veo는 SynthID로 표시한다. Anthropic도 사실상 자체 워터마크 체계를 도입했다. 워터마크 없는 합성 콘텐츠가 점점 의심받는 시대가 됐다.
2장 · C2PA — 표준의 표준 (Adobe + Microsoft + BBC + IPTC + ARM + Intel + Sony + Truepic, 2021)
이 분야의 거의 모든 길은 C2PA로 통한다. Coalition for Content Provenance and Authenticity, 2021년에 Adobe·Microsoft·BBC·Intel·Truepic·Arm·Sony·IPTC 등이 만든 컨소시엄이다. 사양 문서(C2PA Specification)와 오픈소스 SDK(c2patool, c2pa-rs)를 푼다.
핵심 아이디어는 간단하다 — 콘텐츠에 암호적으로 서명된 매니페스트를 붙인다. 매니페스트는 "누가·언제·어떻게" 만들었는지, 그리고 그 이후 어떤 편집을 거쳤는지를 체인으로 기록한다. JPEG·PNG·WebP·MP4·WAV 등 거의 모든 파일 포맷에 임베드할 수 있고, 별도 사이드카 파일로도 가능하다.
# C2PA SDK 예시 — 이미지에 매니페스트 붙이기
c2patool input.jpg --manifest manifest.json --output signed.jpg
# 매니페스트 읽기
c2patool signed.jpg --info
# 핵심 필드:
# claim.signature -> X.509 인증서 체인
# claim.assertions[*].kind -> "c2pa.actions" | "c2pa.thumbnail" | "c2pa.training-mining" | ...
# claim.ingredients[*] -> 어떤 다른 콘텐츠가 들어왔나
C2PA가 답하는 질문:
- 이 파일을 누가 만들었나? (서명자의 인증서)
- 어떤 카메라/소프트웨어를 썼나? (
c2pa.actions) - AI가 들어갔나? (
c2pa.actions[].action == "c2pa.opened"+"c2pa.created"+ AI 라벨) - 이후 어떤 편집을 거쳤나? (액션 체인)
- AI 학습 데이터로 사용 허락했나? (
c2pa.training-mining)
한계도 분명: C2PA는 검증을 강제하지 않는다. 매니페스트를 떼고 다시 저장하면 그냥 일반 파일이 된다("strip and redistribute"). 그래서 C2PA는 "이 파일에 매니페스트가 있다면 그 내용은 신뢰할 수 있다"는 보증이지, "매니페스트 없는 파일은 가짜다"라는 보증이 아니다. 두 가지를 자주 혼동한다.
2026년 현재 C2PA는 1.4 사양이 안정화되어 있고, 카메라(Sony·Nikon·Canon·Leica), 소프트웨어(Photoshop·Lightroom·Premiere·Microsoft Designer), 플랫폼(LinkedIn·TikTok·Meta — 일부 단계로 표시 도입) 전반에 깔리고 있다. 사양은 합의됐고, 채택 곡선의 중반에 있다.
3장 · Content Credentials (Adobe) — C2PA의 대표 구현
Adobe Content Credentials는 C2PA의 가장 큰 실전 구현이다. Photoshop·Lightroom·Premiere Pro·Firefly·Adobe Stock 전반에 통합돼 있다. 어떤 파일을 편집하면 Photoshop이 알아서 매니페스트를 만들어 붙인다.
구체적으로 무엇을 기록하나:
- 누가 편집했나 (Adobe 계정 또는 익명)
- 언제·어떤 도구로 편집했나 (Photoshop 25.x, 2024-10-30T...)
- 어떤 액션(잘라내기·색보정·합성·AI 채우기 등)이 가해졌나
- AI 생성(Firefly·Generative Fill)이 들어갔는지
- 원본 썸네일 (어떻게 시작했는지 보여줌)
UI는 사진 우상단의 CR 배지다. 클릭하면 verify.contentauthenticity.org로 가서 매니페스트 체인을 열어볼 수 있다.
[Content Credential 매니페스트 예시]
File: nyt-front-page-photo.jpg
Issuer: Adobe Inc.
Created: 2026-04-15T10:23:11Z by Photoshop 25.6 (jdoe@nytimes.com)
Actions:
- c2pa.opened (DSC_0023.NEF from Sony α7 IV)
- c2pa.color_adjustments (Lightroom 13.5)
- c2pa.cropped
- c2pa.published
AI: None detected
Edits: 3 non-destructive
의미: 뉴스룸 입장에서 "이 사진이 어디서 왔는지, AI가 들어갔는지"를 한 번에 확인할 수 있다. AP 통신·BBC·로이터·뉴욕타임스가 도입 중이다.
한계: Adobe 생태계 안에서만 잘 돈다. 다른 도구로 한 번 다녀오면 체인이 끊긴다. 그리고 Content Credentials 메타데이터를 떼어내는 도구도 이미 존재한다(역설적으로 메타데이터 정리 도구들). 보호되는 건 메타데이터를 떼지 않은 콘텐츠뿐이다.
4장 · JPEG Trust (ISO 21617, 2024-25) — JPEG 표준에 진정성이 들어왔다
JPEG Trust는 ISO/IEC 21617로, JPEG 위원회가 만드는 공식 국제 표준이다. C2PA가 컨소시엄 사양인 반면, JPEG Trust는 ISO 표준이다. 의미: 정부 조달·법정 증거·국제 거래에서 "표준을 따른다"고 말할 때 ISO 번호가 필요한 영역에서 채택된다.
JPEG Trust는 C2PA와 경쟁하기보다는 포용한다. 1부(Part 1, 2024 발행)는 신뢰 프레임워크의 개념 정의, 2부는 일반 검증 프로파일, 3부는 미디어 자산 워터마킹 토큰까지 다룬다. JPEG 컨테이너 안에 C2PA 매니페스트를 박는 표준 자리가 명확히 정의된다.
왜 별도 ISO 표준이 또 있어야 하나:
- C2PA는 "어떻게 서명하나"의 사양이고, JPEG Trust는 "그 사양을 JPEG에 어떻게 박나 + 무엇을 검증하나"의 사양
- ISO 표준이라 정부·표준화 기구가 채택하기 쉬움
- 워터마킹·메타데이터·암호 서명을 통합한 다층 신뢰 프레임워크를 그림
2025-26년 상태: 1·2부는 발행 완료, 3부는 일부 발행, 나머지는 작업 중. 한국·일본·EU의 표준 채택은 JPEG Trust를 기점으로 가속될 전망. C2PA를 모르는 사람도 ISO 21617은 안다는 상황이 곧 도래한다.
5장 · TrueMedia.org — Oren Etzioni의 비영리 탐지기 (그리고 그 운명)
TrueMedia.org는 AI2 전 CEO Oren Etzioni가 2024년에 만든 비영리 딥페이크 탐지 서비스다. 핵심 메시지: "선거에 쓰일 정치 딥페이크에 무료 탐지를 제공한다."
방식: 여러 탐지 모델(Sensity, Reality Defender 등)의 결과를 앙상블해 단일 점수로 변환. 일반인은 의심 영상의 URL을 붙여넣어 결과를 받는다. 기자·연구자에게 API도 제공.
2024-25 미국 대선과 다른 선거에서 의미 있는 역할을 했다는 보도가 잇따랐다. 하지만 2025년 후반에 재정 모델 문제가 알려졌고, 일부 운영이 축소됐다. 무료 비영리 모델이 합성 미디어 탐지에 지속 가능한가라는 본질적 질문이 남았다 — 매번 호출에 GPU 비용이 들고, 모델 업데이트에는 데이터 수집이 필요한데, 수익원이 없다.
2026년 교훈: 비영리는 진실을 떠받치는 좋은 형태지만, "지속 가능성"의 답을 찾지 못하면 결정적 순간에 사라진다. TrueMedia.org는 부분적으로 살아남았고, 그 모델은 EU·UN 산하 비슷한 비영리 프로젝트에 영향을 줬지만, 한 단체가 모든 걸 해결할 수는 없다는 게 드러났다.
6장 · Sensity AI — 이스라엘 상업 솔루션
Sensity는 이스라엘 기반의 합성 미디어 탐지 회사다. 옛 이름은 Deeptrace. 2017년에 딥페이크라는 단어가 막 퍼지던 시기에 시작했고, 지금은 가장 오래된 상업 탐지 회사 중 하나다.
제품 라인:
- 이미지 탐지 — 얼굴 합성·전체 합성·생성형 AI 분류
- 영상 탐지 — 얼굴 교체·립싱크·완전 합성·립덥
- 오디오 탐지 — 음성 클로닝 탐지
- 문서 탐지 — 위조 ID·합성 신분증
- API + 대시보드 + 컴플라이언스 리포트
고객: 금융(KYC 신분증 위조), 보험(손해 사정), 미디어, 정부. 유럽 시장에 강하다 — GDPR 친화적이라는 평이 있고, EU AI Act 부속 의무에 발맞춰 컴플라이언스 리포트를 강조한다.
기술 차별점: 단일 모델이 아니라 모델 앙상블. 얼굴 합성 탐지 모델, 전체 이미지 합성 탐지 모델, 압축 아티팩트 모델, 메타데이터 모델을 합쳐서 점수를 낸다. 그래서 "GAN으로 만든 건 잘 잡지만 디퓨전 모델로 만든 건 못 잡는다" 같은 단일 약점이 적다는 주장.
한계는 모든 탐지기에 공통: 새 생성 모델이 나오면 며칠~몇 주는 정확도가 떨어진다. 학습 데이터가 따라잡아야 한다. 그리고 압축·리사이즈·필터를 거친 콘텐츠에서는 신호가 약해진다. 그래서 Sensity도 "단일 진실"이 아니라 "위험 신호 중 하나"로 쓰라고 안내한다.
7장 · Microsoft Video Authenticator + Microsoft Designer Credentials
Microsoft는 두 갈래로 들어와 있다.
Microsoft Video Authenticator (2020년 발표)는 영상의 합성 가능성을 프레임별로 점수화하는 도구다. 처음에는 AP 통신·BBC 등 뉴스 파트너와 비공개로 운영됐고, 2024-25년에 더 넓게 풀렸다. 핵심 사용처는 선거 관련 영상 검증.
방식: 얼굴 경계의 미세한 픽셀 비정상성·압축 부조화·머리카락/이빨/눈동자의 잘 안 잡히는 디테일을 본다. 출력은 0-100% 합성 확률.
Microsoft Designer + Bing Image Creator Credentials: Microsoft가 만드는 AI 이미지에는 C2PA 기반 Content Credentials가 자동으로 들어간다. 즉 진정성 측에서도 동시에 활동한다 — 자기들이 만든 AI 이미지에 라벨 붙이고, 남들이 만든 합성에 탐지 점수를 매긴다.
의미: 한 회사가 "내가 만드는 건 표시한다 + 남이 만든 건 탐지한다"의 양쪽을 한다. Google·OpenAI·Adobe도 같은 패턴으로 움직이고 있다. 생성 회사 = 진정성 회사 = 탐지 회사의 삼위일체가 빅테크 안에서 자리잡았다.
8장 · Sora 워터마크 (OpenAI) + Anthropic 워터마크
OpenAI Sora가 2024년 말~2025년 초에 일반에 풀린 직후, 모든 생성 영상에는 시각 워터마크 + 비시각 워터마크가 박혀 나왔다. 시각 쪽은 영상 코너의 떠다니는 Sora 로고. 비시각 쪽은 프레임 픽셀에 임베드된 신호로, OpenAI의 탐지기로 식별 가능.
Sora 워터마크의 의의:
- 선택 사항이 아니다 — 모든 출력에 기본 적용 (API 일부 티어 제외)
- 편집/압축에 대해 어느 정도 강건성 — 압축·자르기·필터 일부에 살아남도록 설계
- 그래도 충분히 정교한 적대자에게는 깨진다 — 픽셀을 재합성하면 신호가 약해진다
Anthropic 워터마크: Anthropic은 Claude의 텍스트 출력 일부에 통계적 워터마크를 실험적으로 적용한다고 알려져 있다. Constitutional AI 프레임워크의 한 줄기다. 텍스트 워터마크는 어휘 선택의 미세한 통계 편향을 만드는 방식 — 특정 토큰 선택을 약간 편향시키되 의미는 그대로 두고, 디코더가 통계 검정으로 그 편향을 식별한다.
텍스트 워터마크의 본질적 어려움:
- 짧은 텍스트(트윗 길이)에서는 통계가 부족해 신호가 약하다
- 재구성(paraphrase·번역·요약)에 무너진다
- 출력 다양성과 트레이드오프 (워터마크 강하게 박으면 텍스트 품질 저하)
그래서 텍스트 워터마크는 이미지·영상 워터마크만큼 강력하지 않다. 하지만 수많은 모델·수많은 호출의 분포에서 보면, 일부 콘텐츠에 신호가 남아 있다는 것만으로도 사후 분석에 유용하다.
9장 · Google SynthID (DeepMind) — 텍스트 + 이미지 + 오디오
Google DeepMind의 SynthID는 2023년에 이미지로 시작했고, 2024년에 텍스트·오디오로 확장됐다. 현재 가장 야심찬 다중모달 워터마크 시스템이다.
SynthID-Image: Imagen/Veo가 만드는 이미지에 픽셀 분포 워터마크 임베드. 시각적으로는 보이지 않고, 이미지를 자르거나 압축하거나 색을 조정해도 신호가 어느 정도 살아남도록 설계됐다.
SynthID-Audio: Lyria(Google의 음악/오디오 모델)가 만드는 오디오 파형에 워터마크. 압축·재인코딩에 강건성을 갖추도록 학습됨.
SynthID-Text: Gemini의 텍스트 출력에 통계적 워터마크. Anthropic·OpenAI의 시도와 비슷하지만 공개 오픈소스로 풀렸다 — 다른 회사도 자신의 모델에 적용할 수 있도록.
# SynthID-Text 검출기 사용 패턴 (개념적 예시)
from synthid_text import detector
text = "이 텍스트는 Gemini가 생성했을 가능성이 있다..."
result = detector.detect(text, model_id="gemini-1.5-pro")
print(result.score) # 0~1 사이 워터마크 강도
print(result.confidence) # 통계적 유의성
SynthID의 의의: Google이 자체 모델뿐 아니라 오픈 표준화의 길로 갔다. SynthID-Text가 공개됐다는 건, Hugging Face·Anthropic·OpenAI 모두가 호환되는 워터마크를 박을 수 있게 됐다는 뜻. 합성 미디어 탐지의 "공유 인프라"에 가장 가까운 시도.
한계: 워터마크는 모델 제공자가 협력할 때만 의미가 있다. 오픈소스 모델(Llama·Mistral·Qwen 등)이 워터마크를 박지 않으면, 그 모델로 생성한 콘텐츠는 SynthID 검출기에 잡히지 않는다. 그리고 텍스트 워터마크는 재구성에 여전히 약하다.
10장 · Reality Defender — 엔터프라이즈 탐지
Reality Defender는 미국 기반 엔터프라이즈 합성 미디어 탐지 회사다. 2022년 창업, 시리즈 A·B를 거쳤다. 타겟은 은행·정부·보험·미디어 — Sensity와 비슷한 포지셔닝이지만 북미 시장에 더 강하다.
제품 특징:
- 다중 모델 앙상블 — 한 콘텐츠에 대해 여러 모델이 점수를 매기고 통합
- 실시간 API — 콜센터 통화 중 음성 클로닝 탐지 같은 사례
- 컴플라이언스 리포트 — 금융 규제·보험 조사용 증거 패키지
대표 사용 사례:
- 콜센터·CEO 사칭 음성 사기 탐지
- 합성 ID 신원 사기 (KYC)
- 정치 광고 검증 (TV 방송사)
- 보험 손해 사정 영상/사진 검증
기술 측면: Sensity와 비슷하게 단일 모델이 아니라 도메인별 모델들의 합. 다른 점은 실시간 스트리밍 추론에 더 투자한다는 점 — 통화 중 5초마다 점수 갱신 같은 시나리오를 강조.
11장 · DeepMedia — 국방 + 정부
DeepMedia는 미국 기반 합성 미디어 탐지 회사로, 국방·정보·정부 시장을 명시적으로 겨냥한다. 미군·정보 공동체와 계약 관계를 공개적으로 강조한다.
차별점:
- 위협 인텔리전스 — 어떤 적대 행위자가 어떤 합성 기법을 쓰는지 추적
- 군용 등급 보안 (FedRAMP·IL 등급)
- 다국어/다문화 얼굴·음성 데이터로 학습 (글로벌 분쟁 지역 포함)
- 영상의 외삽 가능성 — 한 프레임이 합성이면 같은 인물의 다른 영상도 검증
이쪽 영역은 공개 정보가 적다. 하지만 합성 미디어가 정보전·심리전의 무기가 되어가는 상황에서, "민간 SaaS와 다른 등급의 탐지가 필요하다"는 시장이 형성됐다는 신호.
시사점: 합성 미디어 탐지는 단순히 "사진 가짜 잡기"가 아니라 국가 안보 인프라로 분류되기 시작했다. 자국 기업을 키우려는 압력이 한국·일본·EU에서도 커진다.
12장 · Truepic — 암호화 증명 카메라
Truepic은 C2PA 창립 멤버이자, 콘텐츠가 만들어지는 순간에 서명하는 데 가장 집중한 회사다. 핵심 아이디어: 진정성의 출발점은 카메라다.
제품:
- Truepic Vision — 모바일 SDK. 앱에 통합하면 사진 촬영 순간 GPS·시간·디바이스 지문·이미지 해시를 같이 서명해 C2PA 매니페스트로 임베드.
- Truepic Lens — 보험·물류·정부 워크플로용 자체 카메라 앱.
- 검증 서비스 — 받은 콘텐츠가 변조되지 않았는지 암호적으로 검증.
사용 사례:
- 보험 손해 사정 — 피해 사진을 Truepic으로 찍으면 시간·장소·디바이스가 서명되어 사기 탐지가 쉬워진다
- 인도주의 조사 — Amnesty·Human Rights Watch가 분쟁 지역 증거 수집에 도입
- 부동산 검증 — 매물 사진의 시간·장소 증명
- 공급망 검증 — 제품이 어디서 만들어졌는지 사진 증명
한계: 채택. 일반 소비자 카메라 앱(아이폰 기본 카메라·구글 사진)에 자동으로 들어가지 않는다. 자기들이 만든 SDK를 쓰는 사람만 보호받는다. Sony·Nikon·Canon이 C2PA 카메라를 출시한 게 이 한계를 깨려는 시도다.
13장 · Hive Moderation API + Optic — Twitter/X 사용 사례
Hive Moderation은 미국 기반 콘텐츠 모더레이션 API 회사. AI 생성 이미지·영상·음성·텍스트 탐지를 카테고리 모더레이션과 함께 제공한다. NSFW·폭력·증오 표현 + AI 생성 라벨링까지 한 호출에 끝낸다는 게 세일즈 포인트.
# Hive AI Generated Content API 호출 예시
curl -X POST https://api.thehive.ai/api/v2/task/sync \
-H "Authorization: Token <key>" \
-F "media=@suspicious.jpg"
# 응답에 ai_generated_score, ai_generated_classes 포함
Optic: 원래 Twitter(현 X)가 NFT 이미지 표절 탐지에 쓰던 도구. 이후 AI 생성 콘텐츠 탐지로 확장. X 플랫폼 안에서 합성 라벨링 일부에 쓰이는 것으로 알려져 있다.
의의: 플랫폼 회사는 큰 결정을 내려야 한다 — 자체 탐지팀을 키울지(Meta·YouTube), 외부 API에 위임할지(많은 중소 플랫폼), 둘 다 할지. 외부 API 위탁이 늘면 Hive·Optic 같은 회사의 영향력이 커진다.
14장 · GPTZero — 텍스트 탐지의 얼굴
GPTZero는 프린스턴 학생이던 Edward Tian이 2022년 말 ChatGPT 출시 직후에 만들고 빠르게 화제가 된 텍스트 탐지 도구다. 2026년 기준 가장 알려진 무료/유료 텍스트 AI 탐지기.
원리:
- Perplexity — 모델이 그 텍스트에 얼마나 "놀라는가". LLM이 만든 텍스트는 낮은 perplexity 경향
- Burstiness — 문장 길이/복잡도의 변동성. 사람 글은 들쭉날쭉, LLM 글은 균일한 경향
- 두 신호 + 학습된 분류기
사용처: 학교·대학·출판사. 학생 과제 검증이 가장 큰 시장. API도 제공.
비판/한계:
- 거짓 양성(사람이 쓴 글을 AI로 판정)이 꽤 있다. ESL 학습자 글에서 특히 — 균일한 문장 구조를 잘못 학습할 수 있다.
- 모델 업데이트마다 정확도가 재조정된다. GPT-3.5 시절 잘 잡던 패턴이 GPT-4·Claude에서는 약하다.
- OpenAI 자신도 자체 GPT 탐지기를 2023년에 출시했다가 정확도 문제로 내렸다. 텍스트 탐지가 본질적으로 어렵다는 신호.
합리적 사용: GPTZero는 "위험 신호"로만 쓰고, 단일 증거로 학생을 처벌하면 안 된다. 학교는 이걸 "면담 트리거"로 쓰는 게 권장된다.
15장 · Originality.ai + Copyleaks + TurnItIn AI — 학술·표절 시장
학술 시장에서는 표절과 AI 탐지가 같은 제품에 합쳐졌다.
Originality.ai: 캐나다 기반. 학술·블로그·콘텐츠 마케팅 시장 동시 공략. AI 탐지 + 사실 확인 + 표절 탐지를 하나로 묶었다. 가장 단순한 가격 모델(크레딧 기반)이 호평.
Copyleaks: 이스라엘/미국. 기업 콘텐츠·법무·학술에 모두 들어간다. 다국어 지원이 강하다는 평. AI 탐지 + 표절 탐지 + 코드 표절(GitHub 인덱스 기반).
TurnItIn AI Detection: TurnItIn은 학술 표절 탐지의 글로벌 1위. 2023년에 자체 AI 탐지 기능을 추가했다. 가장 큰 기관 영업력. 동시에 가장 많은 비판 — 거짓 양성률이 ESL 학생에게 차별적이라는 학술 연구가 잇따랐다.
TurnItIn 사례의 교훈: 정확도 80%대 후반 분류기를 수백만 학생에게 동시에 적용하면, 거짓 양성 학생 수가 절대값으로 매우 크다. 그리고 그 비율이 모집단에 따라 편향된다. 누가 책임지는가의 질문이 학교·소프트웨어 회사·연구자 사이에 떠올랐다.
| 도구 | 주력 시장 | 강점 | 약점 |
|---|---|---|---|
| GPTZero | 학교 | 무료층·간단한 UI | ESL 거짓 양성, 정확도 변동 |
| Originality.ai | 콘텐츠/SEO | 가격·기능 결합 | 학술 기관 영업력 약함 |
| Copyleaks | 기업·다국어 | 다국어·코드 | 가격이 비싸다 |
| TurnItIn AI | 학교/대학 | 시장 점유율·통합 | ESL 거짓 양성 비판 |
16장 · Project Origin (BBC + CBC + NYT + Microsoft)
Project Origin은 뉴스 진정성에 특화된 프로젝트다. BBC·CBC·New York Times·Microsoft가 공동 운영한다. 2019년경 시작, C2PA가 만들어지는 데 영향을 줬다.
목표: 뉴스 콘텐츠가 발행기관에서 시청자까지 가는 동안 변조되지 않았음을, 그리고 어디서 왔는지를 보장하는 워크플로 표준.
구체적으로 하는 것:
- 뉴스 영상·기사 사진에 C2PA 매니페스트 자동 첨부
- 출처(언론사) 신원 보증
- 변조/AI 합성 여부 표시
- 플랫폼(소셜·뉴스 애그리게이터)이 매니페스트를 보존하도록 압력
의미: C2PA가 일반 기술 표준이라면, Project Origin은 뉴스 산업에 특화된 적용 사례다. 신문사가 SNS에 사진을 올렸는데 누군가 캡처해 변조해서 다시 올리면, 원본 매니페스트가 끊어진다. Project Origin은 그 흐름에서 어디서 끊어졌는지를 추적하고 시청자에게 표시하는 워크플로를 만든다.
2026년 상태: NYT·BBC·CBC가 자체 사이트와 일부 소셜에서 Content Credentials 표시를 시작. Meta·LinkedIn이 매니페스트 보존을 시범 도입. 갈 길은 멀지만, 뉴스 진정성 인프라의 첫 번째 진지한 시도.
17장 · 한국 — KAIST 딥페이크 탐지 + AI Open Innovation Hub
한국은 합성 미디어 탐지의 학술·정책 측에서 활발하다.
KAIST 딥페이크 탐지 연구: KAIST 전산학부·전자공학부 여러 연구실이 딥페이크 탐지의 핵심 학술 기여를 한다. 특히 얼굴 합성·립덥의 시간적 부조화 탐지, 음성 합성의 스펙트럼 비정상성, 그리고 한국어 음성 합성 탐지에 강하다 — 영어 위주 글로벌 도구가 한국어에서 약한 부분을 메운다.
AI Open Innovation Hub (과기정통부·NIA): 합성 미디어 탐지·진정성 표준의 정부 측 허브. 한국 기업이 C2PA·JPEG Trust를 도입하는 데 가이드라인과 시범 사업을 제공.
한국적 맥락:
- N번방 사건과 딥페이크 성착취물 — 한국 사회에서 딥페이크가 가장 먼저 큰 사회 문제가 된 분야 중 하나. 탐지 + 법 집행이 같이 갔다.
- 선거 — 2022, 2024 한국 선거에서 일부 정치 딥페이크 의혹이 있었다. 선거관리위원회 + 미디어 사실 확인 + 학계의 협력.
- 방통위·과기정통부의 가이드라인 — 생성 AI 콘텐츠 표시 의무화 논의가 2024-25년에 진전.
기업: 한국 토종 합성 미디어 탐지 스타트업도 있고(Deepbrain·MoneyBrain 등은 생성 쪽이지만, 탐지 쪽도 점차 등장), 네이버·카카오의 자체 모더레이션 팀이 자체 탐지를 운영한다.
18장 · 일본 — NICT + NTT 데이터 + AISI Japan
일본은 다른 각도다 — 정부 연구소와 대형 시스템 인테그레이터가 합성 미디어 탐지에 들어와 있다.
NICT(정보통신연구기구): 일본 정부의 통신·정보 연구 기관. 합성 미디어 탐지·진정성·이상 탐지 연구를 한다. 일본어 음성 합성/탐지에서 강점이 있다. 학술적 권위 + 정부 공급망과의 연결.
NTT 데이터: NTT 그룹의 시스템 인테그레이터 부분. 합성 미디어 탐지를 기업 고객(금융·통신·정부) 통합 솔루션의 일부로 패키징한다. Sensity·Reality Defender 같은 글로벌 도구를 NTT의 보안 운영 센터에 통합하는 형태가 많다.
AISI Japan(Japan AI Safety Institute): 일본의 AI 안전 연구소. 2024년 설립. 합성 미디어를 포함한 AI 위험 평가에 정부 차원의 입장을 정리한다. UK AISI·US AISI와 협력.
일본적 맥락:
- 텔레비전·신문 산업의 영향력이 여전히 크고, 진정성 표준 채택을 가속하는 동인.
- 음성·영상 사기에 대한 사회적 관심이 매우 높다 — 오레오레 사기(전화 음성 사칭)가 사회 문제로 오래 존재했고, 음성 클로닝이 그 문제를 증폭시킬 수 있다는 우려가 큼.
- 정부 + 대기업 + 연구소의 삼각 구조가 빠른 시범 적용을 만든다.
19장 · 누가 합성 미디어 탐지를 배워야 하나 — 네 종류의 학습자
| 학습자 | 우선 학습 영역 | 깊이 들어갈 도구 |
|---|---|---|
| 미디어/뉴스룸 | C2PA·Content Credentials·Project Origin | Adobe CC·Truepic·Sensity·Microsoft Video Authenticator |
| 보안/사기 방지 | 음성 클로닝·합성 ID·실시간 탐지 | Reality Defender·Sensity·Hive·자체 모델 |
| 정책/규제 | EU AI Act·미국 디지털 광고법·한국 방통위 | C2PA·JPEG Trust·Project Origin·CAI |
| 학술 | 새 공격·새 방어·평가 | 논문(KAIST·NICT·MIT)·SynthID 오픈소스 |
| 교육/학교 | 텍스트 탐지의 한계·정책 설계 | GPTZero·TurnItIn·Originality.ai (그리고 그 한계) |
| 일반 시민 | "이 콘텐츠가 어디서 왔는지 묻는 습관" | 브라우저 확장(Content Credentials), 의심 영상은 검증 사이트로 |
모두에게 공통: 단일 도구를 맹신하지 말 것. 점수 한 줄에 사람의 평판이나 법적 책임을 걸지 말 것. 진정성·워터마크·탐지·사람 검토의 다층 방어로 생각할 것.
20장 · 2026년 이후 — 어디로 가는가
확정된 흐름:
- C2PA·JPEG Trust가 표준 인프라가 된다. 카메라·소프트웨어·플랫폼이 점점 더 자동으로 매니페스트를 만들고 보존한다.
- 워터마크가 빅테크 생성 모델의 기본 옵션이 된다. 워터마크 없는 합성은 "오픈소스이거나 의도적으로 떼어낸 것" 중 하나로 분류된다.
- 탐지 SaaS는 엔터프라이즈 보안 스택의 일부가 된다. KYC·콜센터·보험·미디어가 가장 빠르다.
- 학교의 텍스트 탐지는 정책 + 면담 + 도구의 조합으로 재편된다. 도구 단독으로는 작동하지 않는다는 게 공감대.
열린 질문:
- 오픈소스 모델 생태계에서 워터마크 채택이 일어날까? 자발적으로는 어렵고, 규제가 압박할 수밖에 없을지.
- 적대자가 워터마크를 정교하게 제거할 수 있게 되면 어떻게 될까? 워터마크는 영원한 게 아니라 시간을 벌어주는 도구라는 인식이 자리잡을지.
- 진정성 표준이 채택되는 속도가 합성 콘텐츠 폭증 속도를 따라잡을까? 솔직히 답은 모른다 — 양쪽 다 빠르게 가고 있다.
- "신뢰의 책임"이 누구에게 있나? 플랫폼? 생성 회사? 발행기관? 시청자? 법제도가 이 칸을 어떻게 채우는지가 다음 5년의 큰 주제.
개인이 할 수 있는 것:
- 브라우저에 Content Credentials 확인 확장 설치
- 의심 영상·이미지는 TrueMedia.org 또는 무료 탐지기에 한 번 돌려보기 (단일 증거로는 쓰지 말 것)
- 자신이 만드는 콘텐츠에 가능하면 진정성 매니페스트 첨부 (Photoshop·Lightroom 사용자라면 기본)
- 학교/직장에서 "AI 탐지 도구의 한계"를 공유하기 — 거짓 양성으로 피해 보는 사람을 줄이는 데 기여
진짜냐는 질문이 인프라가 된 시대. 그 인프라는 한 회사·한 도구·한 표준이 아니라 여러 층의 합주다. 그 합주의 지도가 이 글이었다.
참고 / References
- C2PA (Coalition for Content Provenance and Authenticity) — https://c2pa.org/
- C2PA 사양 (Specification) — https://c2pa.org/specifications/
- Content Authenticity Initiative (CAI) — https://contentauthenticity.org/
- Adobe Content Credentials — https://contentcredentials.org/
- JPEG Trust (ISO/IEC 21617) — https://jpeg.org/jpegtrust/
- Project Origin — https://www.originproject.info/
- TrueMedia.org — https://www.truemedia.org/
- Sensity AI — https://sensity.ai/
- Microsoft Video Authenticator — https://blogs.microsoft.com/on-the-issues/2020/09/01/disinformation-deepfakes-newsguard-video-authenticator/
- OpenAI Sora — https://openai.com/sora
- Google DeepMind SynthID — https://deepmind.google/technologies/synthid/
- Reality Defender — https://www.realitydefender.com/
- DeepMedia — https://www.deepmedia.ai/
- Truepic — https://truepic.com/
- Hive Moderation — https://thehive.ai/
- GPTZero — https://gptzero.me/
- Originality.ai — https://originality.ai/
- Copyleaks — https://copyleaks.com/
- TurnItIn AI Detection — https://www.turnitin.com/solutions/ai-writing
- KAIST 전산학부 / 전자공학부 — https://www.kaist.ac.kr/
- AI Open Innovation Hub (한국 NIA) — https://www.aihub.or.kr/
- NICT (일본 정보통신연구기구) — https://www.nict.go.jp/
- AISI Japan — https://aisi.go.jp/
- Anthropic 안전 연구 — https://www.anthropic.com/research
- EU AI Act — https://artificialintelligenceact.eu/