Skip to content
Published on

合成メディア検出 & コンテンツ真正性 2026 — C2PA / Content Credentials / JPEG Trust / TrueMedia.org / Sensity / SynthID / Reality Defender / GPTZero 深掘りガイド

Authors

プロローグ — 「本物か」がインフラになった年

2024年までは「この写真本物?」は雑談だった。2026年にはインフラになった。新聞社は写真を買う前に出所メタデータを確認する。保険会社は損害査定写真のカメラ署名を検証する。大学は提出前にテキスト検出器を回す。裁判所は動画証拠にウォーターマーク分析を要求する。プラットフォームはアップロード時にSynthIDコードを読む。

確かめないとマズい空気ができ上がった。そしてその空気を支えるのは一人の目ではなく、標準・ツール・政策・学術の四分体制だ。本稿はその地図を一枚にまとめる — どの標準が本当にインフラになったか、どのツールが実戦で位置を取ったか、どの政策が崩れたか、どの研究が次を定義しているか。

まず大枠から。合成メディアの問題は二つに割れる。

  1. 真正性(provenance)側 — 「このコンテンツはどこから来たのか、どう作られたのか、変更されたのか」。カメラ・編集ツール・AI生成器がメタデータで答える。C2PA・Content Credentials・JPEG Trust・SynthID・Truepic・Project Origin。
  2. 検出(detection)側 — 「このコンテンツは合成か、人間が作ったのか」。モデルが分類で答える。TrueMedia.org・Sensity・Reality Defender・DeepMedia・Hive・Optic・Microsoft Video Authenticator・GPTZero・Originality.ai・Copyleaks・TurnItIn。

真正性は事前的だ — 作る時に署名する。検出は事後的だ — 既に作られたものを分類する。両方必要だ。真正性だけでは署名のないコンテンツに対応できない。検出だけでは小さくなる一方の誤差を永遠に追いかける。


第1章 · 2026年の地図 — 四領域の格子

語彙から整理する。同じ言葉を違う意味で使う人が多すぎる。

分野主要プレイヤー役割出力
標準C2PA、JPEG Trust(ISO 21617)、CAI、Project Originメタデータ・暗号署名の規格仕様文書 + ライブラリ
ウォーターマークGoogle SynthID、OpenAI Sora、Anthropic生成物への不可視信号埋め込みデコーダ + ライセンス
真正性ツールAdobe Content Credentials、Truepic、Microsoft Designerカメラ・編集ツール・AIへのC2PA統合製品
検出SaaSSensity、Reality Defender、DeepMedia、Hive、Optic、TrueMedia.org画像・映像・音声分類APIスコア + レポート
テキスト検出GPTZero、Originality.ai、Copyleaks、TurnItInLLM生成テキスト分類確率 + ハイライト
映像検出Microsoft Video Authenticator、Sensity、DeepMedia映像合成分類フレーム単位スコア
学術KAIST、NICT、AISI Japan、MIT Media Lab、Berkeley CITRIS新モデル・新攻撃・新防御論文 + データセット

核心の洞察1: 2026年の答えは単一ソリューションではない。一つのコンテンツに対して、真正性メタデータ + ウォーターマーク + 分類器 + 人手レビューが重なって機能する。一層だけ見ると必ず騙される。だからこの分野を学ぶ最初のステップは「どのツールが最も正確か」ではなく「どの層が何の責任を持つか」を覚えることだ。

核心の洞察2: 2024-25年の大きな変化は、ウォーターマークが「面白い研究」から「既定オプション」になった点だ。OpenAI Soraの生成映像にはウォーターマークが入って出てくる。GoogleのImagen・VeoはSynthIDで表示する。Anthropicも実質的に自社のウォーターマーク体系を導入した。ウォーターマークのない合成コンテンツは、徐々に怪しまれる時代になった。


第2章 · C2PA — 標準の標準(Adobe + Microsoft + BBC + IPTC + ARM + Intel + Sony + Truepic、2021)

この分野のほぼ全ての道はC2PAに通じる。Coalition for Content Provenance and Authenticity、2021年にAdobe・Microsoft・BBC・Intel・Truepic・Arm・Sony・IPTCらが作ったコンソーシアム。C2PA仕様(C2PA Specification)とオープンソースSDK(c2patool、c2pa-rs)を公開している。

核心アイデアは単純だ — コンテンツに暗号的に署名されたマニフェストを付ける。マニフェストは「誰が・いつ・どう」作ったか、そしてその後どんな編集を経たかをチェーンで記録する。JPEG・PNG・WebP・MP4・WAVなどほぼ全ての主要フォーマットに埋め込め、サイドカーファイルとしても可能。

# C2PA SDK の例 — 画像にマニフェストを付ける
c2patool input.jpg --manifest manifest.json --output signed.jpg

# マニフェストを読む
c2patool signed.jpg --info

# 主要フィールド:
# claim.signature -> X.509 証明書チェーン
# claim.assertions[*].kind -> "c2pa.actions" | "c2pa.thumbnail" | "c2pa.training-mining" | ...
# claim.ingredients[*] -> どの他のコンテンツが入力に使われたか

C2PAが答える質問:

  • このファイルを誰が作ったか(署名者の証明書)
  • どのカメラ/ソフトを使ったか(c2pa.actions)
  • AIが介入したか(c2pa.actions + AIラベル)
  • その後どんな編集を経たか(アクションチェーン)
  • AI学習データとしての使用許可があるか(c2pa.training-mining)

限界も明確: C2PAは検証を強制しない。マニフェストを剥がして再保存すれば普通のファイルになる(「strip and redistribute」)。だからC2PAは「このファイルにマニフェストがあるなら、その内容は信頼できる」という保証であって、「マニフェストのないファイルは偽物だ」という保証ではない。この二つを頻繁に混同する。

2026年現在C2PAは1.4仕様が安定し、カメラ(Sony・Nikon・Canon・Leica)、ソフトウェア(Photoshop・Lightroom・Premiere・Microsoft Designer)、プラットフォーム(LinkedIn・TikTok・Meta — 部分的表示導入)に広がっている。仕様は合意済み、採用カーブの中盤にある。


第3章 · Content Credentials(Adobe) — C2PAの旗艦実装

Adobe Content CredentialsはC2PAの最大の実装だ。Photoshop・Lightroom・Premiere Pro・Firefly・Adobe Stockに統合されている。ファイルを編集するとPhotoshopが自動でマニフェストを作って付ける。

具体的に何を記録するか:

  • 誰が編集したか(Adobeアカウントまたは匿名)
  • いつ・どのツールで(Photoshop 25.x、2024-10-30T...)
  • どのアクション(切り抜き・色補正・合成・AI塗りつぶしなど)
  • AI生成(Firefly・Generative Fill)が使われたか
  • 元のサムネイル(どこから始まったか)

UIは画像の右上のCRバッジ。クリックするとverify.contentauthenticity.orgに飛んでマニフェストチェーン全体を見られる。

[Content Credentialマニフェストの例]
File: nyt-front-page-photo.jpg
Issuer: Adobe Inc.
Created: 2026-04-15T10:23:11Z by Photoshop 25.6 (jdoe@nytimes.com)
Actions:
  - c2pa.opened (DSC_0023.NEF from Sony α7 IV)
  - c2pa.color_adjustments (Lightroom 13.5)
  - c2pa.cropped
  - c2pa.published
AI: None detected
Edits: 3 non-destructive

意味: 編集局として「この写真がどこから来たか、AIが介入したか」を一目で確認できる。AP通信・BBC・ロイター・ニューヨーク・タイムズが導入中。

限界: Adobeエコシステム内でだけよく回る。他のツールを一度通すとチェーンが切れる。そしてContent Credentialsメタデータを剥がすツールも既に存在する(逆説的にメタデータ整理ツール群)。守られるのはメタデータを剥がしていないコンテンツだけだ。


第4章 · JPEG Trust(ISO 21617、2024-25) — JPEG標準に真正性が入った

JPEG TrustはISO/IEC 21617、JPEG委員会が作る公式国際標準だ。C2PAがコンソーシアム仕様なのに対し、JPEG TrustはISO標準。意味: 政府調達・法廷証拠・国際取引で「標準に準拠」と言うときISO番号が必要な領域で採用される。

JPEG TrustはC2PAと競合するというより包含する。Part 1(2024年発行)は信頼フレームワークの概念定義、Part 2は一般検証プロファイル、Part 3はメディア資産ウォーターマーキングトークンまで扱う。JPEGコンテナの中にC2PAマニフェストを入れる標準的場所が明確に定義される。

なぜ別途ISO標準が必要か:

  • C2PAは「どう署名するか」、JPEG Trustは「それをJPEGにどう埋めるか + 何を検証するか」
  • ISO標準なので政府・標準化機関が採用しやすい
  • ウォーターマーキング・メタデータ・暗号署名を統合する多層信頼フレームワークを描く

2025-26年の状態: Part 1・2は発行完了、Part 3は一部発行、残りは作業中。韓国・日本・EUの標準採用はJPEG Trustを起点に加速する見込み。C2PAを知らない人もISO 21617は知っている、という状況が間もなく来る。


第5章 · TrueMedia.org — Oren Etzioniの非営利検出器(そしてその運命)

TrueMedia.orgはAI2の元CEO Oren Etzioniが2024年に作った非営利のディープフェイク検出サービス。コアメッセージ:「選挙に使われる政治ディープフェイクに無料の検出を提供する」。

仕組み: 複数の検出モデル(Sensity・Reality Defenderなど)の結果をアンサンブルし単一スコアに変換。一般人は怪しい映像のURLを貼って結果を受け取る。記者・研究者にはAPIも提供。

2024-25年の米国大統領選などで意味ある役割を果たしたとの報道が続いた。しかし2025年後半に財政モデルの問題が明らかになり、一部の運営が縮小された。無料の非営利モデルは合成メディア検出を持続可能かという本質的問いが残った — 呼び出しごとにGPUコストがかかり、モデル更新にはデータ収集が必要だが、収益源がない。

2026年の教訓: 非営利は真実を支える良い形だが、「持続可能性」の答えを見つけられなければ決定的瞬間に消える。TrueMedia.orgは部分的に生き残り、そのモデルはEU・UN系の同様の非営利プロジェクトに影響を与えたが、一つの団体が全てを解決できるわけではないことが露呈した。


第6章 · Sensity AI — イスラエルの商用ソリューション

Sensityはイスラエル基盤の合成メディア検出会社。旧名はDeeptrace。2017年「ディープフェイク」という単語が広まり始めた時期に起業し、今は最も古い商用検出会社の一つ。

製品ライン:

  • 画像検出 — 顔合成・全体合成・生成AI分類
  • 映像検出 — 顔入れ替え・リップシンク・完全合成・リップダブ
  • 音声検出 — 音声クローニング検出
  • 文書検出 — 偽造ID・合成身分証
  • API + ダッシュボード + コンプライアンスレポート

顧客: 金融(KYC身分証偽造)、保険(損害査定)、メディア、政府。欧州市場に強い — GDPR親和的という評があり、EU AI Act付属義務に合わせコンプライアンスレポートを強調。

技術的差別化: 単一モデルではなくモデルアンサンブル。顔合成検出モデル、全体画像合成検出モデル、圧縮アーティファクトモデル、メタデータモデルを合わせてスコアを出す。だから「GANで作ったものはよく捕まえるが拡散モデルで作ったものは捕まえられない」のような単一弱点が少ない、という主張。

限界は全検出器に共通: 新しい生成モデルが出ると数日〜数週間は精度が落ちる。学習データが追いつく必要がある。そして圧縮・リサイズ・フィルタを経たコンテンツでは信号が弱まる。だからSensityも「単一の真実」ではなく「リスク信号の一つ」として使えと案内する。


第7章 · Microsoft Video Authenticator + Microsoft Designer Credentials

Microsoftは二方面から入っている。

Microsoft Video Authenticator(2020年発表)は映像の合成可能性をフレーム単位でスコア化するツール。最初はAP通信・BBCなど報道パートナーとの非公開運用、2024-25年により広く開放。中核の用途は選挙関連映像の検証

仕組み: 顔境界の微細なピクセル異常・圧縮の不整合・髪/歯/瞳孔のディテール — 合成モデルがまだ苦手なところを見る。出力は0-100%の合成確率。

Microsoft Designer + Bing Image Creator Credentials: Microsoftが作るAI画像にはC2PAベースのContent Credentialsが自動で入る。つまり真正性側でも同時に活動している — 自分が作るものにはラベルを付け、他人が作る合成には検出スコアを付ける。

意味: 一社が「自分の生成物には印を付ける + 他人の生成物は検出する」の両側を担う。Google・OpenAI・Adobeも同じパターンで動いている。生成会社 = 真正性会社 = 検出会社の三位一体が大手の中で定着した。


第8章 · Soraウォーターマーク(OpenAI) + Anthropic ウォーターマーク

OpenAI Soraが2024年末〜2025年初頭に一般公開された直後、全ての生成映像には可視ウォーターマーク + 不可視ウォーターマークが入って出てくる。可視側は映像の隅を漂うSoraロゴ。不可視側はフレームピクセルに埋め込まれた信号で、OpenAIの検出器で識別できる。

Soraウォーターマークのポイント:

  • オプションではない — 全出力に既定で適用(API一部ティアを除く)
  • 編集/圧縮にある程度頑健 — 圧縮・切り抜き・一部フィルタに生き残るよう設計
  • それでも十分洗練された敵対者には壊される — ピクセルを再合成すると信号が弱まる

Anthropicウォーターマーク: AnthropicはClaudeのテキスト出力の一部に統計的ウォーターマークを実験的に適用していると報じられている。Constitutional AIフレームワークの一つの系。テキストウォーターマークは語彙選択の微妙な統計バイアスを作る方式 — 特定トークン選択をわずかに偏らせ、意味はそのまま、デコーダが統計検定でその偏りを識別する。

テキストウォーターマークの本質的難しさ:

  • 短いテキスト(ツイート長)では統計が足りず信号が弱い
  • 再構成(パラフレーズ・翻訳・要約)で崩れる
  • 出力多様性とトレードオフ(ウォーターマークを強くするとテキスト品質が低下)

だからテキストウォーターマークは画像・映像ウォーターマークほど強力ではない。しかし多数のモデル・多数の呼び出しの分布で見れば、一部コンテンツに信号が残っているだけでも事後分析に有用だ。


第9章 · Google SynthID(DeepMind) — テキスト + 画像 + 音声

Google DeepMindのSynthIDは2023年に画像から始まり、2024年にテキスト・音声に拡張された。現在最も野心的なマルチモーダルウォーターマークシステム。

SynthID-Image: Imagen/Veoが作る画像にピクセル分布ウォーターマークを埋め込む。視覚的には見えず、切り抜き・圧縮・色調整を経ても信号がある程度生き残るよう設計。

SynthID-Audio: Lyria(Googleの音楽/音声モデル)が作る音声波形にウォーターマーク。圧縮・再エンコードに頑健性を持つよう学習。

SynthID-Text: Geminiのテキスト出力に統計的ウォーターマーク。Anthropic・OpenAIの試みと似ているがオープンソースとして公開された — 他の会社も自分のモデルに適用できるように。

# SynthID-Text 検出器使用パターン(概念例)
from synthid_text import detector

text = "このテキストは Gemini が生成した可能性がある..."
result = detector.detect(text, model_id="gemini-1.5-pro")
print(result.score)         # 0~1 のウォーターマーク強度
print(result.confidence)    # 統計的有意性

SynthIDの意義: Googleが自社モデルだけでなくオープン標準化の道を行った。SynthID-Textが公開されたということは、Hugging Face・Anthropic・OpenAI全てが互換ウォーターマークを埋められるようになったということ。合成メディア検出の「共有インフラ」に最も近い試み。

限界: ウォーターマークはモデル提供者が協力する時のみ意味がある。オープンソースモデル(Llama・Mistral・Qwenなど)がウォーターマークを埋めなければ、そのモデルで生成したコンテンツはSynthID検出器に捕まらない。そしてテキストウォーターマークは再構成攻撃に依然弱い。


第10章 · Reality Defender — エンタープライズ検出

Reality Defenderは米国基盤のエンタープライズ合成メディア検出会社。2022年創業、シリーズA・Bを経た。ターゲットは銀行・政府・保険・メディア — Sensityと似たポジショニングだが北米市場に強い。

製品の特徴:

  • マルチモデルアンサンブル — 一つのコンテンツに対し複数モデルがスコアを出し統合
  • リアルタイムAPI — コールセンター通話中の音声クローニング検出のようなケース
  • コンプライアンスレポート — 金融規制・保険調査用の証拠パッケージ

代表的ユースケース:

  • コールセンター・経営者なりすまし音声詐欺の検出
  • 合成ID身元詐欺(KYC)
  • 政治広告検証(テレビ放送局)
  • 保険損害査定の映像/写真検証

技術面: Sensityと同様、単一モデルではなくドメイン別モデルの合成。違いはリアルタイムストリーミング推論により投資する点 — 通話中5秒ごとにスコア更新のようなシナリオを強調。


第11章 · DeepMedia — 国防 + 政府

DeepMediaは米国基盤の合成メディア検出会社で、国防・情報・政府市場を明示的に狙う。米軍・情報コミュニティとの契約関係を公的に強調する。

差別化点:

  • 脅威インテリジェンス — どの敵対勢力がどの合成手法を使うかを追跡
  • 軍用等級セキュリティ(FedRAMP・ILティア)
  • 多言語/多文化の顔・音声データで学習(世界の紛争地域を含む)
  • 映像の外挿可能性 — 一フレームが合成なら、同じ人物の他映像も検証

この領域は公開情報が少ない。しかし合成メディアが情報戦・心理戦の武器になりつつある状況で、「民間SaaSとは違う等級の検出が必要だ」という市場ができたシグナル。

示唆: 合成メディア検出は単に「写真の偽物捕まえ」ではなく国家安全保障インフラに分類され始めた。自国企業を育てる圧力が韓国・日本・EUでも高まる。


第12章 · Truepic — 暗号証明カメラ

TruepicはC2PA創立メンバーであり、コンテンツが作られる瞬間に署名することに最も集中した会社。核心アイデア: 真正性の出発点はカメラだ。

製品:

  • Truepic Vision — モバイルSDK。アプリに統合すると、写真撮影の瞬間にGPS・時刻・デバイス指紋・画像ハッシュを一緒に署名しC2PAマニフェストに埋め込む。
  • Truepic Lens — 保険・物流・政府ワークフロー用の自社カメラアプリ。
  • 検証サービス — 受け取ったコンテンツが改ざんされていないか暗号的に検証。

ユースケース:

  • 保険損害査定 — 被害写真をTruepicで撮ると時刻・場所・デバイスが署名され、詐欺検出が容易になる
  • 人道調査 — Amnesty・Human Rights Watchが紛争地域の証拠収集に導入
  • 不動産検証 — 物件写真の時刻・場所証明
  • サプライチェーン検証 — 製品がどこで作られたかの写真証明

限界: 採用。一般消費者カメラアプリ(iPhone標準カメラ・Google Photos)に自動で入っていない。自社が作ったSDKを使う人だけが保護される。Sony・Nikon・CanonがC2PAカメラを出したのはこの限界を壊そうとする試み。


第13章 · Hive Moderation API + Optic — Twitter/X ユースケース

Hive Moderationは米国基盤のコンテンツモデレーションAPI会社。AI生成画像・映像・音声・テキスト検出をカテゴリモデレーションと一緒に提供する。NSFW・暴力・ヘイトスピーチ + AI生成ラベリングまで一回の呼び出しで完了、というのがセールスポイント。

# Hive AI Generated Content API の呼び出し例
curl -X POST https://api.thehive.ai/api/v2/task/sync \
  -H "Authorization: Token <key>" \
  -F "media=@suspicious.jpg"

# レスポンスに ai_generated_score、ai_generated_classes を含む

Optic: 元はTwitter(現X)がNFT画像盗用検出に使っていたツール。その後AI生成コンテンツ検出に拡張。Xプラットフォーム内の合成ラベリング一部に使われていると知られている。

意義: プラットフォーム会社は大きな決定を下さなければならない — 自社検出チームを育てるか(Meta・YouTube)、外部APIに委ねるか(多くの中小プラットフォーム)、両方やるか。外部API委託が増えるとHive・Opticのような会社の影響力が増す。


第14章 · GPTZero — テキスト検出の顔

GPTZeroはプリンストンの学生だったEdward Tianが2022年末ChatGPTローンチ直後に作り、急速に話題になったテキスト検出ツール。2026年時点で最も知られた無料/有料テキストAI検出器。

仕組み:

  • Perplexity — モデルがそのテキストにどれだけ「驚く」か。LLMが作るテキストは低Perplexityの傾向
  • Burstiness — 文章の長さ/複雑度の変動性。人間の文章は不規則、LLMの文章は均一の傾向
  • これら2信号 + 学習された分類器

使用先: 学校・大学・出版社。学生課題検証が最大市場。APIも提供。

批判/限界:

  • 偽陽性(人が書いた文章をAIと判定)がかなりある。ESL(英語非母語)学習者の文章では特に — 均一な文構造を誤学習しうる。
  • モデル更新ごとに精度が再調整される。GPT-3.5時代によく捕まえたパターンがGPT-4・Claudeでは弱い。
  • OpenAI自身も自社のGPT検出器を2023年に出して精度問題で取り下げた。テキスト検出が本質的に難しいというシグナル。

合理的な使い方: GPTZeroは「リスク信号」としてだけ使い、単一の証拠で学生を処罰してはいけない。学校はこれを「面談トリガー」として使うのが推奨される。


第15章 · Originality.ai + Copyleaks + TurnItIn AI — 学術・盗用市場

学術市場では盗用検出とAI検出が同じ製品に合体している。

Originality.ai: カナダ基盤。学術・ブログ・コンテンツマーケティング市場を同時攻略。AI検出 + 事実確認 + 盗用検出を一つに束ねた。最も単純な価格モデル(クレジット制)が好評。

Copyleaks: イスラエル/米国。企業コンテンツ・法務・学術に全方位で入る。多言語サポートが強い、との評。AI検出 + 盗用検出 + コード盗用(GitHubインデックスベース)。

TurnItIn AI Detection: TurnItInは学術盗用検出のグローバル1位。2023年に自社AI検出機能を追加。最大の機関営業力。同時に最も多くの批判 — 偽陽性率がESL学生に差別的、という学術研究が相次いだ。

TurnItIn事例の教訓: 精度80%台後半の分類器を数百万の学生に同時適用すると、偽陽性学生の絶対数は非常に大きい。そしてその比率は属性で偏る。誰が責任を負うのかの問いが学校・ソフトウェア会社・研究者の間に浮上した。

ツール主力市場強み弱み
GPTZero学校無料層・シンプルなUIESL偽陽性、精度の変動
Originality.aiコンテンツ/SEO価格・機能の組み合わせ学術機関の営業力が弱い
Copyleaks企業・多言語多言語・コード価格が高い
TurnItIn AI学校/大学市場シェア・統合ESL偽陽性への批判

第16章 · Project Origin(BBC + CBC + NYT + Microsoft)

Project Originはニュース真正性に特化したプロジェクト。BBC・CBC・New York Times・Microsoftが共同運営する。2019年頃開始、C2PAができるのに影響を与えた。

目標: ニュースコンテンツが発行機関から視聴者に至る間に改ざんされないこと、そしてどこから来たかを保証するワークフロー標準。

具体的にやること:

  • ニュース映像・記事写真にC2PAマニフェストを自動添付
  • 出所(報道機関)の身元保証
  • 改ざん/AI合成の表示
  • プラットフォーム(ソーシャル・ニュースアグリゲータ)がマニフェストを保存するよう圧力

意義: C2PAが一般技術標準なら、Project Originはニュース産業に特化した適用ケースだ。新聞社がSNSに写真を載せ、誰かがキャプチャして改ざんし再投稿すると、元のマニフェストが切れる。Project Originはその流れでどこで切れたかを追跡し視聴者に表示するワークフローを作る。

2026年の状態: NYT・BBC・CBCが自社サイトと一部ソーシャルでContent Credentials表示を開始。Meta・LinkedInがマニフェスト保存を試験導入。道のりは長いが、ニュース真正性インフラの最初の本格的試み。


第17章 · 韓国 — KAIST ディープフェイク検出 + AI Open Innovation Hub

韓国は合成メディア検出の学術・政策側で活発だ。

KAIST ディープフェイク検出研究: KAIST 電算学部・電子工学部の複数の研究室がディープフェイク検出の中核的学術貢献をする。特に顔合成・リップダブの時間的不整合検出、音声合成のスペクトル異常、そして韓国語音声合成検出に強い — 英語中心のグローバルツールが韓国語で弱い部分を補う。

AI Open Innovation Hub(科学技術情報通信部・NIA): 合成メディア検出・真正性標準の政府側ハブ。韓国企業がC2PA・JPEG Trustを導入する際のガイドラインと試験事業を提供。

韓国的文脈:

  • N番房事件とディープフェイク性搾取物 — 韓国社会でディープフェイクが最も早く大きな社会問題になった分野の一つ。検出 + 法執行が一緒に進んだ。
  • 選挙 — 2022、2024年の韓国選挙で一部政治ディープフェイク疑惑があった。選挙管理委員会 + メディアファクトチェッカー + 学界の協力。
  • KCC・MSITのガイドライン — 生成AIコンテンツの表示義務化議論が2024-25年に進展。

企業: 韓国土着の合成メディア検出スタートアップもあり、Naver・Kakaoの自社モデレーションチームが独自検出を運用する。


第18章 · 日本 — NICT + NTTデータ + AISI Japan

日本は別の角度だ — 政府研究所と大型システムインテグレータが合成メディア検出に入っている。

NICT(情報通信研究機構): 日本政府の通信・情報研究機関。合成メディア検出・真正性・異常検出研究を行う。日本語音声合成/検出に強み。学術的権威 + 政府サプライチェーンとの接続。

NTTデータ: NTTグループのシステムインテグレータ部門。合成メディア検出を企業顧客(金融・通信・政府)の統合ソリューションの一部としてパッケージ化する。Sensity・Reality Defenderのようなグローバルツールを NTTのセキュリティ運用センターに統合する形が多い。

AISI Japan(Japan AI Safety Institute): 日本のAI安全研究所。2024年設立。合成メディアを含むAIリスク評価で政府レベルの立場を整理する。UK AISI・US AISIと協力。

日本的文脈:

  • テレビ・新聞産業の影響力が依然大きく、真正性標準採用を加速する動因。
  • 音声・映像詐欺への社会的関心が非常に高い — オレオレ詐欺(電話音声なりすまし)が長く社会問題として存在し、音声クローニングがそれを増幅しうるとの懸念が大きい。
  • 政府 + 大企業 + 研究所の三角構造が素早い試験適用を作る。

第19章 · 誰が合成メディア検出を学ぶべきか — 四種の学習者

学習者優先学習領域深く入るツール
メディア/編集局C2PA・Content Credentials・Project OriginAdobe CC・Truepic・Sensity・Microsoft Video Authenticator
セキュリティ/不正対策音声クローニング・合成ID・リアルタイム検出Reality Defender・Sensity・Hive・自社モデル
政策/規制EU AI Act・米国デジタル広告法・韓国KCCC2PA・JPEG Trust・Project Origin・CAI
学術新攻撃・新防御・評価論文(KAIST・NICT・MIT)・SynthIDオープンソース
教育/学校テキスト検出の限界・政策設計GPTZero・TurnItIn・Originality.ai(そしてその限界)
一般市民「このコンテンツはどこから来たか問う習慣」ブラウザ拡張(Content Credentials)、怪しい映像は検証サイトで

全員に共通: 単一ツールを盲信しないこと。スコア一行に人の評判や法的責任をかけないこと。真正性・ウォーターマーク・検出・人手レビューの多層防御で考えること。


第20章 · 2026年以降 — どこへ行くのか

確定した流れ:

  1. C2PA・JPEG Trustが標準インフラになる。カメラ・ソフトウェア・プラットフォームが徐々に自動でマニフェストを作り保存する。
  2. ウォーターマークが大手生成モデルの既定オプションになる。ウォーターマークのない合成は「オープンソースか故意に剥がしたもの」のどちらかに分類される。
  3. 検出SaaSがエンタープライズセキュリティスタックの一部になる。KYC・コールセンター・保険・メディアが最速。
  4. 学校のテキスト検出は政策 + 面談 + ツールの組み合わせとして再編される。ツール単独では機能しないというのが共通認識。

開かれた問い:

  • オープンソースモデルエコシステムでウォーターマーク採用が起こるか。自発的には難しく、規制が押すしかないか。
  • 敵対者がウォーターマークを精緻に除去できるようになったらどうなるか。ウォーターマークは永遠ではなく時間を稼ぐツールだという認識が定着するか。
  • 真正性標準の採用速度が合成コンテンツ急増速度に追いつくか。正直答えは分からない — 両側とも速く進んでいる。
  • 「信頼の責任」は誰にあるのか。プラットフォーム? 生成会社? 発行機関? 視聴者? 法制度がこの枠をどう埋めるかが次の5年の大テーマ。

個人ができること:

  • ブラウザにContent Credentials確認拡張をインストール
  • 怪しい映像・画像はTrueMedia.orgまたは無料検出器に一度回してみる(単一証拠としては使わないこと)
  • 自分が作るコンテンツに可能なら真正性マニフェストを添付(Photoshop・Lightroomユーザーなら既定)
  • 学校/職場で「AI検出ツールの限界」を共有する — 偽陽性で被害を受ける人を減らすことに貢献

「本物か」がインフラになった時代。そのインフラは一社・一ツール・一標準ではなく複数層の合奏だ。その合奏の地図が本稿だった。


参考 / References