Skip to content
Published on

AIアクセシビリティ & 障害支援テクノロジー 2026 完全ガイド - Be My Eyes · Seeing AI · Speechify · Otter Live Captions · VoiceItt · Glean · Apple Live Caption · Google TalkBack 徹底解説

Authors

プロローグ — 13億人の障害人口とAI

WHOが2024年に発表した「Global report on health equity for persons with disabilities」によれば、世界の障害者人口は約13億人、人類の約16 %に達する。視覚、聴覚、言語、認知・学習、運動・筋骨格、精神保健のすべてが含まれる。

2026年5月時点でこの人口は二つの圧力を受けている。

  • 高齢化 — 日本の65歳以上比率は約29 %、韓国は約19 %、米国は約17 %。加齢は視力・聴力・認知の低下を伴う。
  • デジタル化 — 紙からアプリへ、カウンターからキオスクへ、対面からビデオ会議へ。アクセシビリティが欠けると社会参加そのものが断たれる。

ここに二つの動きが重なった。

  • GPT-4oのようなマルチモーダルLLM — 画像→テキスト、音声→テキスト、テキスト→音声が単一モデルで完結。Be My EyesのBe My AI、Microsoft Seeing AIが直接活用。
  • 法的強制力 — 米司法省は2024年4月にADA Title II デジタルアクセシビリティ最終規則を公表、EUは2025年6月から European Accessibility Act が強制適用。韓国の障害者差別禁止法、日本の障害者差別解消法も同じ方向。

本稿は2026年5月時点で視覚・聴覚・言語・認知・運動・AAC各領域の主要60超のツール、中核標準、テスト系、そして韓国・日本の現況を一気に整理する。


1章 · 2026年に障害支援テクノロジーが重要な理由

支援技術(Assistive Technology, AT)は2010年代まで、高価で専用ハードウェア中心だった。JAWS 1ライセンスで1,000 USD、点字ディスプレイは3,000-5,000 USD、専用AACデバイスは7,000-12,000 USD。

2020年代に入って三つが変わった。

  • スマートフォンの普及 — iOSとAndroidにVoiceOver、TalkBack、Live Caption、Switch Controlが無料で内蔵。専用ハードがなくとも中核機能が動く。
  • AIのマルチモーダル化 — GPT-4o、Gemini 2.5、Claude 3.7が画像・動画・音声を一括で処理。Be My AI、Seeing AIがその上に乗った。
  • 法的強制力の強化 — 米ADA Title III 2024 DOJ規則、EU EAA(European Accessibility Act)2025年施行、韓国障害者差別禁止法、日本の情報アクセシビリティ法改正案。

この三つが交わる地点で「障害当事者だけが使う道具」が「高齢社会の全員が使う道具」へ広がっている。字幕は聴覚障害者だけでなく、地下鉄でミュートのまま動画を観る通勤者にも必須。


2章 · 視覚アクセシビリティの2軸 — 人間ボランティアとAI

視覚障害(全盲+ロービジョン)はWHO基準で世界約2.5億人。うち全盲は約4,300万人。

2026年の視覚アクセシビリティは二つの軸に分かれる。

  • 人間ボランティア/遠隔アシスタント — Be My Eyes(ボランティア)、Aira(有料プロ)、Glide(歩行ガイド)。
  • AI単独処理 — Be My AI(GPT-4o)、Microsoft Seeing AI、Google Lookout、Apple Live Recognition、Envision AI。

両軸は補完関係にある。AIは速くて無料だが幻覚のリスクがあり、人間は正確だが時間・コスト・プライバシーの制約がある。Be My Eyesは両者を1アプリに統合した点で、2026年で最も引用される事例。


3章 · Be My Eyes + Be My AI — もっとも知られるGPT-4o応用

Be My Eyes(bemyeyes.com)は2015年デンマークでHans Jørgen Wiberg氏が創業。視覚障害者がビデオ通話で晴眼ボランティアに援助を求めるアプリ。

  • 累計ボランティア — 2026年5月時点で約800万人が登録。
  • 累計ユーザー — 視覚障害ユーザーは約70万人。
  • 言語 — 約180言語に対応。

2023年3月にOpenAIとの提携で Be My AI(旧称「Virtual Volunteer」)がベータ提供開始。GPT-4マルチモーダルの最初期の外部応用の一つで、2024年のGPT-4oローンチ後、応答速度と韓国語・日本語の品質が大きく向上した。

動作の流れ。

  • ユーザーが写真を撮るか動画からフレームをキャプチャ。
  • 画像をGPT-4oに送信し自然言語で説明を返す。
  • 後続質問が可能(「この缶のカロリーは?」「この薬袋のラベルに書かれた服用量は?」)。

限界。

  • 幻覚 — 薬ラベルで服用量を誤読する事例がユーザーコミュニティで報告。Be My Eyesは「医療・法律・財務の判断は人間で確認」の注意書きを表示。
  • コンテキスト不足 — 単一フレームしか見えないため、動的状況(コンロ脇でこぼれた水など)を取りこぼす可能性がある。

4章 · Microsoft Seeing AI — 7年無償の強者

Seeing AI(seeingai.com)はMicrosoftの無料iOSアプリ。2017年米国で公開、2024年から日本・韓国を含む約70カ国、20言語で展開。

2026年5月時点で利用できる主要チャンネル。

  • 短いテキスト — カメラ前の文字を即時に読み上げ。
  • ドキュメント — 複数ページのスキャン、構造認識。
  • 製品 — バーコード認識と商品情報。
  • — 顔認識、年齢・感情の推定(本人登録顔は名前で読み上げ)。
  • シーン — 自然言語のシーン記述。
  • 通貨 — 紙幣の識別(USD・EUR・GBPに加えKRW・JPYも2024年追加)。
  • — カメラ視野内の色を識別。
  • — 光源のオン・オフを音で表現。
  • 写真探索 — 写真ギャラリー内の物体を検索。

強み — 無料、一部オフライン動作、Microsoftの安定運用。弱み — iOS専用(Androidは別途OEMソリューションを使う)、日韓のOCR品質は英語にやや劣る。


5章 · Google Lookout · Apple Live Recognition · Envision

OEM・サードパーティの三者比較。

  • Google Lookout(Android) — Android専用。食品ラベル、通貨、文書、クイックテキスト、エクスプローラ(周囲物体の音声案内)。日本語・韓国語ともに対応。
  • Apple Live Recognition(iOS 18+) — VoiceOverの一部に統合。カメラ視野内の文字、人、ドア、家具を音声で通知。ドア検出はLiDAR搭載のiPhone ProとiPad Proのみ。
  • Envision AI(letsenvision.com) — オランダ拠点。iOS・Android・Envision Glasses(Google Glass Enterprise Edition 2ベース)で動作。文字認識、シーン記述、Ally Call(遠隔ヘルパー)が中核。

Envision Glassesは2026年5月時点で約3,500 USD。高価だがハンズフリーが大きな利点で、歩行・調理・作業現場のシナリオに有利。


6章 · OrCam · Aira · Glide — 専門化された支援デバイス

OrCam(orcam.com) — イスラエル拠点。眼鏡に装着する小型カメラとスピーカー。

  • OrCam MyEye 3 Pro — 約4,500 USD。眼鏡に磁石で装着。文字の即時読み上げ、顔認識、色・紙幣識別。クラウドなしのオンデバイス動作。
  • OrCam Read 3 — 約1,990 USD。ペン型。1行を指せばその行だけを読み上げ。識字障害(ディスレクシア)やロービジョンの利用者に人気。

Aira(aira.io) — 米国。有料のビデオ通話型プロ視覚アシスタンス。

  • エージェント — 訓練済みプロがカメラ映像を見ながらライブ案内。
  • 料金 — 月29-200 USDのプラン。
  • 公共スポンサーシップ — Walgreens、AT&T、Starbucks、一部空港が「Site-in-Sight」の無償アクセスを提供。

Glide(glide.me) — 視覚障害者向け歩行ガイド。カメラとAIで歩道・横断歩道・階段を音声案内。2024年ベータ開始、2026年に米国一部都市で正式提供。


7章 · 聴覚アクセシビリティ — ライブ字幕の時代

聴覚障害(難聴を含む)はWHO基準で世界約4.3億人。うち意思疎通に影響を与える水準は約1.5億人。

2026年の聴覚支援の中核は「ライブ字幕」。周囲音声をリアルタイムで字幕化する機能。

OS標準。

  • Apple Live Captions(iOS 16+、macOS Ventura+) — システム全体に統合。FaceTime、Zoom、電話、周囲音声に字幕。英語・中国語・日本語・韓国語・フランス語・ドイツ語など。
  • Android Live Caption(Android 10+) — Googleが2019年に導入。Pixel以外の多数OEMにも拡大。日本語・韓国語サポートは一部機種に限定。
  • Android Live Transcribe — 別アプリ。80以上の言語、長時間の会話に最適化。

サードパーティ。

  • Google Sound Notifications(Android) — アラーム、ドアベル、サイレン、犬の吠え声などを振動・視覚通知に変換。
  • Apple Sound Recognition(iOS) — 類似機能。サイレン、アラーム、赤ちゃんの泣き声、犬の吠え声を認識。

ライブ字幕の限界は話者分離、非標準発音、背景雑音。2026年でも100 %の精度ではなく、利用者がそれを理解した上で使うことが前提。


8章 · Otter.ai · AVA · Innocaption — 会議・通話の字幕

Otter.ai(otter.ai) — 会議の自動文字起こしの代名詞。2016年創業。

  • Live Captions — Zoom、Google Meet、Microsoft Teamsにボットとして合流しリアルタイム字幕+話者分離。
  • Otter AI Chat — 会議後に「この会議で決まったアクションアイテムは?」を自然言語で問える。
  • 料金 — Free(月300分)、Pro(月16.99 USD)、Business(月30 USD)。

聴覚障害ユーザーから見ると、Otterは意図せず最も使われる聴覚支援ツールになった。会社の会議にOtterボットを入れれば全発言が文字で流れる。

AVA(ava.me) — 聴覚障害ユーザー専用設計のライブ字幕アプリ。

  • AVA Pro — 全参加者のマイクをペアリングし話者分離精度を引き上げ。
  • グループ会議 — QRコードで参加者を集め、各自の発言を分離して字幕化。
  • 料金 — Free、Pro(月29 USD)、Scribe(人間ライターによる補助、1分あたり約3 USD)。

Innocaption(innocaption.com) — 米FCCがIP CTS(Internet Protocol Captioned Telephone Service)として補助金を出す電話字幕サービス。聴覚障害者は登録後無料で利用。AIと人間ライターのハイブリッドで字幕を生成。

RogerVoice(rogervoice.com) — フランス。100以上の言語に対応した自動字幕通話。欧州・アフリカ・アジアの広域サービス。


9章 · VRS — ビデオリレーサービス

VRS(Video Relay Service)は米国・カナダで聴覚障害者が手話で通訳者とビデオ通話し、通訳者が相手と音声通話する双方向リアルタイム通訳。

米FCCが費用を負担する主要4事業者。

  • Sorenson Communications — 市場1位。自社ntouch VP端末、Sorenson Expressアプリ。
  • Purple Communications — ZP4、ZP Mobile。
  • ZVRS(CSDVRS) — Z5端末。
  • Convo Communications — 聴覚障害者が自ら創業した事業者。CodeOPS APIなど開発者向けツール。

韓国は放送通信委員会(KCC)の「通信中継サービス(손말이음センター)」が同等の役割を担う。 日本は総務省が「電話リレーサービス」を2021年7月に本格運用開始、日本財団電話リレーサービスが運営。


10章 · 言語障害 — 非標準音声認識の新しい波

ALS(筋萎縮性側索硬化症)、脳性まひ、ダウン症、脳卒中後遺症などで発音が標準から外れる人は、一般的な音声アシスタントをほぼ使えなかった。2026年でこの領域が最も急速に変わっている。

VoiceItt(voiceitt.com) — イスラエル。「非標準音声」を学習して認識するアプリ。

  • 個人モデル — ユーザーが約200の単語・文を録音して個人専用モデルを学習。
  • 連携 — Alexa、Google Home、Apple HomeKit、Zoom字幕に音声入力として合流。
  • 料金 — 個人は無料、企業・施設向けは別途ライセンス。

Project Relate(Google) — Androidアプリ。ALSや脳性まひのユーザーが自分の声で学習させて認識精度を上げる。英語が先行、日本語・韓国語は2026年時点でベータ。

Talkitt — VoiceIttの旧称。同じ会社。

言語障害領域の鍵は「ユーザー個別最適化」。汎用モデルでは精度が落ちるため、個人モデル学習のワークフローをいかに滑らかにできるかが競争軸。


11章 · 認知・学習障害 — Text-to-Speechのルネサンス

ディスレクシア(識字障害)は米国人口の15-20 %、日韓でも少なめでも5 %と推定。ADHDや自閉スペクトラム症も認知アクセシビリティの大きな領域。

Speechify(speechify.com) — 2017年にCliff Weitzman氏が自身のディスレクシア体験から創業。

  • 高品質TTS — Snoop Dogg、Gwyneth Paltrowなどセレブ音声をライセンス。
  • OCR+読み上げ — カメラで本を撮ると読み上げ。
  • PDF・EPUB・ウェブ同期 — 読み上げ位置をハイライト。
  • 料金 — Free、Premium(年139 USD)。

NaturalReader(naturalreaders.com) — カナダ。Speechifyに近い領域。無料の基本+有料の高品質ボイス。

Microsoft Immersive Reader — Edge、Word、OneNote、Teamsに内蔵。無料。多言語デコーダ、絵辞書、音節分割。

Read&Write(Texthelp) — 英国。K-12・高等教育市場の強者。ラインフォーカス、単語予測、語彙ビルダー。

Glean(glean.co) — 英国。旧称 Sonocent Audio Notetaker。会議・講義を録音しながら音声とノートを同期。学習障害学生が講義中にメモを追いきれない問題に対する解。

  • 2024年リブランディング — Sonocent→GleanへUI簡素化。
  • AI要約(2025年追加) — 録音から主要トピックを自動抽出。

12章 · 運動障害 — Voice Control · Eye Tracking · Switch

運動障害(脊髄損傷、ALS、脳性まひ、脳卒中後遺症)はキーボード・マウス・タッチ操作を困難にする。2026年の解は四つの入力チャネルに分かれる。

  • 音声制御 — Apple Voice Control、Android Voice Access、Dragon NaturallySpeaking。
  • 視線追跡 — Tobii Dynavox、Apple Eye Tracking(iPadOS 18)、EyeWriter。
  • 顔・頭追跡 — Smyle Mouse、Cephable、Quha Zono(ヘッドマウス)。
  • スイッチ制御 — iOS Switch Control、Android Camera Switches。

Apple Voice Control(macOS、iOS) — 無料。「Open Safari」「Click Send」などの音声コマンドでUI全体を操作。英語・中国語・日本語など多言語対応、韓国語は2026年時点でベータ。

Apple Eye Tracking(iPadOS 18+、一部iPad Pro) — 前面カメラのみで瞳孔追跡。5秒の凝視でクリック、自動キャリブレーション。専用ハードウェア不要。

Tobii Dynavox(tobiidynavox.com) — スウェーデン。ALSや筋萎縮ユーザーの標準。PCEyeシリーズ(専用視線追跡カメラ)+Tobii Dynavox I-Series(AAC統合デバイス)。価格4,000-15,000 USD。

Smyle Mouse(smylemouse.com) — 米国。一般のノートPCウェブカメラで顔の動きをマウスに変換。ウィンク・微笑みでクリック。

Cephable(cephable.com) — カメラとAIで頭の動き、表情、声を入力チャネルへ変換。Xbox・PlayStationコンソールにも連携。


13章 · AAC — 拡張代替コミュニケーション

AAC(Augmentative and Alternative Communication)は話せない、あるいは話すことが困難な人のための意思疎通支援。自閉スペクトラム症、脳性まひ、失語症、喉頭摘出後の患者などが利用。

iPad・iPhoneのAACアプリ。

  • Proloquo2Go(AssistiveWare) — 約250 USD。絵+文字の語彙ボード。コア語彙1,000語以上。英語・オランダ語・フランス語・スペイン語・ドイツ語。日本語はベータ。
  • Proloquo4Text(AssistiveWare) — 約120 USD。テキスト中心。単語予測・定型句保存。
  • TouchChat(Saltillo、PRC-Saltillo) — 約230 USD。WordPower語彙体系。
  • TouchChat HD with WordPower — 語彙強化版。
  • CoughDrop(coughdrop.com) — ウェブ・アプリ統合AAC。無料・有料の組合せ。
  • Snap Core First(Tobii Dynavox) — 専用デバイス+iPad。青少年・成人向け。
  • GoTalk Now(Attainment Company) — iPad。初心者向け。

AACの中核設計原則は「語彙セット(Vocabulary Set)」。コア語彙(よく使う50-150語)+フリンジ語彙(専門語)で構成。カテゴリ・色・アイコンが利用者の認知負荷を決定する。


14章 · スクリーンリーダー四天王

ウェブ・アプリのアクセシビリティの基礎ツールはスクリーンリーダー。視覚障害者が画面を音声で読み、キーボード・ジェスチャで操作する。

  • JAWS(Freedom Scientific、jawshq.com) — 米国。Windows専用。約1,295 USD(Pro)、学校ライセンスは別。企業・官公庁の標準。
  • NVDA(nvaccess.org) — オーストラリア。オープンソース(GPL)。Windows専用。完全無料。WebAIMの調査ではグローバル利用シェアで2010年代半ばからJAWSを上回る。
  • VoiceOver(Apple) — macOS、iOS、iPadOS、watchOS、tvOSに無料で内蔵。
  • TalkBack(Google) — Androidに無料で内蔵。Pixel、Samsungほか全Androidに標準。
  • ChromeVox(Google) — ChromeOSに内蔵+Chrome拡張。K-12のChromeBook学生に強い。
  • Narrator(Microsoft) — Windows 11に無料で内蔵。JAWS・NVDAに比べシェアは小さいが無料という意義がある。

WebAIMの「Screen Reader User Survey #10」(2023)では、デスクトップでJAWS約53 %、NVDA約31 %、VoiceOver約9 %、Narrator約6 %。モバイルではiOS VoiceOverとAndroid TalkBackが市場を二分する。


15章 · 標準 — WCAG 2.2 · EN 301 549 · Section 508

ウェブ・アプリアクセシビリティの国際標準はW3CのWCAG(Web Content Accessibility Guidelines)。

  • WCAG 2.0(2008) — 最初に広く定着した版。
  • WCAG 2.1(2018) — モバイル・ロービジョン・認知障害を追加。
  • WCAG 2.2(2023年10月) — 9つの新たな達成基準を追加。フォーカス外観、ドラッグ動作、一貫したヘルプ、アクセシブル認証など。
  • WCAG 3.0(ドラフト) — スコア基盤モデルへの大きな転換。2026年5月時点で依然Working Draft。

WCAGは適合レベルA、AA、AAAを定義。法的・契約上の基準は通常AA。

地域別標準。

  • EN 301 549(EU) — 公共部門ICT調達の標準。WCAG 2.1 AAを包含。
  • Section 508(米連邦) — 1998年Rehabilitation Act改正。WCAG 2.0 AAに整合。
  • ADA Title III(米民間) — 2024年4月DOJ最終規則。州・地方政府のデジタル資産はWCAG 2.1 AA適用、2026年4月から段階施行。
  • KWCAG 2.2(韓国) — 韓国型ウェブコンテンツアクセシビリティ指針。2023年改訂。検査項目24個。
  • JIS X 8341-3:2016(日本) — 日本工業規格。WCAG 2.0に整合。2026年5月時点で改訂版が議論中。

16章 · 自動アクセシビリティテストツール

CI/CDに組み込める自動アクセシビリティテスター。

  • axe-core(Deque Systems、github.com/dequelabs/axe-core) — 事実上の標準。Apache 2.0。約90ルール。偽陽性(False Positive)がほぼないことが強み。
  • axe DevTools — ブラウザ拡張+モバイル+CI。Dequeの商用製品。
  • Lighthouse Accessibility(Google) — Chrome DevToolsに内蔵。axe-coreの上に一部ルールを追加。スコア型レポート。
  • WAVE(WebAIM、wave.webaim.org) — 視覚的オーバーレイでページにマーカーを直接表示。学習用に人気。
  • Pa11y(pa11y.org) — オープンソースCLI。CIに統合しやすい。HTML CodeSniffer+Chromeベース。
  • Tenon.io — APIファーストのアクセシビリティテスト。SaaS。
  • Microsoft Accessibility Insights(accessibilityinsights.io) — 無料。ウェブ・Windows・Android対応。「FastPass」(高速自動検査)+「Assessment」(WCAG AA全体の手動検査)。
  • IBM Equal Access(ibm.github.io/able) — オープンソース。axeとは別のルールセット。
  • Siteimprove Accessibility — デンマーク。大企業向けガバナンスツール。

自動ツールはWCAG違反のおよそ30-40 %しか検出できない、という重要な限界がある。キーボードアクセシビリティ、コントラスト、altテキストの品質、論理的見出し構造などは人間判断が必要。


17章 · アクセシビリティオーバーレイ — AccessiBeとUserWayの論争

オーバーレイ(Overlay) — ページに1行のJavaScriptを追加すると「アクセシビリティウィジェット」が現れ、AIがalt・コントラスト・キーボード可達性を自動修正すると主張するSaaS。

  • AccessiBe(accessibe.com) — イスラエル。最大手。
  • UserWay(userway.org) — もう一つの大手。
  • EqualWeb、Audioeye — 同領域。

論争の中身。

  • 障害当事者からの批判 — オーバーレイが実機のスクリーンリーダーと衝突、自動alt文が不正確、「障害モード」のトグル自体がスティグマ。全米盲人連合(NFB)は2021年に「AccessiBe使用を控える」決議を採択。
  • 訴訟データ — 2021-2024年のUsableNet・Seyfarth分析では、オーバーレイ導入サイトの方がむしろADA訴訟を多く受けたという結果。
  • FTC和解 — accessiBeは虚偽広告の疑いで2025年にFTCと100万USDの和解。一部のマーケティング表現を変更。

WebAIMの「WebAIM Million」(2024)報告では、オーバーレイを導入したサイトの平均エラー数は導入していないサイトより多いという結果。

結論として、オーバーレイは「1行でADAコンプライアンス」ではない。本当の解は、デザインシステム、セマンティックHTML、テスト自動化にある。


18章 · Apple Accessibility · Google Euphonia · Microsoft AI for Accessibility

ビッグ3のアクセシビリティR&Dプログラム。

  • Apple Accessibility — クパチーノの専任チーム。Sady Paulson、Sarah Herrlingerなどが運営。iOS 17のPersonal Voice(15分の録音で本人の声を合成)、Live Speech、Point and Speakが代表作。
  • Google Project Euphonia(sites.research.google/euphonia) — 非標準音声認識のR&D。ALS、ダウン症、脳性まひのユーザーから約100万発話を収集。Project Relateはその成果物。
  • Microsoft AI for Accessibility(microsoft.com/en-us/ai/ai-for-accessibility) — 5年・2,500万USDの助成プログラム(2018-2023)。後継プログラムへ継承。Seeing AI、Hearing AI、Microsoft Accessibility Insights、Soundscapeが配下成果物。
  • Meta Accessibility — Quest 3とVision OS互換のアクセシビリティ。Facebook自動altテキスト(AAT)、Instagramキャプション。
  • Amazon Alexa Accessibility — Alexa Show and Tell(視覚障害者向け音声ショッピング)、Tap to Alexa(聴覚障害者向けテキスト入力)、Voice First Accessibilityカンファレンス後援。

19章 · 韓国アクセシビリティ — KWCAG · Saltlux · Asleep

韓国のアクセシビリティ生態系は政府主導が強い。

  • KWCAG 2.2 — 韓国知能情報社会振興院(NIA)所管。検査項目24個。政府公共サイトに義務。
  • 韓国型ウェブアクセシビリティマーク — 公共サイトに表示義務。
  • WA(Web Accessibility)認証 — KWCAGに基づく民間認証。
  • 障害者差別禁止法 — 公共・一定規模以上の民間サイトにアクセシビリティ義務。
  • モバイルアプリアクセシビリティ指針 — 2018年改訂。

民間ツール。

  • NHN Toast アクセシビリティ診断(NHN Cloud) — クラウド型の検査サービス。
  • OpenWAX(科学技術情報通信部) — 無料の検査ツール。Chrome拡張。
  • K-WAH 4.5 — 韓国情報化振興院のツール。

産業・研究。

  • Saltlux(솔트룩스) — AAC+AI。「마음대로」など視覚・言語障害支援ソリューションのR&D。
  • Asleep(에이슬립) — 音響信号で睡眠を測る。聴覚支援との結合可能性。
  • Infobank — 音声ARS・アクセシビリティ通話。
  • LG U+ 손누리링 — 聴覚障害者向け映像通話と手話通訳。
  • Kakao Enterprise Clova Note — 会議字幕。Otterの韓国版。
  • Naver Clova(Clova Note、Clova X) — 音声・テキスト変換+LLM。

20章 · 日本アクセシビリティ — JIS X 8341-3 · Sourcenext · NEC

日本のアクセシビリティ生態系。

  • JIS X 8341-3:2016 — 日本の公式標準。WCAG 2.0と整合。2026年の改訂議論中。
  • 障害者差別解消法(2016年施行、2024年4月改正) — 合理的配慮の義務を民間事業者にも拡大。
  • 総務省 みんなの公共サイト運用ガイドライン — 公共サイトのガイド。
  • WAIC(ウェブアクセシビリティ基盤委員会) — 民間協議体。JIS X 8341-3の解説・翻訳。

ツール。

  • Sourcenext — 音声認識ソフト。日本語の口述市場で強い。
  • NEC PaperLab AAC — AAC端末+紙印刷。
  • Pen-Talk(株式会社わかさ) — ペン型OCR+音声出力。日本語EPUB・教科書に親和性が高い。
  • UDトーク — 聴覚障害者向けの会議字幕アプリ。音声認識+翻訳。NHKほか放送でも使われる。
  • コエステ — 東北大とToastの音声合成。本人の声を保存(ALS患者向け)。
  • ステノキャプショナー — 日本の字幕専門資格。

手話。

  • NHK 手話CG — NHKがニュースを自動で手話CG化するR&D。
  • SureTalk(SoftBank) — 聴覚障害者向けチャット・通話支援。

21章 · 点字ディスプレイの進化

点字ディスプレイ(Refreshable Braille Display)は視覚障害者がテキストを点字で読めるハードウェア。ピンが上下し点字セルを形成する。

  • HumanWare Brailliant BI 40X — 40セル。約3,500 USD。
  • Freedom Scientific Focus 40 Blue — 40セル。約2,995 USD。
  • APH Mantis Q40 — 点字+QWERTY。約2,495 USD。
  • Orbit Reader 20·40 — 約700-1,300 USD。低価格帯。米NLS(National Library Service)経由で配布。
  • Dot Pad(닷、dotincorp.com) — 韓国。グラフィック出力に対応した点字パッド(20行32セル)。視覚資料を点字グラフィックへ変換。2023年発売。

点字ディスプレイは2026年でも高価。主因は精密機械部品(小型ソレノイド)。Dot Padの登場はグラフィック対応の次世代への転換点。


22章 · 補聴器 · 人工内耳 · 聴覚プロステシス

聴覚支援ハードウェア。

  • 補聴器(Hearing Aid) — 残存聴力を増幅。処方型 vs OTC(米国は2022年からOTC補聴器を合法化)。
  • 人工内耳(Cochlear Implant) — 聴神経を直接刺激。Cochlear、MED-EL、Advanced Bionicsが3大メーカー。
  • 骨導(Bone-Anchored) — Baha、Ponto。

スマートフォン連携。

  • MFi Hearing Aids(Made for iPhone) — Phonak Audéo、ReSound、Starkey Genesisなど。
  • ASHA(Audio Streaming for Hearing Aids、Android) — Googleの標準。
  • LE Audio + Auracast — Bluetooth 5.2の新しい音響放送標準。2024-2026年に補聴器・ヘッドセットへ徐々に導入。空港・講堂・博物館がインフラ整備中。

人工内耳とAI。

  • Cochlear Smart Sound IQ 2 — 人工内耳プロセッサ+AI雑音抑制。
  • Phonak SmartSpeech Technology — 環境自動分類で音声を強調。
  • Starkey Genesis AI — 動作検知・言語通訳・心拍計測を結合。

23章 · AI幻覚とアクセシビリティ — 実害の事例

AIアクセシビリティツールの最大のリスクは、幻覚が医療や安全の判断に影響する場面。

  • 薬ラベルの誤読 — Be My AIが薬瓶ラベルの服用量を誤読した利用者報告。あるユーザーはr/Blindに「1日1錠」が「1日2錠」と読み上げられたと投稿(2024年)。
  • 賞味期限の誤り — Seeing AIが賞味期限の数字を誤読した事例。
  • 人物識別の誤り — AIが家族以外の人物を家族と誤認識。
  • 信号機の色の誤り — 色識別モードが赤を緑と返した事例。横断歩道で非常に危険。
  • alt自動生成の幻覚 — 写真に存在しない人や物体を作り出す事例。Facebook AATは「屋外、人2人」のように保守的表現に後退。

対応 — Be My Eyesはボランティアのビデオ通話で検証することを推奨。Microsoft Seeing AIは医薬・食品について「医療・食品安全の判断は人間で確認」の警告を表示。WCAG 3.0ドラフトは自動生成コンテンツに信頼度表示を推奨する。


24章 · デザインシステムとアクセシビリティ — インクルーシブデザイン

ツールの上にある文化。「最初からアクセシビリティを考慮した設計(Inclusive Design)」は事後パッチより圧倒的に効率的。

代表的なデザインシステムとアクセシビリティ。

  • Material Design 3(Google) — コントラスト、タッチターゲット、ダイナミックカラー。
  • Apple Human Interface Guidelines — VoiceOverガイド、Dynamic Type、Reduce Motion。
  • Microsoft Fluent 2 — Fluent Accessibility Toolkit。キーボード、コントラスト、High Contrast Mode。
  • GOV.UK Design System — 英政府。アクセシビリティ優先の標準例。
  • U.S. Web Design System(USWDS) — 米連邦。Section 508に整合。
  • Carbon Design System(IBM) — オープンソース。axeと統合。

中核原則。

  • セマンティックHTMLを優先 — buttonはbutton。div onclickでは代替できない。
  • ARIAは最後の手段 — 「No ARIA is better than bad ARIA」(W3Cの格言)。
  • フォーカス外観 — すべての対話要素にフォーカス時の明確な視覚表示。
  • モーション低減を尊重 — prefers-reduced-motionメディアクエリ。
  • 色とコントラスト — 色のみで意味を伝えない。コントラスト4.5:1以上。

25章 · ゲームアクセシビリティ — Microsoft XAG · Naughty Dog

ゲームはアクセシビリティの後発だったが、2020年以降の追い上げが速い。

代表事例。

  • The Last of Us Part II(Naughty Dog、2020) — 60以上のアクセシビリティオプション。視覚・聴覚・運動障害をほぼ網羅。
  • Xbox Adaptive Controller(Microsoft、2018) — 大きなボタンと外部スイッチ入力。運動障害ユーザーのコントローラ参入障壁を解体。
  • PlayStation Access Controller(Sony、2023) — XACに対するSonyのPS5側の答え。
  • Forza Motorsport(2023) — 視覚補助の音響キュー(Sound Beacons)。
  • God of War Ragnarök(2022) — 自動照準・戦闘補助モード。

標準。

  • Xbox Accessibility Guidelines(XAG) — Microsoftが公開した約30のガイド。AbleGamersやCanIPlayThatなど非営利と協力。
  • Game Accessibility Guidelines(gameaccessibilityguidelines.com) — 英非営利。Basic・Intermediate・Advancedの3段階。

26章 · VR · AR · メタバースのアクセシビリティ

VR/ARは新しいアクセシビリティのフロンティア。ヘッドセットの重量、視野角、モーションシックネス、両手コントローラ依存。

2026年の解。

  • Apple Vision Pro VoiceOver — 視線と手のジェスチャを音声で案内。
  • Meta Quest 視野角調整・字幕 — Quest 3の自体字幕機能。
  • WebXR Accessibility Working Group — W3C傘下。ガイドドラフト。
  • XR Access(xraccess.org) — 非営利。Cornell Tech拠点。

VRのアクセシビリティはまだ標準が定まっていない領域。視覚障害者に3D空間をどう音声で記述するか、聴覚障害者に空間音響をどう視覚化するかが中心的な未解決課題。


27章 · 利用者の意思決定 — どのツールをいつ使うか

[障害類型別ツール選択ガイド — 2026モデル]

[視覚]
  無料で即利用:           VoiceOver(iOS), TalkBack(Android), Seeing AI(iOS), Lookout(Android)
  ボランティアの映像通話: Be My Eyes(無料)
  プロの映像通話:         Aira(有料)
  眼鏡型ハードウェア:     Envision Glasses, OrCam MyEye
  点字ディスプレイ:       Brailliant, Focus 40, Orbit Reader, Dot Pad(グラフィック)

[聴覚]
  無料ライブ字幕:         Apple Live Captions, Android Live Caption, Live Transcribe
  会議字幕:               Otter.ai, AVA, Microsoft Teams 字幕
  電話字幕:               Innocaption(米), RogerVoice
  補聴器とスマホ連携:     MFi Hearing Aids, ASHA, LE Audio Auracast
  ビデオリレー(手話):    Sorenson, ZVRS, Convo / 韓国 KCC / 日本 電話リレーサービス

[言語]
  非標準音声認識:         VoiceItt, Project Relate(Google)
  AAC 絵語彙:             Proloquo2Go, TouchChat, CoughDrop
  AAC テキスト:           Proloquo4Text
  AAC デバイス:           Tobii Dynavox Snap Core First

[認知・学習]
  ディスレクシアTTS:      Speechify, NaturalReader
  学習ノート:             Glean, Notion AI, Microsoft OneNote Immersive Reader
  学校向け総合:           Read&Write(Texthelp)

[運動]
  音声制御:               Apple Voice Control, Android Voice Access, Dragon
  視線追跡(低価):        Apple Eye Tracking(iPadOS 18)
  視線追跡(専門):        Tobii Dynavox PCEye
  顔追跡:                 Smyle Mouse, Cephable
  スイッチ:               iOS Switch Control, Xbox Adaptive Controller

28章 · 自己チェックリスト — アクセシビリティツール選定の7問

  • OS標準機能をまず確認 — 新しいアプリを買う前にVoiceOver、TalkBack、Live Captionで足りるかを点検。無料でOS統合度が最も高い。
  • 個人情報 — どこに保存されるか — 医療情報・薬ラベルを撮影して送るアプリは保存先を確認。HIPAA(米)、K-PIPA(韓)、APPI(日)の適合性。
  • オフライン動作 — インターネットなしの環境でも動くか。Seeing AIの短いテキストはオフライン動作。
  • 言語対応 — 英語以外、日本語・韓国語の精度は別物。実利用で日本語OCR・STT品質を確認。
  • 保険・補助金 — 韓国 補助機器交付事業、日本 補装具費支給制度、米 Medicare・VAなど公的支援を確認。
  • 保守 — 会社が存続するか。Pear Therapeutics、Mindstrongの撤退事例から学ぶ。
  • 利用者コミュニティ — r/Blind、r/deaf、AACユーザー会など実利用者の声を検索。

エピローグ — AIはアクセシビリティの補助、置き換えではない

2026年でも最も効果的なアクセシビリティツールは人とAIのハイブリッド。Be My EyesはAI(速い)とボランティア(正確)を結合し、Innocaptionは AI字幕と人間ライターを結合する。AACも語彙設計はSLP(言語聴覚士)が握り、AIは単語予測を補助する。

AI単独は幻覚、言語バイアス、そしてアクセシビリティ自体が学習データで過小代表されるという深いリスクを抱える。薬ラベル、信号機、医療判断をAI単独に委ねるべきではない。

それでも5年前と比べればアクセシビリティは圧倒的に良くなった。2020年は1,000 USDのスクリーンリーダーが標準だったが、2026年は無料のOS標準ツールがほぼ同じ仕事をする。13億人の日常が、毎年少しずつ平らになっている。

残るのは標準・認証・デザインシステム・インクルーシブデザインの文化。道具はもう十分にある。採用と強制力が、次の5年の課題だ。


参考資料