✍️ 필사 모드: 2026 AI デスクトップアプリのスナップショット — Granola・Cleft・Lex・Highlight・Raycast AI・Ollama、そして静かに立ち上がった「Ambient AI」カテゴリ
日本語プロローグ — チャットボットのタブではなく、デスクトップに住む AI
2023 年の AI 体験はシンプルだった。ブラウザのタブをひとつ開き、chat.openai.com を表示し、そこに質問を投げる。それを私たちは「AI を使う」と呼んでいた。2026 年春の風景はそれとは違う。チャットボットのタブは今でも開いているが、日常の重心が移った。AI はもはやブラウザの中のサイトではなく、デスクトップ上のアプリになった。会議中に勝手に聞き取って整理し、コマンドバーから呼ばれ、執筆エディタの中に住み、ショートカット一発でシステムのどこからでも現れる。
この流れをもっとも正確に表す言葉が 「ambient AI(アンビエント AI)」 — 周辺の AI、だ。私たちが AI を「訪問」しているのではない。AI が私たちのワークフローの中に常駐している。マーケティング文句のように聞こえるが、実は強いデザイン原則で、カテゴリの輪郭を引いている。ブラウザタブ型の AI は文脈の切り替えを強要する。作業を止めてタブに行き、質問をコピーして貼り、戻って答えを使う。Ambient AI はその摩擦を消す。私がいた場所で、私のフローのまま助けが入る。
この記事は、そのカテゴリの 2026 年春のスナップショットだ。会議ノート(Granola)、ローカル文字起こし(Cleft、Superwhisper、MacWhisper)、AI ネイティブ執筆(Lex)、システムワイドアシスタント(Highlight)、ランチャー AI(Raycast AI)、ローカルモデルチャット(AnythingLLM、Jan、GPT4All、LM Studio)、そしてこれらの多くが一度は乗ったエンジン Ollama まで。コーディングツール(Claude Code、Cursor など)は別シリーズで扱ったので、ここでは軽く触れるに留める。デスクトップに住むようになった AI たちを、カテゴリごとに正直に評価する — 何が動いていて、何がまだ動いていないか — のがこの記事の目的だ。
価格や機能の数字は速く動く。本記事の数字は「2026 年春時点」と釘を打っておく。ただし、6 か月後にも有効な構造的な違いに焦点を置く。同じカテゴリの 2 ツールの違いが「月額 5 ドル」ではなく「音声をローカルで処理するか、クラウドへ送るか」のようなデザイン上の選択なら、それは価格が変わっても揺らがない判断基準になる。
チャットボットのタブはツールだった。Ambient AI は環境だ。環境はツールよりはるかに強力で、だからこそ「どの環境に住むか」がいっそう重要になる。
1 章 · ambient AI のテーゼ — なぜこれがカテゴリなのか
ambient AI を単に「いろいろなデスクトップアプリ」と呼ぶと本質を取り逃がす。このカテゴリを束ねているのは 3 つのデザイン原則だ。
原則 1 · システム統合 ambient AI アプリは OS と深く統合される。グローバルショートカットで任意の場所から呼び出され、画面を見たり(スクリーン録画権限)、音声を聞いたり(マイクとシステムオーディオ権限)、クリップボードにアクセスしたり、他アプリのデータを読みに行く。これはセキュリティのトレードオフが大きい決断であり — どこまで権限を渡すかを交渉する必要があり — 同時に ambient の本質でもある。権限なしに ambient は成立しない。
原則 2 · トリガーの多様性 チャットボットのトリガーは 1 つだけだ。ユーザーがタイピングを始める。ambient AI のトリガーは複数ある。会議が始まれば Granola が聞き始める。グローバルショートカットを押せば Highlight が現れる。文字起こしホットキーを押せば Superwhisper のマイクが入る。ユーザーが明示的に呼ばなくても動くパターンこそ ambient の核心だ。ただしこの自動性は信頼の問題と直結する。自分が見ていないときに動くのなら、データの行き先を知っておく必要がある。
原則 3 · 文脈の適合 ambient AI は「今、この画面で、この段落で、この会議で」何が必要かを推測する。文脈は入力の半分だ。Lex は直前の段落を知っている。Cursor のようなエディタは開いているファイルを知っている。Highlight は画面に映っているテキストを知っている。文脈が正確であるほど、命令は短くなる — 「もっと短く」が機能する。チャットボットのタブでは毎回コピー&ペーストで文脈を渡す必要があった。
この 3 原則が組み合わさると、利用パターンが本質的に変わる。チャットボットとの会話は意識的だ — 何を聞くか決め、タブを開き、入力する。ambient AI との対話は反射的だ — 指がショートカットを押した瞬間にはもう何をするか決まっている。チャットボットが会議室なら、ambient AI は肩越しの同僚だ。
なぜこれがカテゴリなのか。同じデザイン原則のうえに作られたツールは同じユーザーのメンタルモデルを共有する。Granola を覚えれば Highlight も自然だ。Raycast AI を覚えれば Superwhisper のモーダルも馴染みがある。新規ユーザーに教えることが減るというのは、市場全体に強いネットワーク効果を生む。
2 章 · 会議ノート — Granola が定義したカテゴリ
会議ノートは ambient AI のなかで最も早く、最もきれいに動いたカテゴリだ。そしてそれを定義した会社についてはほとんど全員が一致する — Granola だ。
Granola のやることはシンプルだ。 デスクトップアプリを入れ、会議の直前に「ノート開始」を押す。Granola はマイクとシステムオーディオの両方を同時に聞く — Zoom、Meet、Teams、Google Hangouts、Discord、どの会議ツールでも構わない。ユーザーは会議中に自由にメモを書く(ここが重要だ)。会議が終わると、Granola は (a) 音声トランスクリプトと (b) ユーザーの手書きメモの 2 つを合わせて綺麗なノートを生成する。手書きメモが骨格を作り、AI が肉付けする。このデザインが他の会議ボット — Otter、Fireflies、tl;dv など — と決定的に違うところだ。彼らはトランスクリプトを丸ごと吐くが、Granola は人間の意図(手書きメモ)と AI の抽出を組み合わせる。
なぜホットなのか 2026 年 3 月、Granola は Index Ventures がリードする Series C で 1 億 2,500 万ドルを調達し、企業価値は 15 億ドルに達した。直前ラウンドの 2 億 5,000 万ドルから 6 倍ジャンプだ。同時に会議ノートツールを超えてエンタープライズ AI アプリへと拡張している。2026 年 2 月には MCP(Model Context Protocol)サーバーをリリースし、続いて個人 API とエンタープライズ API を公開して、ノートの文脈を他の AI ワークフローに接続できるようにした。Spaces というチームワークスペースも同時期に追加された。
価格(2026 年春時点) 無料(Basic)、Individual が 18 ドル/ユーザー/月、Business が 14 ドル/ユーザー/月、Enterprise が 35 ドル/ユーザー/月の 4 段階。無料は会議履歴の制限があり、Business はチームフォルダと統合請求、Enterprise はチーム全体のモデル学習オプトアウトが加わる。
限界と正直な評価 音声は文字起こしのためにクラウドへ送られる。「ローカル処理」ではないことは明確にしなければならない。機微な会議(法務、M&A、人事)では Enterprise 層の学習オプトアウトとデータ保存ポリシーを必ず確認し、それでも気になるなら Granola は答えではない。もう一つの落とし穴は、Granola の魔法はユーザーが手書きメモを取るときに最も発揮される、ということだ。聞いているだけの会議のノートは、ただの文字起こしとさほど差がない。
ひとことまとめ: 会議ノートカテゴリのデザインの基準点。会議が業務の 30% 以上なら、月額はほぼ自動で正当化される。
3 章 · ローカル文字起こし — Cleft、Superwhisper、MacWhisper
このカテゴリは ambient AI の最も私的な領域 — 自分の声 — を扱う。だからこそローカル処理がデザインの中心に置かれる。
Cleft (cleftnotes.com)
Cleft は Mac と iPhone の両方で動く「音声メモ + AI 整理」アプリだ。コアワークフローは単純だ — ショートカットまたはウィジェットで録音を始め、話し、止めると文字起こしと AI 要約/整理が同時に出てくる。差別化ポイントは macOS Spotlight 統合だ。Cmd+Space からどのノートも即座に検索できる。メモが OS の一部のように感じられるデザインだ。Apple Intelligence、Notion、Obsidian、Apple Notes、Shortcuts、Zapier との連携がよく作り込まれている。
Superwhisper (superwhisper.com)
Superwhisper のアイデンティティはシステムワイドの文字起こしだ。ホットキーを押して話せば、いまカーソルがある任意のアプリにテキストが挿入される。Slack でも、メールでも、Cursor でも。価格は無料 + Pro(月 8.49 ドル、年 84.99 ドル) + Lifetime 249.99 ドル。無料でも小型の Whisper モデルが完全ローカルで動く。Pro 以上は GPT、Claude、Llama のようなクラウド LLM でトランスクリプトを後処理し「書ける文章」に磨くモードが加わるが、これは自分の API キーを持ち込む(BYOK)必要がある。トークン料金は各プロバイダーから別途請求される。
MacWhisper / Whisper Transcription (goodsnooze.gumroad.com)
MacWhisper はファイル文字起こしに強い。録音ファイルをドロップすればテキストになる。Gumroad 版 MacWhisper は €59 一括の Pro ライセンス、Mac App Store 上の Whisper Transcription はサブスクモデル(月 6.99 ドル、年 29.99 ドル、ライフタイム 99.99 ドル)。同じ開発者の 2 製品で、同列で比較されるが正体は違う — Superwhisper はリアルタイム文字起こし、MacWhisper は事後のファイル処理。
正直な評価 文字起こしは ambient AI のなかで最も成熟した領域のひとつだ。Apple Silicon 上で Whisper 系モデルはほぼ人間レベルの精度に達しており、すべてローカルで動く — マイクのデータがインターネットに出ない。クラウド後処理モードをオフにしている限り完全オフラインだ。ただし後処理モードの誘惑は大きい。「より綺麗な文章」が明確に違うので、結局 BYOK トークンを使うことになる。その瞬間「完全ローカル」の約束は崩れる。このトレードオフを明示的に決めること。
ひとことまとめ: Superwhisper は毎日使う文字起こしツールの第一候補。Cleft は音声ベースのノートが業務の一部なら良い第二候補。MacWhisper はインタビューや録音の事後処理用の別ツール。
4 章 · AI ネイティブ執筆 — Lex
執筆ツールは最も誤解されやすいカテゴリだ。「AI が文章を書いてくれる」という幻想のせいだ。Lex(lex.page)はその幻想を逆手に取る — AI は文章を書かない。ユーザーが詰まったときにほぐすのだ。
Lex のアイデンティティは、Substack 初期メンバーで Product Hunt の共同創業者でもある Nathan Baschez による「作家の道具」精神だ。エディタはミニマルだ。気が散らない 1 画面、良いタイポグラフィ、自動保存。差別化ポイントは、執筆中に +++ と入力すると AI サイドバーが開き、(a) 次の文の提案、(b) 段落の書き直し、(c) ブレインストーミング、(d) フィードバックを受けられる点だ。モデルはユーザーが選べる — Claude は微妙な執筆フィードバックに、GPT-4o は創造的なブレインストーミングに、軽量の Mistral や Llama は手早い提案に向く。
2026 年の目玉機能: ボイストレーニング Lex はユーザーの Kit(旧 ConvertKit)ニュースレターで AI を学習させ、ユーザーの声を真似させる機能を追加した。Nathan Baschez 本人が「AI が自分のトーンに最も近づいた経験」と評価している。これは普通のファインチューンではなく、「あなたが普段使う語の頻度、文長の分布、段落のリズム」を学習信号にする。
価格 無料プランは月 30 回の AI チェック + 廉価モデル(Mistral、Llama 3 など)。Pro 月 18 ドルは GPT-4o や Claude などプレミアムモデルが無制限。毎日文章を書く職業なら、月 18 ドルは明白に正当化される。
正直な評価
Lex の最大の落とし穴は、ユーザーが AI に手を出すのが早すぎることだ。下書きを終える前に +++ を押すと、文章は AI 調にスライドしていく。Lex をうまく使う人は (a) 下書きを終わらせてから、(b) 詰まった段落や書き直したい場所だけ AI に問う。執筆ツールは結局、書き手の規律で差がつく。
ひとことまとめ: 毎日書く人のセカンドスクリーン。ブロガー、ニュースレター運営者、テクニカルライターには明白な候補。
5 章 · システムワイドアシスタント — Highlight
Highlight(highlightai.com)は ambient AI カテゴリで最も野心的なデザインを試みている。「どこからでも呼ばれ、画面を見て、すべてのアプリを知っている」アシスタントだ。
中心の操作はグローバルショートカットだ — Mac では Cmd 系ホットキー、Windows では Ctrl 系。押すとどこでも Highlight のウィンドウが立ち上がる。Highlight は (a) 画面に表示されているテキスト、(b) 進行中の会議の音声、(c) クリップボード、(d) Gmail、Slack、Linear、Notion など接続したサービスのデータにアクセスして文脈を埋める。その上で質問する — 「この PDF を要約」「さっきの会議のアクションアイテム」「この Slack スレッドの返信ドラフト」 — と文脈が自動でついてくる。
2026 年の資金調達と方向性 Highlight はもともと Medal からスピンアウトした会社で、2024 年のシード 1,000 万ドルでスタートし、2026 年 3 月に Khosla Ventures がリードする Series A 4,000 万ドルを発表した。累計調達は 7,300 万ドル超。新 CEO の招聘と同時に、エンタープライズ市場へ移行している。
なぜ興味深いのか 他の ambient AI アプリが各々狭い領域(会議ノート、文字起こし、執筆)を深く掘るのに対し、Highlight はメタレイヤーを狙う。すべてのアプリの上に浮かぶ AI。この野心が機能すれば、他の ambient ツールの一部ユースケースを吸収する。機能しなければ — すべてのアプリに散らばる文脈を 1 つの画面に集めるのはセキュリティ、精度、UX のすべてで本当に難しい — 中途半端なツールに留まる。2026 年春時点の評価は有望だが未完成だ。
正直な評価 権限モデルが最大の判断ポイントだ。Highlight をきちんと使うには画面録画、マイク、システムオーディオの権限をすべて渡す必要がある。セキュリティ感度が高い環境(法務、金融、ヘルスケア)では、それが通らない。もう一つの落とし穴は、「どこでも動く」という約束が実際は「対応アプリではよく動く」だということ。対応リストは急速に増えているが、社内ツールや小規模アプリではしばしば詰まる。
ひとことまとめ: 野心的な賭け。個人や小規模チームでは試す価値がある。エンタープライズ採用は権限レビューを通る必要がある。
6 章 · ランチャー AI — Raycast AI
Raycast はもともと AI 機能なしでも Mac ユーザーに愛されたランチャーだった。Spotlight 置換、クリップボードマネージャ、ウィンドウマネージャ、スニペット、エクステンション — ひとつのショートカットで何でもこなす。2023 年に AI 機能が加わって、アイデンティティが一段進化した。
Raycast AI (raycast.com/pro)
Pro プランは月 8 ドル/ユーザー(年払い)、月 10 ドル(月払い)で AI チャットが含まれる。モデルは GPT-4o-mini、Claude Haiku 3.5、Llama 3.3、そして Raycast 自身のオーケストレーションレイヤー。Advanced AI アドオン +月 8 ドルで(合計月 16 ドル)、GPT-5、Claude 3.7 Sonnet、o3、o3-mini、Gemini 2.5 Pro といったフロンティアモデルまで開く。価格は Pro プラン開始以来ほぼ据え置きで、2023 年以降 8 ドル年払いを維持している。
デザインの核心: ランチャーの中の AI Raycast の AI は別ウィンドウではない。普段使うランチャーショートカット(通常 Option+Space)の中で「AI Chat」と打てばモーダルが開く。狂ったように速い — ユーザーの指がもうそのショートカットの上にあるからだ。これが ambient AI の核心だ。別のアプリを開きに行かない。
また、2026 年春時点で Raycast は MCP をファーストクラスでサポートしている。Notion、Linear、GitHub のようなサービスを標準プロトコルで接続し、AI Chat の中で「直近に作った Linear のイシュー 5 件を要約」のようなコマンドが自然に通る。
正直な評価 Mac 専用というのが最大の制約だ。Windows、Linux ユーザーは別の道を探す必要がある。また、Raycast の価値はランチャー機能全体に由来するので、AI 目当てで入れたユーザーは「機能の過剰」を感じることがある。慣れれば他のツールに戻れなくなるが、最初の学習曲線は存在する。
ひとことまとめ: Mac ユーザーにとって最もコスパの高い ambient AI への入口。月 8 ドルで得られる価値が圧倒的だ。
7 章 · ローカルモデルチャット — AnythingLLM、Jan、GPT4All、LM Studio
ここは ambient AI カテゴリの最も「ギーク」な領域だ。クラウド API にデータを送らないというテーゼを限界まで突き詰めた人たちのツールだ。このカテゴリは Ollama が築いたインフラの上に立っている — だからまず Ollama から押さえる必要がある。
Ollama (ollama.com)
Ollama はローカル LLM を回すランタイムだ。コマンドラインに ollama run qwen3 と打てば — モデルがなければ自動で取りに行き — チャットが始まる。デザインは Docker がコンテナにしたことを LLM に対してやる。2026 年春時点でライブラリは Qwen3、Llama 3.x、Gemma 3、DeepSeek など、事実上すべてのオープンウェイトモデルを含む。Mac では統合メモリ(48GB、64GB)のおかげで、別途 GPU なしで 30B クラスのモデルまで動かせる。
LM Studio (lmstudio.ai)
2026 年のローカル LLM デスクトップアプリの中で最も機能が豊富だ。MLX(Apple Silicon 最適化)サポート、MCP ツールコール、SDK、洗練されたモデルブラウザまで。Apple Silicon で真剣にローカルモデルを動かしたいユーザーの既定の選択肢。
Jan (jan.ai)
「オープンソースの ChatGPT 代替」を標榜する。MIT ライセンス、テレメトリなし、チャット履歴はローカル JSON で保存され、いつでも監査可能。Nomic エコシステムの一部。
GPT4All (gpt4all.io)
Nomic AI が作った最も親しみやすい入門ツール。ダウンロードして、ビルトインのリストからモデルを選び、すぐにチャット。LocalDocs という RAG 機能が差別化ポイント — ローカル文書のフォルダを指定すれば自動で RAG が回る。
AnythingLLM (useanything.com)
「オールインワン AI ワークスペース」を狙う。RAG、エージェント、チャットを 1 画面で。ローカル、セルフホスト、クラウドのいずれにも対応。最も「プラットフォーム」的なデザインで、学習曲線もそれ相応に急。
正直な評価 ローカルモデルチャットは ambient AI の中で理想と現実の差が最も大きい場所だ。理想は「自分のデータがインターネットに出ない、無料、速い」。現実は (a) ローカルの 30B モデルはクラウドのフロンティアモデルより明らかに一段下、(b) 応答性を得るには大きな RAM が必要、(c) UX はチャットボットのタブほど優しくない。だからこのカテゴリの本当のユーザーはプライバシー義務を持つ人々 — 法務、ヘルスケア、企業セキュリティ — または学習動機のある開発者だ。「普通の知識労働者が ChatGPT の代わりに使う」段階にはまだ届いていない。
ひとことまとめ: ローカルでモデルを回す明確な理由(プライバシー義務、オフライン作業、学習)があるなら LM Studio から始めるとよい。そうでなければ、このカテゴリ自体を飛ばしてかまわない。
8 章 · カテゴリ × 製品マトリクス
頭の中に同じ表を持って比較するために整理しておく。行はデザインの判断軸、列は代表的な製品群。「プライバシーの物語」はデータがインターネットを出るか、「キラー機能」は他のカテゴリが真似しにくい核心価値。
| 軸 | Granola(会議ノート) | Cleft / Superwhisper(文字起こし) | Lex(執筆) | Highlight(システム) | Raycast AI(ランチャー) | LM Studio / Jan(ローカルモデル) |
|---|---|---|---|---|---|---|
| プライバシーの物語 | クラウド文字起こし、Enterprise で学習オプトアウト | 文字起こしはローカル、後処理は BYOK クラウド | クラウド LLM 呼び出し | クラウド + 一部ローカル | クラウド、Pro でも同じ | 完全ローカル(BYOK もオプション) |
| 価格(2026 春) | 無料 〜 35 ドル/ユーザー/月 | 0 ドル 〜 月 8.49 ドル / 249.99 ドル lifetime | 無料 〜 月 18 ドル | 非公開(個人無料 + Enterprise) | 月 8 ドル + Advanced 8 ドル | 無料(モデルは無料、RAM が費用) |
| OS 対応 | macOS、Windows、Web | Mac / iOS 中心(Superwhisper も) | Web(ブラウザ) | macOS、Windows | macOS のみ | クロスプラットフォーム(LM Studio / Jan)、一部 Mac 限定 |
| トリガー | 会議開始のボタン | グローバルホットキー | +++ 呼び出し | グローバルショートカット | ランチャーショートカット | 個別アプリ起動 |
| キラー機能 | 手書きメモ + AI 合成 | システムワイド文字起こし + 後処理 | モデル選択 + ボイストレーニング | 画面・音声・アプリ文脈の統合 | ランチャー内 AI + MCP | 完全オフライン、モデル交換が自由 |
| MCP サポート | 2026/02 リリース | 部分(Superwhisper のエージェントモード) | なし | 部分 | ファーストクラス | LM Studio がファーストクラス、他は部分 |
| 主な弱点 | ローカル処理ではない、手書きメモなしでは平凡 | 後処理を ON にするとローカル約束が崩れる | 早く AI に手を出すとトーンが崩れる | 権限の幅が大きい、社内ツール対応が弱い | Mac only、機能過剰 | チャットボットより鈍い、RAM が高価 |
このマトリクスの罠の一つは、カテゴリ間の比較を勧めないことだ。Granola と Raycast AI を「どちらが優れているか」で問うのは無意味だ — 答えようとする質問が違う。マトリクスはカテゴリ内のデザイン判断の違いを浮かび上がらせるのに意味がある。
9 章 · オピニオン — 今日入れる 3 つのアプリ
いま ambient AI を初めて始めるなら、どこから出発するか。比較表ではなく推薦が必要な人のためのセクションだ。職業、OS、予算で答えは変わるが、「MacBook を使う知識労働者」という最も一般的なペルソナに限定して 3 つだけ挙げるなら — そして最も検証されたカテゴリから始めるなら — こう薦める。
1. Raycast AI(月 8 ドル) ambient AI への入口として最も安全だ。ランチャー自体の価値が AI 費用を正当化し、AI チャットは事実上ボーナス。MCP サポートで他サービスとの連携も自然。始めるのに最もコスパの良い 1 つ。
2. Granola(無料または Individual 月 18 ドル) 会議が週 5 回以上あるなら無条件で。手書きメモ + AI 合成のデザインは、一度慣れると他の会議ボットには戻りにくい。無料プランで始めて価値を確認してから有料に移る流れが自然。
3. Superwhisper(Pro 月 8.49 ドル)または Cleft(無料スタート) 文字起こしはいったん習慣化すると、キーボード入力の一部を永続的に置き換える。システム全体で使いたいなら Superwhisper、音声ノートを整理して保管するのが要なら Cleft。どちらも無料または安価な入口があるので、1 週間の試運転が容易。
次の段階 — Highlight、Lex、LM Studio この 3 つは上記 3 つで ambient AI に慣れた後の第二段階。Highlight は「どこにでも浮かんでいる AI」が本当に必要か 1 か月使って判断する。Lex は執筆が業務の明白な一部の場合のみ。LM Studio はプライバシー義務や学習動機があるときだけ。
なぜこう薦めるか 3 つの共通点は (a) 検証されたカテゴリ、(b) 学習曲線が短い、(c) 無料または低い入口。ambient AI は習慣になって初めて価値が出る — 最初からシステム全体を作り直すツールを選ぶと、数日で諦める。小さく、日々の摩擦を減らすツール 1 〜 2 個から始め、指がショートカットを覚えるまで放置するのが王道だ。
10 章 · ambient AI の暗い面 — 権限・プライバシー・ロックイン
このカテゴリを勧める前に、率直に押さえておくべきことがある。
権限の累積 ambient AI アプリを 3 つ入れると、マイク、システムオーディオ、スクリーン録画、アクセシビリティ、オートメーションの権限が 3 社に分散する。それぞれの会社は約束を守るが、どこかの会社がセキュリティ事故を起こした瞬間にすべての権限が露出する。権限は積み重なる負債だ。定期的に使っていないアプリの権限を回収する習慣が必要だ — 少なくとも四半期に 1 回。
プライバシーマーケティングと実態 「学習には使いません」はあらゆる会社の定型句だ。しかしこれは (a) 人が見ないという意味ではなく、(b) インフラが安全だという意味ではなく、(c) 合併・売却・破産のときデータがどこへ行くかを定義していない。機微な会議や文書は、ツールが処理する前に人間の判断が先に来るべきだ。「Granola をオフにして自分の耳で聞く」「Highlight を切っておく」が時には正解だ。
ロックインと移行 ambient AI ツールはユーザーのワークフローに深く食い込む — 慣れると指がショートカットを覚える。だからロックインが大きい。会社がつぶれたり価格が暴騰したりすると、新しいツールへ移るのは思った以上に難しい。定期的にデータエクスポート機能を確認すること。Granola のノート、Cleft のトランスクリプト、Lex の原稿が標準フォーマット(Markdown、テキスト、JSON)で取り出せるかを確認する。
価格モデルのトークン化 2026 年春時点、ambient AI 業界は使用量ベースの価格へ移っている。無制限定額プランは徐々に消え、「月 N 回の AI 呼び出し」や「トークンプール」のようなモデルが増えた。ヘビーユーザーの実際の月額を推定しないと、四半期末に請求書が倍になる。最初の 1 か月はわざとヘビーに使って実コストカーブを確認すること。
プラットフォームリスク 多くの ambient AI ツールが OpenAI、Anthropic、Google の API の上で動いている。モデル価格やポリシーが変わると — そしてそれは 2024 〜 2025 年に何度も変わった — 利用者が受ける価格と機能も同時に変わる。無制限定額プランが突然「トークン上限」に変わることもある。ひとつのツールに依存しすぎる前に、代替を頭に入れておくこと。
11 章 · サーバーサイド vs デスクトップサイド — なぜデスクトップが再び重要なのか
2020 〜 2023 年の SaaS 全盛期には「デスクトップアプリは死んだ」という話をよく聞いた。すべてがブラウザに移り、Electron アプリですら実体はブラウザだった。ところが 2026 年の風景はちょうど逆だ。デスクトップアプリが戻ってきた。そしてその引力は AI から来ている。なぜか。
理由 1 · 権限が必要 ブラウザは意図的に、マイク、システムオーディオ、グローバルショートカット、他アプリの画面を見られないようにしている。セキュリティモデルだ。ambient AI はこれらの権限がすべて必要だ。会議音声を聞くにはシステムオーディオ、グローバル呼び出しを受けるには全域ショートカット、画面を見るにはスクリーンキャプチャ。権限がデスクトップの堀になった。
理由 2 · レイテンシが小さい グローバルショートカットを押してからモーダルが出るまでの 50 ミリ秒と 500 ミリ秒の差は、人間が感じる。ブラウザは PWA で良くなったが、それでもネイティブの即時性には届かない。ambient AI は反射的な操作で、反射的な操作は 100 ミリ秒以内に終わる必要がある。
理由 3 · モデルがクライアントに降りてきた Apple Silicon の統合メモリ、MLX、Core ML が作った変化は大きい。2024 年までローカル推論は「おもちゃ」だったが、2026 年には少なくとも文字起こし、要約、埋め込みくらいはクライアントで充分動く。モデルが降りてくるならアプリも降りてくる必要がある。
理由 4 · コストカーブ すべての入力がクラウド API に流れる場合のコストは、ヘビーユーザーにとっては重い。毎日 1 時間の文字起こしを続ければ、月に GPT 級 API で 100 ドルを超えることはざらだ。ローカルで回る部分が増えるほど、単位経済が改善する。
この流れには副産物がある — デスクトップアプリを作れるチームが再び希少になった。2010 年代後半以降に入った開発者の多くは Web しか知らない。Electron、Tauri、SwiftUI、Win32、macOS API を本気で扱える人材は少ない。この空間に勝っている会社 — Granola、Cleft、Raycast、Highlight、Superwhisper — はその希少性から部分的に利益を得ている。同じアイデアを SaaS にすれば競合が 100 社出るが、よくできたデスクトップアプリは真似が難しい。
12 章 · 信頼シグナル — どの ambient AI を入れていいかを見分ける
ambient AI アプリは権限の幅が大きい。だから「どの会社を入れるか」自体が重要な判断だ。次の 6 つの信頼シグナルを見てフィルタリングする習慣をつけよう。
シグナル 1 · セキュリティページが具体的か ホームページに "We take security seriously" だけ書いている会社は疑え。真剣な会社は SOC 2 レポート、データ保存ポリシー、サブプロセッサーリスト、ペネトレーションテストの要約を公開する。Granola、Highlight のような企業市場向けの会社はこれが整理されている。
シグナル 2 · ローカル処理オプションがあるか 完全ローカルが難しいなら、「ローカル処理モード」が明示的なオプションとして存在する会社は自社のデザインに真面目だ。Superwhisper、LM Studio、Jan は明確。クラウド専用なのにこの点をぼかす会社はマーケティングで押し切ろうとしている。
シグナル 3 · データエクスポートの綺麗さ 「自分のノートを持ち出せるか」はシンプルな質問だ。ワンクリックで Markdown、JSON、CSV が出てくれば良い会社。エクスポートが隠れていたり、有料プラン限定だったり、フォーマットが奇妙だったりすれば、ロックインの意図がある会社だ。
シグナル 4 · 価格変更履歴 2024 〜 2025 年に価格を一度も上げなかった会社 vs トークン上限を後から差し込んだ会社。価格ページの変更履歴は Wayback Machine で簡単に確認できる。信頼は一貫性から来る。
シグナル 5 · 会社の調達ステージ シードの 1 人会社が作ったツールは魅力的だが、6 か月後に会社が存在しない可能性がある。Series A 以上なら、少なくとも 1 〜 2 年のランウェイがある。これは製品の品質ではなく「ユーザーのワークフローが消えないように守る」観点だ。
シグナル 6 · コミュニティとチェンジログ 公開されたチェンジログが活発な会社はユーザーとの対話チャネルを大事にしている。Discord やフォーラムで CEO やエンジニア本人が答える会社は、小さな会社ほど強い信頼シグナルだ。1 週間も更新されないチェンジログは、会社の関心が他にあるサインかもしれない。
この 6 つすべてが満点の会社はない。ただし 2 社を比較するとき合計点が近いなら、信頼シグナルは価格よりも重要なタイブレーカーであるべきだ。誰に権限を渡すかは、いくら払うかより重い。
13 章 · 6 か月の実験 — 一人のユーザーが見た変化
この記事は抽象的な分析だけで書かれたのではない。2025 年秋から 2026 年春までの 6 か月、私自身が ambient AI ツールを日常に入れた経験を短く共有する。一般化ではなくケーススタディとして受け取ってほしい。
Week 1 〜 2 — Raycast AI 導入 最も負担が低いところから始めた。すでに Raycast をランチャーとして使っていたので、Pro へアップグレードしただけ。効果は即時だった — 細かな変換、要約、定義検索がタブ切り替えなしで完結する。月 8 ドルの費用は最初の 2 週間で回収。
Week 3 〜 6 — Granola 導入 会議が業務の大きな部分を占めるので、Granola を本格導入。最初の 2 週間は手書きメモの習慣を失っていたことが露呈し、ノートは平凡だった。意識的にメモを取り直し始めると、AI 出力の質が 2 倍になった。会議後の片付け・共有で週 1 〜 2 時間を取り戻した。
Week 7 〜 10 — Superwhisper 導入 文字起こしを日常に組み込むのに最も時間がかかった。最初はぎこちなく、ショートカットを忘れた。4 週目に指が覚えてから、Slack、メール、イシュー作成の 60% 以上が音声になった。キーボードより速く、姿勢にも優しい。後処理モードを BYOK で ON にし、月のトークン費用は約 7 ドル。
Week 11 〜 14 — Highlight 試用 野心的に試したが、権限の幅に負担を感じて 1 か月で OFF にしてカテゴリから外した。「どこにでも浮かぶ AI」の魅力は大きかったが、画面録画権限が常時 ON の状態が気になった。他の人には良いツールでも、自分の作業分布には合わなかった。
Week 15 〜 20 — LM Studio で学習 これは業務導入ではなく学習目的。Qwen3、Llama 3.x を実際に回し、MLX 量子化、MCP ツールコールまで触った。日常業務に使うほどではないが、ローカル LLM がどこまで来たかの肌感覚を得るには有用だった。学習動機が明確なときだけ薦めるカテゴリなのはこのためだ。
Week 21 〜 24 — 安定化 Raycast AI、Granola、Superwhisper の 3 つが日常に定着。Lex と Cleft は次点候補として時折触るが、コアフローではない。月の合計費用は約 35 ドル — 無料代替に対して明確な価値差を感じる。
6 か月の総括
- 明確な効果: 会議後始末の時間が 50% 減、メール・Slack の 60% が音声入力、細かな変換・定義検索作業がほぼ消えた。
- 明確な限界: ambient AI は深い思考作業(執筆、設計、意思決定)を置き換えない。表面の摩擦を減らすだけだ。
- 意外な発見: 月 1 回の権限監査が習慣化した。最初は面倒だったが、今は自然。
- 後悔: Granola をもっと早く始めるべきだった。会議ノートの質の変化が最も大きかった。
このケースは万人に一般化されない。会議がほとんどない仕事なら Granola は無意味だし、声を出せない環境なら Superwhisper は外れる。しかし2 〜 4 週間ごとに 1 カテゴリずつ試す流れは一般化できる。本記事がその流れの小さな道しるべになれば、と思う。
14 章 · ショートカットの人間工学 — ambient AI で最も過小評価されているデザイン決断
ambient AI ツールのレビューでほとんど触れられないトピックがある。ショートカット設計だ。しかし実際の使用体験において、これは最大級の決定要因の一つだ。ambient AI は指が覚えてはじめて価値を出す。だからショートカットが衝突すれば — システムショートカットと、他の ambient AI アプリと、あるいは指が届きにくければ — 毎日の摩擦が積もる。
問題 1 · 衝突の可能性 ambient AI アプリを 5 つ入れれば、グローバルショートカットを 5 つ確保する必要がある。OS、IDE、ブラウザ、他の生産性ツールもショートカットを掴んでいる。使える組み合わせは急速に減る。2026 年春時点でよく衝突する例 — Cmd+Shift+Space、Cmd+Option+I、Cmd+Shift+J。あるアプリが新バージョンで既定のショートカットを変えれば、他のアプリと突然ぶつかる。
問題 2 · 人間工学 「指が届きやすい位置」と「手首がねじれる位置」は、毎日何十回も押すショートカットで大きな差になる。最も頻繁に押すショートカット — 私の場合は文字起こし — は片手で届くべきだ。両手の協調が必要なショートカットはフローを切る。
問題 3 · モーダルとトグルの区別 文字起こしは通常 2 つのモードがある — 「押している間だけ録音(push-to-talk)」または「1 回押せばトグル」。短い文には push-to-talk、長い文字起こしにはトグルが向く。同じショートカットが両モードを処理しようとすると、ユーザーが混乱する。
実践的な推奨 — 2026 年春時点
- 文字起こし (Superwhisper / Cleft): Caps Lock または Fn の指 1 本。毎日押し、片手で届き、システム機能と衝突しにくい。macOS で Caps Lock を文字起こしにマップするのは Karabiner-Elements やアプリ内設定で可能。
- システムアシスタント (Highlight): Cmd+Shift+I または Option+Space。指 2 本だが、1 日 5 〜 10 回しか押さない頻度なのでコストは許容範囲。
- ランチャー (Raycast AI): Option+Space。Spotlight (Cmd+Space) から自然に移行したユーザーが最も多く使う組み合わせ。
- 会議ノート (Granola): グローバルショートカットよりメニューバークリックや会議開始の自動トリガーのほうが良い。会議開始は頻繁ではないので。
衝突チェックルーティン 新しい ambient AI アプリを入れるとき、以下の 5 分ルーティンを回す — (1) 既定ショートカットをメモ、(2) よく使う IDE・ブラウザショートカットと比較、(3) 他の ambient AI アプリと比較、(4) 衝突があれば即時に再割当、(5) 1 週間で指が覚えるか確認。これをやらないと 1 か月後に「なぜか使わなくなった」という結末を迎える。
なぜこれが重要なのか ショートカットは ambient AI の唯一の可視インターフェースだ。会社がよいモデルとよいバックエンドを持っていても、指が覚えないショートカットならその価値はすべて閉じている。ショートカットのカスタマイズをファーストクラスで扱うか、衝突を自動検出するかは信頼シグナルの一つと見ていい。Raycast がこれを最もよくやっている — どのショートカットも再割当可能で、衝突を検知したら警告を出す。Highlight は弱い。
ひとことまとめ: ambient AI は指のツールだ。記憶には時間がかかり、覚えたショートカットは強力。ショートカット設計はツール選択と同じくらい重要な決断だ。
15 章 · コーディングツールとの境界 — 一言で押さえて先へ
本記事のスコープは「ambient AI デスクトップアプリ全般」だが、コーディングツール — Claude Code、Cursor、OpenClaw、Windsurf、JetBrains AI など — は別シリーズで扱ったのでここでは短く触れる。
コーディングツールも明らかに ambient AI の一カテゴリだ。ショートカットで呼ばれ、エディタに常駐し、文脈(開いているファイル、git diff、ターミナル出力)を自動で読む。デザイン原則は同じだ。ただしユーザーが違う。一般の知識労働者には Granola、Cleft、Raycast が先で、開発者には Cursor、Claude Code が業務の中心になる。2 つの世界は徐々に融合している — 例えば Cursor の中で Superwhisper で文字起こしする、Raycast から GitHub MCP でレビューを呼ぶ。カテゴリの境界が曖昧になることが、ambient AI 成熟のサインだ。
コーディングツールを真剣に比較したいなら、当ブログの別記事「2026 AI コーディングエージェントの真正面比較」を参照。そこでは Surface(CLI / IDE / クラウド)、自律性レベル、文脈処理、MCP、価格、サンドボックス、ガバナンスの 7 軸で 6 つのコーディングツールを比較している。
16 章 · よくある質問 — 正直な回答
本記事の草稿を同僚に見せたときに繰り返し出てきた質問をまとめた。標準的な FAQ ではなく、決断に直接効く質問だけを選んだ。
Q. ambient AI ツールは結局すべて統合されるのでは? 一つだけ入れれば済む日は来るのか? A. 統合の流れはある。Granola は API へ拡張し、Raycast は MCP で外部サービスを吸収し、Highlight はすべてのカテゴリを狙う。しかし単一のツールが会議、文字起こし、ランチャー、システムアシスタントをすべて同等にこなせる時点は、私の見立てでは 2027 年以降だ。それまでカテゴリごとに 1 つ選んで合成するのが現実的だ。
Q. 韓国語・日本語の文字起こし精度はどうか? A. 2026 年春時点で Whisper 系モデルは韓国語・日本語でもほぼ英語と同等の精度だ。Apple Silicon 上で Whisper Large-v3、Distil-Whisper がよく動く。Cleft も Superwhisper も韓国語・日本語の UI とモデルを十分にサポートする。痛点は外来語、固有名詞、数字 — 後処理モードを ON にすると大きく改善するが、BYOK のトークン費用がかかる。
Q. 会社のデータを ambient AI に入れていいのか? A. 会社ごとに異なるが、一般的なガイドは — (a) 会社のセキュリティチームが明示的に承認したツールのみ使う、(b) Enterprise プランの学習オプトアウトとデータ保存ポリシーを確認、(c) 機微なカテゴリ(法務、M&A、人事、医療)ではツール使用を一時停止、(d) ローカル処理オプションがあるツールを優先。ambient AI は「ChatGPT に会社資料を貼る」より本質的に安全なわけではない — 同じ LLM に同じデータを送る経路が違うだけだ。
Q. 無料ツールだけで ambient AI を体験できるか? A. 部分的には可能。Cleft 無料、Granola 無料(会議履歴制限)、Jan / GPT4All / LM Studio は完全無料。しかし ambient の本当の価値はシステムワイド文字起こしとランチャー AI で最も大きく出るが、この 2 つは有料の入口が事実上必須だ。月 10 〜 20 ドルをカテゴリの参入コストと見るのが正しい。
Q. ambient AI ツールが知りすぎていて怖い。 A. 正当な感覚だ。マイク、画面、システムオーディオ、キーストロークにアクセスするツールを毎日 ON にするのはセキュリティのトレードオフだ。2 つの緩和策 — (a) 権限をカテゴリごとに分散させ、1 社にすべての権限を渡さない、(b) 四半期ごとに権限監査。それでも気になるならカテゴリ自体を見送ってよい。見送りは正当な結論だ。
Q. コーディングツール(Cursor、Claude Code)と ambient AI ツールはどう併用するか? A. 自然に重なる。Cursor 上で Superwhisper で文字起こし、Raycast から GitHub Issue を呼び、Granola のノートをコーディングコンテキストに引き込む。衝突するのはショートカットだけだ — インストール時にコーディングツールと ambient AI のショートカットがぶつからないか確認すれば十分。
Q. この記事の推薦は 6 か月後にも有効か? A. 構造的結論(原則、デザインのトレードオフ、信頼シグナルの枠組み)は有効だ。具体的な製品の推薦は四半期ごとに再評価する必要がある。新規参入があり、既存ツールが価格を変え、モデルがアップグレードされる。記事の最後で「四半期ごとの再評価」を強調しているのはそのためだ。
Q. 本記事に載っていないツールのうち真剣に見るべきものは? A. ある。短く — Mem(メモ AI)、Heyday(Web ブラウジングのメモリ)、Notion AI(Notion 内だけ ambient)、Apple Intelligence(システムレベルで最も ambient だが 2026 年春時点で機能制限が大きい)、Microsoft Copilot(Windows での同等の位置)。いずれも真剣だが、各々本記事のカテゴリマトリクスの変形として収まるため、別建てにしなかった。
エピローグ — チェックリスト・アンチパターン・次回予告
2026 年春、ambient AI デスクトップアプリのカテゴリは明らかに自分の場所を確保した。1 〜 2 年前には「物珍しいアプリ」だったツールが、いまや日常のワークフローの一部だ。しかし「AI デスクトップの時代だ」というヘッドラインを無批判に受け取るのは危険だ。カテゴリごとに成熟度が違い、トレードオフは明確で、ロックインと権限コストが累積する。
導入チェックリスト(番号順)
- 一日の業務を分解する — 会議の比重、執筆の比重、文字起こしと整理の比重、システムコマンドの比重を書き出す。
- 最も摩擦の大きい 1 つのフローを選ぶ — 「会議が多すぎる」「文字起こしのほうがキーボードより速いはず」、1 つだけ。
- そのフローに合うツール 1 つを無料 / 安価な入口で試す — 一度に 3 つ入れない。
- 2 週間は強制的に使う — 指がショートカットを覚えてはじめて本当の評価ができる。
- 2 週間後に定量評価 — 時間節約、成果物の質、コストを 1 行ずつ書く。
- 権限監査 — このアプリにマイク、画面、システムオーディオ、アクセシビリティのどこまで権限を渡したかを確認。
- データエクスポートテスト — ノートやトランスクリプトが標準フォーマットで取り出せるか一度試す。
- 価格カーブ確認 — ヘビーユーザーの実際の月額を推定する。
- 決定: 採用 / 別のツール / カテゴリごとパス — パスも正当な結論だ。
- 四半期ごとに再評価 — このフィールドは 6 か月で景色が変わる。
アンチパターン(やってはいけない)
- 一度に 3 つ入れる — 権限と学習曲線が爆発する。1 つずつ。
- 「ローカル処理」マーケティングをそのまま信じる — 後処理モードをオンにした瞬間にデータはクラウドへ行く。モードごとに確認すること。
- データエクスポートテストの省略 — ツールがつぶれたり価格が暴騰したとき逃げ道がなければ、ロックインが無限に広がる。
- 権限累積の無視 — 四半期ごとに回収しないと、使っていないアプリがマイク権限を持ったままになる。
- 定額プランの表面価格だけ見て安心する — トークンベースへ移行中だ。ヘビーユーザーの実費を自分で推定すること。
- 機微な会議で ambient をそのままオンにしておく — 法務、人事、M&A はツールが処理する前に人間が判断する。
- 流行で全カテゴリを導入する — ローカル LLM は万人のためではない。動機が明確なときだけ。
- ショートカットを覚えずに評価する — 指が覚えるまで、ツールの本当の価値は見えてこない。
次回予告
次回は ambient AI の次の段階 — エージェント型 ambient AI — を扱う。これまでの ambient AI はユーザーがトリガーすれば助けてくれるツールだ。次世代はユーザーが起こさなくても能動的に仕事を処理する。受信箱を自動分類し、会議のアクションアイテムを次の会議前にリマインドし、カレンダーの衝突を自動で交渉する。これがうまく動けば本物の「個人秘書」になり、間違えれば恐ろしいセキュリティと信頼の事故になる。デザイン原則、信頼モデル、責任の境界、そして 2026 〜 2027 年に現れそうな候補製品を整理する。
ambient AI はツールではなく環境だ、とプロローグで書いた。環境はゆっくり作られ、一度作られると私たちの働き方そのものを再定義する。どの環境に住むか、誰に権限を渡すか、どのトレードオフを受け入れるか、その決断はユーザーがする。この記事がその決断の小さなガイドになれば、と思う。
参考 / References
- Granola — AI notepad for meetings — 会議ノート公式サイト
- Granola raises 1.5B valuation (TechCrunch) — Series C 2026/03
- Cleft Notes — Capture and Share Notes With Cleft's AI Scribe — Cleft 公式
- Cleft: AI Voice Memos on the App Store — Mac App Store
- Superwhisper — System-wide dictation for Mac — 文字起こし公式
- MacWhisper — File transcription for Mac — Gumroad 販売ページ
- Lex — AI-powered writing app — Lex 公式
- Lex Pricing — 価格ページ
- Highlight AI — The AI that works everywhere you do — 公式サイト
- Desktop AI assistant app Highlight spins out of Medal (TechCrunch, 2024) — スピンアウトの背景
- Raycast Pro — AI, Cloud Sync & Custom Themes — Pro プラン
- Raycast Pricing — 価格ページ
- Ollama — Get up and running with large language models — 公式
- Ollama Library — Models — モデルカタログ
- LM Studio — Discover, download, and run local LLMs — Mac / Windows / Linux デスクトップ
- Jan — Open-source ChatGPT alternative — MIT ライセンス
- GPT4All — Run Local LLMs on Any Device (GitHub) — Nomic AI
- AnythingLLM — All-in-one AI workspace — セルフホスト可能
- Model Context Protocol (MCP) — Anthropic spec — ambient AI ツールの多くが採用した標準
현재 단락 (1/229)
2023 年の AI 体験はシンプルだった。ブラウザのタブをひとつ開き、`chat.openai.com` を表示し、そこに質問を投げる。それを私たちは「AI を使う」と呼んでいた。2026 年春の風...