AIは本当に減速しているのか — データセンター経済学で読む2026年AIバブル論争

はじめに — なぜ今この論争なのか
議論の基礎 — 用語と単位の整理
減速論の核心主張 — 算数が合わない
トークン経済学 — 単価下落は祝福か呪いか
- 推論1回の原価構造
反論 — 減速ではなく転換だ
インフラのロックインと減価償却 — 時間が敵になる構造
- 電力という物理的制約
ドットコムバブルとの比較 — 同じ点と違う点
開発者と企業のための実用的な示唆
シナリオ分析 — 三つの未来
何を見ればいいのか — 観測指標チェックリスト
よくある質問
批判的視点 — 両陣営の弱点
おわりに — バランスの取れた結論
参考資料

はじめに — なぜ今この論争なのか

2026年上半期、テック業界で最も熱い論争は、モデルの性能ではなく会計帳簿の上で起きています。Ed Zitronが運営するニュースレターの「AI is slowing down」という記事がHacker NewsとGeekNewsを直撃し、ほぼ同時にThe Economistは、Anthropic、SpaceX、OpenAIというメガIPO候補を株式市場は消化できるのかという記事を出しました。

論争の核心の問いはシンプルです。すでに約束されたAIインフラ投資を正当化するには、いったいいくらの売上が必要なのか。そしてその売上は実際に発生しつつあるのか。

この問いが2026年6月に特に重い理由があります。第一に、ハイパースケーラーのデータセンター建設計画が累計190GW規模に達したという集計が出ました。第二に、一部のアナリストは、この投資を回収するには2030年までにAI産業が年間2兆ドル水準の売上を生み出す必要があると主張しています。第三に、そのさなかにAnthropicのS-1提出説をはじめとするIPOの流れが本格化し、私募市場のバリュエーションが公開市場の検証台に上がる直前です。

この記事では両陣営の主張を数字で分解し、ドットコムバブルとの比較を経て、開発者と企業が今何をすべきかまで整理します。先に言っておくと、この記事の結論はバブルだ、でもバブルではない、でもありません。両側の算数を理解した人だけが、どちらに傾いても生き残るからです。

議論の基礎 — 用語と単位の整理

本論に入る前に、この論争で繰り返し登場する用語と単位を整理しておきます。数字の戦いでは単位の感覚が半分を占めます。

用語	意味	感覚をつかむ基準
GW(ギガワット)	電力の単位。データセンターの規模を電力需要で表現	1GWは大型原発1基、約80万世帯分の電力
capex	資本的支出。データセンターやGPUなど資産の購入費用	ビッグテック4社の年間AI capex合計は数千億ドル規模
run rate	直近の売上を年換算した数値	成長期企業の広報でよく使われ、過大評価リスクあり
減価償却	資産の費用を耐用年数にわたって配分して費用化	GPUは通常3-5年、耐用年数の仮定を延ばすと利益が膨らむ
トークン	LLM処理量の単位	英語1単語が約1.3トークン、この記事全体で約1万トークン
推論(inference)	学習ではなくサービス提供段階の演算	2026年現在、コストの重心が学習から推論へ移動

特に減価償却の仮定は、この論争の隠れた火薬庫です。GPUの耐用年数を4年とするか6年とするかで、ハイパースケーラーの年間利益は数百億ドル単位で変わり、実際にいくつかの会社は最近、耐用年数の仮定を延ばす会計変更を行いました。懐疑論者はこれを利益防衛のための粉飾に近いと見なし、擁護者はソフトウェア最適化で旧型チップの実効寿命が延びたと反論します。

減速論の核心主張 — 算数が合わない

まず減速論、すなわち懐疑論陣営の主張を整理します。核心は三つの数字です。

数字1: 190GWのデータセンター

2026年までに発表された主要AIデータセンター計画を合算すると190GW規模になるという集計が、懐疑論の出発点です。感覚をつかむために比較すると、1GWは大型原子力発電所1基の出力で、韓国全体の平均電力需要がおよそ70-80GW水準です。つまり発表された計画だけで、韓国二つ分を追加で動かす電力がAIコンピューティングに投入されるという話です。

データセンターの建設費用は電力1GWあたりおよそ350億ドルから500億ドルと推算されます(敷地、建物、冷却、そして費用の大部分を占めるGPUを含む)。保守的に1GWあたり400億ドルを適用すると、190GWは約7兆6千億ドルの累積投資を意味します。もちろんこの計画がすべて実現するわけではありませんが、半分だけ実現しても4兆ドルに達する資本が、一つの技術に賭けられることになります。

数字2: 年間2兆ドルの売上要求

投資が正当化されるには売上がついてこなければなりません。懐疑論者の計算構造はおおよそ次のとおりです。

必要売上の逆算(懐疑論陣営のロジック)

  累積capex(2026-2030推定)             約3兆~4兆ドル
  GPU減価償却サイクル                    3~5年
  -> 年間費用化されるインフラコスト      約8千億ドル前後
  + 電力/運営/人件費                     数千億ドル
  + 投資家が要求する利益率               ソフトウェア産業基準のマージン
  ─────────────────────────────────────
  => 2030年頃に必要なAI関連の年間売上    約2兆ドル

  参考: 2025年のAI産業全体の推定売上は
  多く見積もっても数千億ドル水準(必要額の10~20%)

比較のために言うと、年間2兆ドルは2025年基準の全世界スマートフォン市場全体(約5千億ドル)の4倍、グローバルクラウド市場全体(約9千億ドル)の2倍を超える規模です。5年以内にクラウド産業を二つ新しく作らなければならないという計算です。

数字3: 成長率の変曲

懐疑論の三つ目の根拠は、需要側指標の鈍化シグナルです。チャットボット類の消費者向けサービスのトラフィック成長が停滞区間に入ったという分析、企業のPoCの相当数が本導入に転換できていないという調査、そしてモデル世代間の体感性能向上幅が縮小し、アップグレードの動機が弱まったという観察が束ねられています。

要約すると減速論のロジックはこうです。供給(インフラ)は幾何級数的に増えているのに、需要(売上)の成長曲線がその速度についていけておらず、その間隙は結局、誰かの損失で埋められるしかない。

トークン経済学 — 単価下落は祝福か呪いか

この論争を正しく理解するには、トークン単価の動きを見る必要があります。AIインフラの売上は結局、トークン販売(API)またはトークンが支える月額課金で発生するからです。

過去数年間、同等性能基準のトークン単価は恐ろしい速度で下がってきました。

同等の知能基準、100万トークンあたり価格の推移(概念図)

価格
(対数スケール)
  100 |  *
      |    *
   10 |      *
      |        *
    1 |          *
      |            *
  0.1 |              *  <- 2026: 2023年比で100倍以上下落した区間も存在
      +---------------------------------->
       2023   2024   2025   2026

年10倍前後の単価下落が数年間継続

この下落が産業に与える効果は両義的です。

観点	単価下落の意味
需要側(ポジティブ)	昨日は採算が合わなかったユースケースが今日は黒字に。需要の価格弾力性が大きければ総売上はむしろ増加
供給側(ネガティブ)	同じGPUで作ったトークンの売上価値が毎年急減。高く買ったハードウェアの回収期間が延び続ける
マージン構造	フロンティアモデルはプレミアム維持、一世代前のモデルは即座にコモディティ化。マージンは最新モデル発表直後だけ厚く、急速に薄くなる

推論1回の原価構造

マージン論争を理解するには、トークンの一束が売れるときの原価構成を見る必要があります。公開された推定値を総合した概念図です。

APIトークン売上100単位あたりの原価分解(概念図、推定の総合)

  売上 100
   ├─ GPU減価償却          35~50   <- 最大の項目、耐用年数の仮定に敏感
   ├─ 電力                 10~15
   ├─ データセンター運営    5~10
   ├─ ネットワーク/ストレージ 3~5
   ├─ 研究開発の配賦       10~20   <- 次期モデル学習費用の配賦
   └─ マージン              ?      <- 仮定次第で黒字にも赤字にもなる

  注: 学習(training)費用をどこまで推論原価に配賦するかが
      黒字/赤字論争の核心的な分岐点

楽観論者は、限界原価(すでに買ったGPUでトークンを追加生産する費用)だけを見れば推論はすでに黒字だと言います。懐疑論者は、次期モデルの学習費用とGPUの再購入費用まで配賦すれば産業全体が赤字だと言います。どちらも正しく、ただ会計の境界線をどこに引くかの違いです。この境界線の問題は、上場が進んで監査済みの財務諸表が出てきた瞬間にかなりの部分が整理されるはずで、これが2026年のIPOの流れが論争の分水嶺であるもう一つの理由です。

核心的な争点は、ジェボンズのパラドックスが成立するかです。単価が10分の1になるとき使用量が10倍以上増えれば、売上は成長します。実際に2024-2025年にはこのパターンがおおむね成立しました。問題はこれが無限に繰り返せるのかであり、まさにこの地点で楽観論と悲観論が分かれます。

反論 — 減速ではなく転換だ

次に反対陣営、すなわち成長持続論の論拠を見ます。こちらの主張も数字に基づいています。

反論1: 推論需要の構造的爆発

消費者向けチャットボットのトラフィックは停滞かもしれないが、機械が生み出す需要は爆発している、というのが第一の反論です。2026年の支配的なワークロードは、人間がチャット欄に入力する質問ではなく、エージェントが自律的に遂行する長時間タスクです。

人間の質問1件: 数千トークン
エージェントのコーディングタスク1件: 数十万から数百万トークン(計画、ツール呼び出し、自己検証ループを含む)
推論(reasoning)モデルの思考トークン: 出力1件あたり内部的に数万トークンを追加消費

Claude CodeやCodex類のエージェントが数時間規模のタスクを遂行するのが普遍化したことで、ユーザー1人あたりのトークン消費量はチャット時代の数十から数百倍に跳ね上がりました。トラフィック成長の停滞とトークン需要の爆発が同時に真でありうる理由です。

反論2: 売上の実体化

売上が幻想だという主張に対しては、実際の数字が急速に積み上がっているという反駁があります。主要モデルプロバイダーの年換算売上(run rate)は2024年以降、毎年数倍ずつ成長してきており、コーディングエージェントと企業向けAPIがその成長の中心にあります。特に開発ツール市場では、AI支出はすでに代替ではなく必須予算項目として定着しました。

反論3: IPOの流れと資本市場の検証

2026年の新しい変数は公開市場です。AnthropicのS-1提出説が報道され、The EconomistがAnthropic、SpaceX、OpenAIという三つの超大型上場候補を株式市場が消化できるかを分析する段階に来たということ自体が、この産業が私募市場のストーリーテリング段階を過ぎ、公開市場の四半期実績検証の段階へ移行しているというシグナルです。

楽観論はこれを成熟の証拠と読みます。上場は財務諸表の公開を意味し、公開された数字が悪ければそもそも上場を試みることはできないからです。一方、懐疑論は同じ事実を、最も高い時点で持ち分を渡そうとする出口戦略と読みます。同一の出来事に正反対の解釈が共存するのが、2026年の風景です。

インフラのロックインと減価償却 — 時間が敵になる構造

この論争で技術的に最も興味深い部分は、減価償却の経済学です。

GPUは不動産ではありません。データセンターの建物は20-30年使えますが、その中のGPUは3-5年で経済的寿命を迎えます。次世代チップが出ると同じ電力で数倍の演算を提供するため、旧型チップは電気代すら正当化しにくくなる時点が来ます。

AIデータセンター資産の寿命ミスマッチ問題

  資産項目              比重(概算)   経済的寿命     リスク
  ─────────────────────────────────────────────────────
  GPU/アクセラレータ    60-70%      3-5年          非常に高い
  電力/冷却設備         15-20%      10-15年        中
  建物/敷地             10-15%      20-30年        低い
  ネットワーキング      5-10%       5-7年          中

  => 投資の3分の2が5年以内に再投資を要求する
  => 売上が5年以内についてこなければ算数が崩れる構造

ここにロックインの問題が重なります。大手AI企業は特定のクラウド、特定のチップベンダー、特定の電力契約に数年単位で縛られる契約を結んできました。需要が予想を下回るとき、これらの契約は固定費となって損益を圧迫します。逆に需要が予想を上回れば、契約で容量を押さえた側が勝者になります。つまり現在結ばれている長期契約は、産業全体が需要予測に賭けた巨大なレバレッジベットです。

循環取引の議論も押さえておくべきです。チップベンダーがAI企業に投資し、AI企業がその資金でチップを買い、チップベンダーの売上が再びバリュエーションを押し上げる構造は、懐疑論者が最も頻繁に指摘する脆弱地点です。売上の相当部分がエコシステム内部の資本循環なら、外部需要の実体は帳簿より小さい可能性があります。

電力という物理的制約

減価償却が時間の制約だとすれば、電力は物理の制約です。190GWという計画は資本だけでは実現しません。

送電網のボトルネック: データセンター用地に電力を引き込む送電網の増設は、許認可と建設に5-10年かかる領域です。資本は速く、電力網は遅い。
原子力への回帰: ハイパースケーラーが原発再稼働契約とSMR(小型モジュール炉)投資に乗り出したのは、このボトルネックの直接的な証拠です。ただしSMRの商業稼働は早くても2030年代初頭です。
地域の摩擦: データセンター密集地域では、電気料金の上昇と水使用をめぐる住民との摩擦が政治問題となり、許認可リスクとしてフィードバックされています。

逆説的に、電力ボトルネックは減速論と成長論の双方で異なって解釈されます。減速論にとっては計画物量が実現不可能だという証拠であり、成長論にとっては供給が制約されているので既存容量の価値が維持されるという論拠です。同じ事実が両側の弾薬になる、この論争の典型的なパターンです。

ドットコムバブルとの比較 — 同じ点と違う点

バブル論争で欠かせないのが、2000年のドットコム崩壊との比較です。公平に両方を表で整理します。

比較項目	ドットコムバブル(1999-2001)	AI投資ブーム(2023-2026)
核心インフラ	光ファイバー、通信網	GPUデータセンター、電力
インフラの寿命	数十年(光ファイバーは今も使用中)	核心資産は3-5年(GPU)
売上の実体	大部分が赤字、売上が微小な企業多数	先頭企業は巨額の実売上を保有
資金の出所	IPO公募資金、個人投資家の比重大	ビッグテックの営業キャッシュフロー + 私募資本中心
崩壊時の衝撃経路	株式市場から個人へ直接	ビッグテックの損益と私募ファンドを経て間接的
過剰投資の遺産	安くなった通信網がWeb 2.0の土台に	安くなったコンピューティングが何の土台になるかは未知数
技術の実用性	実在したが10年早く価格付けされた	実在し、すでに大規模に使用中

二つの違いが特に重要です。

第一に、売上の実体です。ドットコム期の多くの企業は売上自体がありませんでしたが、2026年の先頭AI企業は実際に巨大な売上を生み出しています。問題は売上の存在ではなく、売上の成長速度が投資速度に追いつくかです。

第二に、インフラの寿命です。ドットコム崩壊後、光ファイバーは二束三文で放出され、その後20年のインターネット成長の土台になりました。しかしGPUは5年で旧型になるため、過剰投資が未来の世代に残す遺産はドットコムのときよりはるかに小さい可能性があります。バブルが弾けても残るものが違うという意味で、これは楽観論の定番論拠である「バブルも遺産を残す」を弱める地点です。

開発者と企業のための実用的な示唆

マクロ論争の結論を待つ必要はありません。どのシナリオが来ても有効な行動があるからです。

戦略1: マルチベンダーアーキテクチャ

特定のモデルベンダーにハードコードされたシステムは、値上げ、サービス変更、最悪の場合ベンダーの消滅に無防備です。抽象化レイヤーを一枚挟むのが基本の防御です。

# モデルベンダー抽象化レイヤーの最小骨格
from dataclasses import dataclass

@dataclass
class LLMResponse:
    text: str
    input_tokens: int
    output_tokens: int
    cost_usd: float

class LLMProvider:
    def complete(self, prompt: str, max_tokens: int) -> LLMResponse:
        raise NotImplementedError

class AnthropicProvider(LLMProvider):
    def complete(self, prompt: str, max_tokens: int) -> LLMResponse:
        ...  # Anthropic API呼び出し

class OpenAIProvider(LLMProvider):
    def complete(self, prompt: str, max_tokens: int) -> LLMResponse:
        ...  # OpenAI API呼び出し

class FallbackRouter(LLMProvider):
    """一次ベンダーの障害/上限超過時に二次ベンダーへ自動切替"""
    def __init__(self, primary: LLMProvider, secondary: LLMProvider):
        self.primary, self.secondary = primary, secondary

    def complete(self, prompt: str, max_tokens: int) -> LLMResponse:
        try:
            return self.primary.complete(prompt, max_tokens)
        except (RateLimitError, ProviderOutageError):
            return self.secondary.complete(prompt, max_tokens)

核心は、コードベース全体でベンダーSDKを直接importする箇所を一か所に集めることです。切り替えコストが1日の組織と1四半期の組織では、価格交渉力そのものが違います。

戦略2: コスト構造の可視化と最適化

AIコストが大きくなるほど、トークンをクラウドコストのように管理する必要があります。優先順位の高いものから並べます。

モデルルーティング: すべてのリクエストをフロンティアモデルに送るのは、すべての宅配便を飛行機で送るようなものです。分類や抽出のような単純タスクは小型モデルにルーティングします。実務で最も効果の大きい単一施策で、通常はコストの半分以上がここで減ります。
プロンプトキャッシング: システムプロンプトと繰り返しのコンテキストにキャッシングを適用すると、該当区間の入力コストが大きく下がります。同じコンテキストを繰り返し参照するエージェントワークロードで特に効果的です。
バッチ処理: リアルタイム性が不要なタスク(夜間分析、大量分類)はバッチAPIに送ると一般的に半額です。
出力長の統制: コストの多数が出力トークンで発生するワークロードなら、レスポンス形式をJSONスキーマで強制するだけでコストが減ります。

# モデルルーティングの最小例
def route_request(task_type: str, complexity_score: float) -> str:
    if task_type in ("classify", "extract", "summarize_short"):
        return "small-fast-model"
    if complexity_score < 0.3:
        return "small-fast-model"
    if task_type == "agentic_coding":
        return "frontier-model"
    return "mid-tier-model"

コスト可視化の出発点は計測です。最小限のトークン会計コードをミドルウェアとして敷いておくことをお勧めします。

# トークンコスト会計ミドルウェアの最小骨格
import time
from collections import defaultdict

PRICE_TABLE = {
    # (モデル, トークン種別) -> 100万トークンあたりドル
    ("frontier-model", "input"): 3.00,
    ("frontier-model", "output"): 15.00,
    ("small-fast-model", "input"): 0.10,
    ("small-fast-model", "output"): 0.40,
}

usage_by_feature = defaultdict(float)

def track_llm_call(feature: str, model: str, resp) -> None:
    cost = (
        resp.input_tokens / 1e6 * PRICE_TABLE[(model, "input")]
        + resp.output_tokens / 1e6 * PRICE_TABLE[(model, "output")]
    )
    usage_by_feature[feature] += cost
    metrics.emit("llm_cost_usd", cost, tags={"feature": feature, "model": model})

機能(feature)タグが核心です。請求総額しか見ない組織はコスト急増の原因を探すのに数日かかりますが、機能別タグ付けのある組織はダッシュボードで即座に見えます。クラウドコスト管理で学んだ教訓がそのまま適用される領域です。

戦略3: 価格変動に対するシナリオプランニング

企業のAI予算担当者なら、次の三つの価格シナリオすべてに耐える設計が必要です。

価格急落の継続: 競争激化で単価が下がり続ける場合。ロックインのない構造が利益を即座に吸収します。
価格正常化(値上げ): 補助金的な現行価格が資本コストを反映して上がる場合。懐疑論が正しければ最も有力な経路です。モデルルーティングとキャッシングを事前に備えた組織だけが衝撃を吸収します。
ベンダーの統廃合: 一部ベンダーの退出または買収合併。マルチベンダー抽象化が保険になります。

シナリオ分析 — 三つの未来

マクロ展望を三つのシナリオに整理します。確率は提示しません。正直に言って、誰にも分からないからです。

項目	シナリオA: 軟着陸	シナリオB: 調整	シナリオC: 成長持続
展開	投資の増加率が緩やかに鈍化、需要がゆっくり追いつく	一部大型プロジェクト中止、私募バリュエーション急落、連鎖リストラ	エージェント需要がインフラを消費し続け、供給不足が持続
トークン価格	緩やかな下落が継続	短期的な値上げ後、供給過剰で暴落	プレミアムモデルの価格維持、普及型は急落
開発者の雇用	AI職種中心の緩やかな成長	インフラ/プラットフォーム職種に短期ショック	全職種で需要の強さが持続
スタートアップ環境	選別的な投資	資金収縮、ただしコンピューティングが格安になる機会	豊富な資本が継続
歴史的な類似例	2000年代半ばのクラウド初期	2000年ドットコム、2008年金融	1990年代後半のインターネット普及期

注目すべきは、シナリオB(調整)にも両面があることです。ドットコム崩壊直後がGoogleとAmazonにとって最高の成長環境だったように、AIインフラの投げ売りが起きれば、コンピューティングを格安で確保する側には歴史的なチャンスになります。調整シナリオへの備えは防御だけでなく、攻撃計画でもあります。

何を見ればいいのか — 観測指標チェックリスト

論争の勝敗を事前に知ることはできませんが、どちらに傾きつつあるかを追跡できる先行指標はあります。四半期に一度、次の項目を点検することをお勧めします。

AIマクロ健全性チェックリスト(四半期点検用)

[需要シグナル]
- 主要モデルプロバイダーの年換算売上の成長率が前四半期比で維持されているか
- エージェント/API使用量の指標(各社発表、サードパーティ推定)の趨勢
- 企業導入調査でのPoC -> プロダクション転換率の方向

[供給/投資シグナル]
- ビッグテックの四半期決算でcapexガイダンスの上方/下方修正の有無
- データセンタープロジェクトの着工延期/中止ニュースの頻度
- GPUレンタル市場(仲介プラットフォーム)の時間あたり価格の推移

[資本市場シグナル]
- AI企業のIPOの成立有無と上場後の株価維持力
- 私募市場でのダウンラウンドの頻度
- チップベンダーとAI企業の循環取引構造に関する会計問題の報道

[価格シグナル]
- フロンティアモデルAPI価格の方向(値下げ継続 vs 値上げ転換)
- 無料ティアの縮小、使用量制限の強化といった補助金縮小の動き

特に最後の価格シグナルが重要です。補助金的な価格が値上げに転じる瞬間こそ、需要の本当の価格弾力性が検証される瞬間だからです。

よくある質問

Q. 結局バブルなんですか、違うんですか?

この記事の立場は、技術の実在と投資の過剰は同時に真でありうる、というものです。鉄道バブルのとき鉄道は本物で、ドットコムバブルのときインターネットも本物でした。バブルかどうかより重要な問いは、調整が来たとき自分のポジションが耐えられるかです。

Q. 個人開発者もこの論争を気にすべきですか?

直接的には二つの経路で影響を受けます。第一に、API価格政策の変化はサイドプロジェクトとスタートアップの原価構造を変えます。第二に、調整シナリオではAIインフラ関連の雇用が先に揺れます。マルチベンダー対応力とコスト最適化の経験は、どの場合でも履歴書で価値が上がる項目です。

Q. 2兆ドルという数字は信頼できますか?

区間推定として受け取るのが正確です。減価償却サイクルを5年から6年に、実現capexを80パーセントから50パーセントに変えれば、必要売上は1兆ドル以下にも下がります。逆に仮定を締めれば3兆ドルを超えもします。核心は正確な数字ではなく、どんな仮定を使っても現在の売上との間に一桁倍率以上の間隙が存在するという事実です。

Q. 今AI関連職に移るのは危険ですか?

シナリオB(調整)が来ても生き残る職務とそうでない職務を区別するのが、より正確な問いです。トークンを消費する側(AI応用、エージェント運用、コスト最適化)は、調整期にむしろ需要が増えた前例が多くあります。トークンを供給する側(インフラ新設、モデル学習)はcapexサイクルに直接さらされます。

批判的視点 — 両陣営の弱点

バランスのために、両側のロジックの弱点をそれぞれ指摘します。

減速論の弱点は次のとおりです。

需要計測のタイムラグ。エージェント型ワークロードの爆発は直近1年の現象なので、停滞を示す統計の多くがチャットボット時代の指標を計測している可能性があります。
年間2兆ドル計算の仮定依存性。必要売上の推定は、減価償却サイクル、実現するcapexの比率、要求マージンの仮定によって半分以下にも、2倍にも動きます。精密な数字に見えますが、実際は広い区間推定です。
コンテンツのインセンティブ。バブル崩壊予測は、外れれば忘れられ、当たれば英雄になる非対称ゲームなので、発信者に誇張の誘因があります。

成長論の弱点も軽くありません。

需要の質の問題。トークン消費量爆発の相当部分が、エージェントの試行錯誤ループから来ています。効率化が進めば同じタスクのトークン消費が急減する可能性があり、その場合、需要曲線が折れます。
支払い意思の検証不足。現在の価格は競争補助金が混ざった価格なので、資本コストを完全に反映した価格でも需要が維持されるかは検証されていません。
循環取引への依存。エコシステム内部の資本循環を除いた純粋な外部需要の規模は、公開された数字からは確認しにくいのが実情です。

おわりに — バランスの取れた結論

論争を整理するとこうなります。

確実なこと: AIインフラ投資は歴史上類例のない規模であり、現在の売上だけではその投資を正当化できず、したがってこの賭けは未来の需要の爆発的成長への賭けです。また、トークン需要自体はエージェント時代に入って実際に爆発しています。

不確実なこと: その需要の成長が減価償却の時計が回り切る前に投資に追いつけるのか、そして補助金なしの価格でも需要が維持されるのかです。

個人的な読み方はこうです。技術の実在性と投資の過剰性は同時に真でありえます。鉄道も通信網も、実在する技術の上に過剰投資が積み上がり、調整を経た後にようやく本当の成長が来ました。AIが同じ経路をたどるなら、問いはバブルか否かではなく、調整がいつどんな形で来て、そのとき自分はどの場所にいるのか、になります。

開発者にとって幸いな結論が一つあります。上の三つのシナリオのどれが来ても、マルチベンダーアーキテクチャとコスト最適化の能力、そしてAIの成果物を検証する能力の価値は下がりません。マクロはコントロールできませんが、ポジションはコントロールできます。

参考資料

AI is slowing down(Ed Zitron, Where Is Your Ed At): https://www.wheresyoured.at/ai-is-slowing-down/
GeekNewsの議論: https://news.hada.io/topic?id=30314
The Economist — Can the stockmarket swallow Anthropic, SpaceX and OpenAI: https://www.economist.com/finance-and-economics/2026/06/01/can-the-stockmarket-swallow-anthropic-spacex-and-openai
Hacker News: https://news.ycombinator.com/
Epoch AI — AI演算とコスト趨勢データ: https://epoch.ai/
IEA — データセンターと電力需要レポート: https://www.iea.org/reports/electricity-2026
Anthropic公式サイト: https://www.anthropic.com/
OpenAI公式サイト: https://openai.com/
NVIDIA四半期決算(データセンター売上): https://investor.nvidia.com/
US SEC EDGAR(S-1提出の開示検索): https://www.sec.gov/cgi-bin/browse-edgar?action=getcompany
Sequoia Capital — AIの6000億ドルの問い(先行論争): https://www.sequoiacap.com/article/ais-600b-question/