💡 왼쪽 원문을 읽으면서 오른쪽에 따라 써보세요. Tab 키로 힌트를 받을 수 있습니다.

원문 렌더가 준비되기 전까지 텍스트 가이드로 표시합니다.

> "金融データは最も豊富なドメインデータだが、最も高価で最もノイズが多い。ドメイン特化 LLM はもはや選択肢ではなくインフラだ。" — Gilberto Titericz, ex-Bloomberg AI

金融(Finance)は 2026 年現在、ヘルスケアと並んで LLM のドメイン適応が最も速く進んだ領域です。2023 年 3 月に Bloomberg が独自の 50B パラメータモデル **BloombergGPT** を公開して以降、「汎用 LLM では金融専門用語は扱えない」が業界コンセンサスとなり、JPMorgan, Goldman Sachs, Morgan Stanley, BlackRock, Bridgewater, AlphaSense, Tegus, Daloopa などが次々に独自モデル・プラットフォームを公開してきました。

本記事では 2026 年 5 月時点の金融 AI エコシステム — **金融特化 LLM、リサーチ AI、ヘッジファンド AI、資産運用 AI、銀行/保険 AI、韓国・日本の金融 AI** — を一気に整理します。単なる製品カタログではなく、「どのデータで学習し、どのワークフローを置き換え、どんな限界があるか」に焦点を絞ります。

1. 2026 年の金融 AI マップ — Domain LLM / Research / Quant / Risk

金融 AI は役割によって五つの大きな箱に分けられます。

| カテゴリ | 代表製品 | コアデータ |

|---|---|---|

| Domain LLM | BloombergGPT, FinGPT, FinRobot, InvestLM, DocLLM | ニュース、SEC filings、トランスクリプト |

| Research AI | AlphaSense, Tegus, Daloopa, Hebbia, Brevit | エキスパートコール、ブローカーレポート、公示 |

| Quant / ヘッジファンド | Renaissance, Two Sigma, Numerai, WorldQuant, Bridgewater | 価格、ファンダメンタル、オルタナティブデータ |

| 資産運用 / 銀行 | BlackRock Aladdin, JPMorgan LLM Suite, Goldman GS-AI, Morgan Stanley AskRes | ポートフォリオ、市場、顧客 |

| Risk / Credit / Insurance | Zest AI, Upstart, Lemonade, Tractable, Featurespace | 信用、保険金請求、取引 |

五つのカテゴリはデータソースと利用者がまったく異なります。**Domain LLM** はインフラレイヤーで、他のカテゴリがその上にビルドします。**Research AI** はアナリストの情報収集を自動化し、**Quant** はアルファ(Alpha)生成に集中します。**資産運用 / 銀行** は運用効率とアドバイザー生産性を、**Risk / Credit / Insurance** は自動化された意思決定を扱います。

各カテゴリはデータアクセス性によって参入障壁が異なります。Bloomberg と Refinitiv のようなデータベンダーが Domain LLM のコア資産を握っており、その上に OpenAI・Anthropic・Cohere のような汎用 LLM が RAG(Retrieval-Augmented Generation)で補完する構図が 2026 年現在の均衡です。

2. BloombergGPT — 金融ドメイン LLM の原型

**BloombergGPT** は 2023 年 3 月に Bloomberg AI チームが公開した 50B(500 億)パラメータモデルで、「金融ドメインデータで学習した最初の大規模 LLM」というタイトルを持ちます。学習データは約 7,000 億トークン — そのうち半分(3,630 億トークン)が **FinPile**、Bloomberg が 40 年間蓄積した自社金融データ(ニュース、filings、トランスクリプト、市場データ)で、残りが公開コーパス(C4, Pile, Wikipedia)です。

論文(arXiv 2303.17564)で公開されたベンチマークでは、BloombergGPT は同じ 50B 規模の BLOOM-176B, OPT-66B を金融専用タスク(FPB, FiQA SA, Headline, NER)で大幅に上回り、汎用タスクでも損なわれませんでした。コアな知見は「ドメインデータ 50% + 一般データ 50%」が catastrophic forgetting を避けながらドメイン適応を最大化する黄金比であるという点です。

BloombergGPT 自体は公開されていませんが、Bloomberg Terminal に統合された **AI Assist**、**Document Search**、**Earnings Call Summarization** といった機能を通じて 30 万人以上の Terminal ユーザーが毎日使用しています。2024 年に出た **Bloomberg BQuant + AI** は、BloombergGPT を quant ワークフローに統合し、自然言語でバックテストを記述すると Python コードを生成します。

BloombergGPT の最大の限界は **クローズドネス**です。学術研究以外では一般開発者がアクセスできず、重みも公開されていません。この空白を埋めるべく登場したのがオープンソース陣営の FinGPT, FinRobot, InvestLM シリーズです。

3. FinGPT / FinRobot — オープンソース金融 LLM

**FinGPT** (`github.com/AI4Finance-Foundation/FinGPT`) は 2023 年 6 月にコロンビア大学の AI4Finance Foundation が始めたオープンソースプロジェクトです。コア哲学は「BloombergGPT のように一から事前学習するよりも、Llama のようなベースモデルの上に金融データで LoRA ファインチューニングする方がはるかにコスト効率がいい」というものです。

FinGPT は次のデータパイプラインを標準化しました。

FinGPT データパイプラインの例

from fingpt.data import (

YahooFinance,

SECFilings,

NewsAPI,

TwitterCrypto,

AnalystReports,

)

1) データ収集 — 多様なソースを統合

pipeline = (

YahooFinance(symbols=['AAPL', 'MSFT'], period='5y')

+ SECFilings(forms=['10-K', '10-Q', '8-K'], year_from=2020)

+ NewsAPI(topics=['earnings', 'M&A'], days=30)

+ AnalystReports(sources=['JPM', 'GS', 'MS'])

)

2) センチメント / イベントラベリング

labeled = pipeline.label(

sentiment_model='FinBERT',

event_extractor='FinGPT-Event-v3',

)

3) LoRA ファインチューニング — Llama-3-8B をベースに

from fingpt.train import LoRAFinetuner

trainer = LoRAFinetuner(

base_model='meta-llama/Llama-3-8B-Instruct',

rank=16,

alpha=32,

target_modules=['q_proj', 'v_proj'],

)

trainer.fit(labeled, epochs=3, lr=2e-4)

FinGPT の上にビルドされた **FinRobot** (`github.com/AI4Finance-Foundation/FinRobot`) は 2024 年に出たエージェントフレームワークです。単一モデルではなく、「Market Forecaster, Document Analyzer, Trading Strategist, Risk Analyst, Customer Service Agent」のような役割別エージェントを LangGraph スタイルでオーケストレーションします。2025 年には **FinRobot Industry Chain Analysis** ワークフローが出て、「NVIDIA のサプライチェーンに属する日本上場企業を見つけて分析」のような複合クエリを自動分解・実行します。

似たオープンソースプロジェクトに **InvestLM** (NYU Stern, 13B/65B の二サイズ), **PIXIU** (FinMA ベース、100+ 金融タスクの instruction-tuned), **FinMA** (PIXIU の一部、Llama-30B ベース), **FinTral** (Mistral ベースのマルチモーダル、チャートと表を処理) があります。すべて Hugging Face で重みをダウンロードして自前ホスティングできます。

4. DocLLM (JPMorgan) — 金融文書特化 LLM

**DocLLM** は 2024 年 1 月に JPMorgan AI Research チームが公開した文書理解特化 LLM です(arXiv 2401.00908)。コアは「10-K, 10-Q, prospectus, term sheet といった金融文書はテキストだけでなくレイアウト(表、位置、フォント)が意味を持つ」という観察から始まります。

既存のマルチモーダルモデル(GPT-4V, LayoutLM)がピクセル画像を入力として受け取るのと違い、DocLLM は **OCR で抽出したテキスト + bounding-box 座標**だけで学習します。画像エンコーダーがないためはるかに軽量でありつつ、表/様式の多い金融文書では GPT-4V を上回る性能を発揮します。

JPMorgan は DocLLM を自社 LLM Suite の中核コンポーネントに統合し、信用アナリストが prospectus を手動で読んでいた 4 時間の作業を 20 分に短縮したと 2024 Q3 アーニングコールで明かしました。重みは公開されていませんが、論文が非常に詳細でオープンソース再実装(`unilm/docllm`)が活発です。

DocLLM と類似する文書特化モデルに **FinMA-Document**, **AlphaSense Smart Synonym**, **Hebbia Matrix** などがあります。いずれも「表・脚注・ページ横断推論」がコア能力です。

5. Bloomberg Terminal + BQuant + AI — 統合環境

**Bloomberg Terminal** は 1981 年のリリース以来 45 年間、金融プロフェッショナルの標準ワークステーションです。2025 年時点で約 35 万人のユーザー、年間ライセンスは約 27,000 USD 水準で、売上は約 130 億 USD と推定されます。

2024 年に Terminal に統合された **AI Assist** は BloombergGPT ベースで以下を自動化します。

- **News Summary**: 特定の銘柄/セクターの直近 24 時間のニュースを要約し、市場影響を推定

- **Earnings Call Q\&A Extraction**: コールトランスクリプトからアナリストの質問と経営陣の回答を構造化

- **Document Search**: 自然言語で「Apple's gross margin trajectory over last 8 quarters」のようなクエリ → 関連する filing ページを自動抽出

- **Code Generation**: BQuant 内で自然言語 → Python/BQL コード変換

**BQuant** は Bloomberg が 2018 年にリリースした Jupyter ベースの quant ワークベンチです。2025 年に出た **BQuant 3.0** は LLM コード生成を一級機能として統合し、「S\&P 500 セクター別 1 年リターンの棒グラフ」と入力するとコード + チャート + 解説を自動生成します。

BQuant 自然言語 → コード例

入力: "S&P 500 セクター別 1 年リターンの棒グラフ"

自動生成コード (BQL = Bloomberg Query Language):

bq = bql.Service()

universe = bq.univ.members('SPX Index')

returns = bq.data.px_last(dates=bq.func.range('-1Y', '0D'))

sectors = bq.data.gics_sector_name()

req = bql.Request(universe, {

'sector': sectors,

'return': (returns.last() / returns.first() - 1) * 100,

})

df = bq.execute(req).single().df()

df.groupby('sector')['return'].mean().plot.bar()

Bloomberg の競合 **Refinitiv Eikon**(LSEG 買収後 **Workspace** にリブランド)は 2024 年に独自の LLM **Workspace AI** をリリースしましたが、データ深度と統合度で Bloomberg に追いついていないとの見方が一般的です。**FactSet** は 2025 年に OpenAI とパートナーシップを結び、GPT-4 ベースの Search/Q\&A を、**S\&P Capital IQ** は独自の ChatIQ を、**PitchBook** は PE/VC データを自然言語でクエリする PitchBook AI をリリースしました。

6. AlphaSense — エンタープライズリサーチ検索

**AlphaSense** (`alpha-sense.com`) は 2008 年創業の金融リサーチ検索プラットフォームで、2024 年 4 月にシリーズ F で 4 億 USD を集め、企業価値約 40 億 USD と評価されました。Wall Street のほぼすべてのメガバンクと Fortune 500 の半数以上が利用しています。

コア価値は「必要な情報がどこにあるかは知っているが、それを見つけるのに時間を全部使う」アナリストの課題を解決することです。データソースは次のとおりです。

- **公示 (SEC, グローバル)**: 10-K, 10-Q, 8-K, 20-F, S-1 などを 100% インデックス

- **ブローカーレポート**: JPM, GS, MS, BofA, Citi など 1,000+ 機関のレポート(ライセンスベース)

- **ニュース**: Reuters, Dow Jones, Bloomberg など 5,000+ ソース

- **カンファレンスコール / トランスクリプト**: リアルタイムトランスクライブ + 検索

- **エキスパートコール (Tegus 買収後)**: 50,000+ のエキスパートインタビュー

2023 年にリリースされた **AlphaSense Smart Synonyms** は、「EV/EBITDA」のような略語と「enterprise value to EBITDA」が同じ概念であることを LLM が自動マッピングします。2024 年にリリースされた **Generative Search** は自然言語クエリに対して出典引用付きで要約を生成し、すべての引用が原文ページへクリックできます。

クエリ: "AMD のデータセンター売上成長は NVIDIA に比べてどう違うか、2024 年 Q4 時点"

回答:

AMD のデータセンター売上は Q4 2024 に 38 億 USD で前年同期比 +69 パーセント [1]。

NVIDIA のデータセンター売上は同四半期に 184 億 USD で +93 パーセント [2]。

主な違いは (a) AI アクセラレータシェア — AMD MI300X は約 5 パーセント、NVIDIA

H100/H200 は 88 パーセント、(b) ソフトウェアスタック — CUDA ロックイン、

[1] AMD Q4 2024 10-Q, page 14

[2] NVIDIA Q4 FY25 10-Q, page 11

[3] Morgan Stanley "AI Semis", 2025-02-15

[4] JPM "AI Datacenter Outlook", 2025-03-10

AlphaSense の価格は公開されていませんが、エンタープライズシートあたり年間 1 万~2 万 USD 水準と言われます。個人アナリストがアクセスするのは難しく、主な顧客はヘッジファンド・銀行・資産運用会社です。

7. Tegus — エキスパートコール一次リサーチ

**Tegus** は 2017 年にシカゴで創業したエキスパートコールプラットフォームで、2024 年 6 月に AlphaSense に 9 億 3 千万 USD で買収され統合されました。コア資産は約 75,000 件のエキスパートコールトランスクリプトで、元幹部・顧客・サプライヤー・競合の幹部との 1 時間の 1:1 インタビューです。

Tegus の差別化点は **自分でホストするコールは通常 30 分で 1,000~2,000 USD かかるが、Tegus プラットフォームのすべてのコールに無制限アクセスが約 4 万 USD/年(小型ファンド基準)** という価格モデルです。ヘッジファンドの一次リサーチコストを大きく下げました。

2024 年にリリースされた **Tegus AI Notes** はトランスクリプトを自動要約し、同じ会社についての複数エキスパートの意見を比較分析します。AlphaSense 買収後の 2025 年には AlphaSense Generative Search に Tegus データが統合され、「AMD のデータセンターシェア」のようなクエリで SEC filing + アナリストレポート + エキスパートコールがすべて引用ソースとして使われます。

似たエキスパートネットワークに **GLG (Gerson Lehrman Group)**, **Third Bridge**, **Guidepoint** があり、いずれも独自の AI 検索ツールをリリースしましたが、Tegus ほどコールトランスクリプトを完全公開するモデルは稀です。

8. Daloopa — 金融データ抽出の自動化

**Daloopa** は 2019 年創業、2022 年シリーズ B のデータ抽出自動化会社です。問題意識はシンプルです — 「アナリストは時間の 40 パーセントを 10-K/10-Q から数字を Excel に移すことに使っている。」

Daloopa のワークフローはこうです。

1. 分析対象企業の SEC filing (10-K, 10-Q, 8-K, IR デック) を Daloopa が自動収集

2. 独自の OCR + LLM パイプラインが表・脚注・MD\&A を構造化データに抽出

3. Daloopa 内部のラベラー(約 200 人)がコアデータを人間検証

4. Excel/Google Sheets/Bloomberg Terminal API へ自動プッシュ

5. 新しい filing が出るたびに自動更新

2024 年時点で Daloopa は 8,000+ のグローバル上場企業の KPI を四半期ごとに追跡し、週に 300~500 件の新しい filing を処理します。ヘッジファンドとセルサイドのアナリストが主な顧客で、シートあたり年間約 1 万~2 万 USD です。

競合に **Calcbench**(SEC XBRL データに特化、より安価)、**Sentieo** (AlphaSense 買収)、**Visible Alpha**(コンセンサス推定値に特化)があります。

9. Hebbia — ドキュメント Q\&A プラットフォーム

**Hebbia** (`hebbia.com`) は 2020 年創業、2024 年 7 月にシリーズ B で 1 億 3 千万 USD を集め、企業価値 7 億 USD と評価されました。コア製品 **Matrix** は「数百ページのドキュメントの束から同時に答えを抽出する」マルチドキュメント Q\&A プラットフォームです。

Matrix のワークフローは行 = ドキュメント、列 = 質問のマトリックスを埋める形です。たとえば PE ファンドが潜在的買収対象 50 社の 100 ページの CIM(Confidential Information Memorandum)を受け取ったとき、「EBITDA、売上成長率、顧客集中度、負債比率、組合の有無」を一度に抽出するコマンドが可能です。

Matrix の出力例:

TargetA | 24M USD | +18% YoY | top 5 = 42% | 1.2x | No (cite p.34)

TargetB | 8M USD | +47% YoY | top 5 = 78% | 0.4x | Yes (cite p.21)

...

各セルは原文引用で追跡可能で、アナリストが検証できます。Hebbia の主な顧客は PE ファンド、ヘッジファンド、コンサルティングファーム(McKinsey, BCG, Bain)で、シートあたり年間 3 万~5 万 USD 水準のエンタープライズ価格です。

似たカテゴリに **Brevit**, **Casetext** (Thomson Reuters 買収、法律中心), **Eve** (法律), **Harvey** (Allen \& Overy などの法律事務所が採用) があります。

10. ヘッジファンド AI — Bridgewater · Renaissance · Two Sigma

**Bridgewater Associates** は 2024 年 12 月、David McCormick(前 CEO 候補)主導で **Artificial Intelligence Equity Fund (AIA Fund)** をローンチしました。約 20 億 USD 規模で開始、コア運用哲学は「AI がデータ・ニュース・マクロシグナルを統合して意思決定の一部を自動化する」というものです。完全ブラックボックスの quant ファンドではなく、ファンドマネージャーが AI のレコメンデーションをレビュー・反映する human-in-the-loop モデルです。

**Renaissance Technologies** の **Medallion Fund** は 1988 年のローンチ以来、平均年率約 39 パーセントの純利益率を記録した伝説的 quant ファンドです。Jim Simons 没後も運用中ですが、外部投資家には閉じており、従業員資産のみを運用します。ML の使用は 1990 年代からで、2026 年現在も最も洗練された quant システムと評価されますが、詳細は非公開です。

**Two Sigma** は 2001 年創業、AUM 約 600 億 USD 規模で、データサイエンティスト 1,500 人以上を雇用する ML-first ヘッジファンドです。2024 年にリリースされた **Venn** プラットフォームは外部資産運用会社が自社ポートフォリオのリスクを分析できるようにした SaaS で、内部では LLM ベースのニュース・シグナルパイプラインを運用します。

**D.E. Shaw**, **AQR**, **Citadel** もすべて quant + ML ファンドです。Citadel は 2024 年に OpenAI とエンタープライズ契約を結び、社内 R\&D に GPT-4o を使用していると発表しました。

**Numerai** は 2015 年創業のクラウドソース quant ファンドで、匿名化された市場データを公開し、世界中のデータサイエンティストがモデルを提出すると、結果をアンサンブルして自社ファンドを運用します。トークン(NMR)でインセンティブを揃える独特な構造で、2026 年現在約 5,000 人のモデラーが参加しています。

Numerai トーナメント参加例

napi = numerapi.NumerAPI()

1) データダウンロード — 毎週新しいラウンド

napi.download_dataset('v5.0/train.parquet')

napi.download_dataset('v5.0/live.parquet')

2) モデル学習 (LightGBM, XGBoost, または独自モデル)

model = lgb.LGBMRegressor(n_estimators=2000, learning_rate=0.01)

model.fit(train[features], train['target'])

3) 予測提出

preds = model.predict(live[features])

napi.upload_predictions('preds.csv', model_id='your-model-id')

4) ステーキング — NMR トークンをモデルに紐付け、パフォーマンスに応じて報酬/罰金

napi.stake(amount=10, model_id='your-model-id')

**WorldQuant**, **Susquehanna**, **Jane Street** などのクオンツトレーディングファームもすべて LLM/ML インフラを運用していますが、外部公開はほとんどありません。

11. BlackRock Aladdin — 資産運用 OS

**BlackRock Aladdin** (Asset, Liability, Debt and Derivative Investment Network) は 1988 年に BlackRock 内部リスクシステムとして始まり、2026 年現在約 21 兆 USD の資産をモニタリングする事実上の資産運用業界の OS です。BlackRock 自体以外に約 200 の外部機関(BNP Paribas, MUFG, HSBC AM など)がライセンス使用しています。

Aladdin のコアは次のモジュールです。

- **Portfolio Management**: ポートフォリオ全体のリアルタイム状態、リバランスシミュレーション

- **Risk Analytics**: VaR, ストレステスト, シナリオ分析, ファクター・エクスポージャー

- **Trading**: 注文ルーティング, best execution, TCA(Transaction Cost Analysis)

- **Compliance**: ファンドごとのガイドライン, 規制限度の自動チェック

- **Operations**: 決済, 会計, NAV 計算

2024 年にリリースされた **Aladdin Copilot** は GPT-4o + 独自モデルで、ポートフォリオマネージャーが「直近 30 日で信用スプレッド拡大による影響が最も大きかった債券 5 本」のようなクエリを自然言語で投げると回答を提供します。2025 年には **eFront Copilot**(PE/オルタナティブ運用ツール)にも LLM が統合されました。

競合に **MSCI BarraOne**, **Bloomberg PORT/AIM**, **FactSet PA** があり、Aladdin が総合的なら BarraOne はリスクモデルに、PORT は債券に強みがあります。

**Vanguard**, **Fidelity**, **State Street** もすべて独自の AI プラットフォームを運用しています。State Street の **Alpha Platform**, Fidelity の **Fidelity AI Lab**, Vanguard の **Personal Advisor AI** が代表例です。

12. 銀行 AI — JPMorgan · Goldman · Morgan Stanley · Wells Fargo

**JPMorgan Chase** は米銀の中で AI 投資に最も積極的です。

- **COiN (Contract Intelligence)**: 2017 年リリース, 信用契約書を自動分析。弁護士の労力を年間 360,000 時間節約

- **IndexGPT**: 2023 年リリース, ETF テーマを自動生成

- **LLM Suite**: 2024 年 6 月リリース。28 万人の従業員のうち約 16 万人が社内 LLM にアクセス。GPT-4o + Claude + 独自モデルを切り替え

- **DocLLM**: 前述の文書特化モデル

JPMorgan の差別化点は **社内 LLM Suite のガバナンス**です。すべての LLM コールがログされ、PII/MNPI(material non-public information)フィルターが自動適用され、モデルごとのリスク評価が四半期ごとに更新されます。

**Goldman Sachs** は 2024 年 6 月に **GS-AI Platform** をリリースしました。独自の LLM ゲートウェイ、Function Calling の標準化、そしてトレーダー・バンカー・リサーチアナリストごとのカスタムワークフローを提供します。**Banker Copilot** は IB アナリストの pitch deck 作成・ピア分析を自動化します。

**Morgan Stanley** は OpenAI と 2023 年初期パートナーシップを結び、**AskRes (AI Research Assistant)** をリリース、Morgan Stanley の 100,000+ のリサーチ文書に自然言語でアクセスできるようにしました。2024 年には **Debrief** — アドバイザー-顧客ミーティングの自動要約 — が追加されました。

**Wells Fargo** の **Fargo** は 2023 年にリリースされた音声 AI アシスタントで、モバイルアプリで「先週の食料品支出合計」のような自然言語クエリに応答します。2025 年累計コール約 12 億回を記録しました。

**HSBC** と **Standard Chartered** はグローバル銀行の中で最も早く LLM を導入しており、HSBC は独自の **HSBC AI Markets** プラットフォームを、SC は OpenAI ベースの **SC GPT** を運用します。

13. 韓国の金融 AI — KB · Shinhan · Hana · Woori · Toss

**KB 国民銀行** の **KB Liiv** は 2017 年リリース以降、累計 1,400 万ユーザーに到達しています。2024 年には **Liiv AI Banker** が追加され、自然言語で送金・照会・ローンシミュレーションが可能になりました。KB 金融グループは 2025 年に独自の金融 LLM **KB-GPT** を社内リリースしました。

**新韓銀行** の **Sol Bank AI** は 2024 年にリリースされ、**Shinhan AI Copilot** は支店スタッフの商品説明・苦情処理を支援します。新韓金融は 2025 年に Anthropic Claude のエンタープライズライセンスを導入し、韓国金融業界で初めてグローバル LLM と直接契約したと言われています。

**ハナ銀行** の **Hana 1Q** は 2018 年にリリースされたモバイルバンキングアプリで、2025 年には **Hana AI Wealth** が追加されて資産管理レコメンデーションを提供します。

**ウリ銀行** の **WON-PAY** は簡単決済・送金統合プラットフォームで、2025 年に **WON AI Service** が統合され、音声送金・相談をサポートします。

**Toss Bank / Toss Securities / Toss Payments** は韓国で最もモバイルネイティブな金融プラットフォームで、2024 年から GPT-4 ベースの顧客サポートチャットボット、Toss Securities の AI 銘柄レコメンデーション、Toss Payments の自動紛争処理などを運用しています。Toss のデータサイエンスチームは独自の韓国語金融 LLM **Toss-FinLM** を 2025 年に社内公開したと伝えられています。

韓国金融委員会は 2024 年に **金融 AI ガイドライン** を発表し、信用評価・資産運用・保険引受で AI を使う際に説明可能性・差別禁止・監督報告義務を明示しました。この規制は EU AI Act と並んで韓国金融 AI 導入のコア基準になります。

14. 日本の金融 AI — MUFG · Nomura · NTT Data

**MUFG (三菱 UFJ フィナンシャル・グループ)** は 2024 年に独自の金融 LLM **MUFG-GPT** を社内リリースしました。信用分析・法人営業支援に使用され、日本語 + 英語 + 中国語のトライリンガルモデルである点が特徴です。

**野村ホールディングス** は 2025 年に **Nomura Research Assistant** をリリースし、自社リサーチ 7 万件 + グローバルブローカーレポートを自然言語で検索できるようにしました。野村傘下の **Nomura Securities Quant** は ML ベースのアルゴリズム取引事業を拡大しています。

**SMBC** は Microsoft とパートナーシップを結び、Azure OpenAI ベースの社内アシスタント **SMBC-GPT** を運用します。**みずほ** は Anthropic Claude ベースの **Mizuho AI Lab** を 2025 年にリリースしました。

**NTT Data Banking AI** は日本の銀行システム SI を多数受注した NTT Data が運営する銀行特化 AI プラットフォームで、日本の地方銀行 50+ 行に導入されました。日本の地方銀行は IT 予算が小さく独自 LLM 運用が難しいため、NTT Data のような SI ベンダーが共通インフラを提供する形です。

15. 保険 AI — Lemonade · Hippo · Tractable

**Lemonade** は 2015 年創業のデジタル保険会社で、2020 年に NYSE に上場しました。コアの差別化点は **Maya** と **Jim** という二つの AI ボットです。

- **Maya**: 新規加入者に 90 秒以内で見積もり・契約完了。約 200 のデータポイントを収集して自動引受

- **Jim**: 保険金請求処理。事故写真と音声陳述を LLM が分析、単純な請求は 3 秒以内に自動支払い

2024 年に Lemonade は米国・EU・UK で約 200 万人のユーザーに到達し、請求の約 35 パーセントを人手介入なしで自動処理していると報告しました。ただし平均損害率(loss ratio)は伝統的保険会社よりまだ高く、黒字転換は遅れています。

**Hippo Insurance**(住宅保険)は IoT センサー + 衛星画像 + LLM 保険金請求処理で差別化し、**Root Insurance**(自動車保険)はスマートフォンのテレマティクスで保険料を決定します。両社とも SPAC で上場しましたが株価は低迷気味です。

**Tractable** は 2014 年にロンドンで創業した B2B AI 企業で、**自動車事故の写真を見て損傷の程度と修理コストを推定する** モデルがコアです。Allstate, GEICO, AXA, MS\&AD などグローバル保険会社 30 社以上に導入され、2024 年シリーズ E で企業価値約 10 億 USD と評価されました。

似たカテゴリに **Shift Technology**(保険詐欺検知)、**Clearcover**(自動車保険)、**Sure**(エンベデッド保険)があります。

16. PE / VC AI — Carta · Crunchbase · PitchBook

**Carta** は 2012 年創業の cap table プラットフォームで、2024 年時点で約 4 万社の非上場会社と PE/VC ファンドを管理しています。2024 年に **Carta AI** がリリースされ、自然言語で「ポートフォリオ内で前回バリュエーションから 6 か月経過した会社一覧」のようなクエリが可能になりました。401(k), ESPP のような従業員報酬モジュールにも AI レコメンデーションが統合されました。

**Crunchbase** は 2007 年創業の非上場会社データプラットフォームで、2024 年にリリースされた **Crunchbase AI** は「直近 6 か月でシリーズ A を受けた AI インフラ企業」のような自然言語クエリを SQL なしで処理します。2025 年には予測機能 — どの会社が次のラウンドを受ける可能性が高いか — が追加され、VC が outbound ソーシングに使用します。

**PitchBook**(Morningstar 子会社)は 2007 年創業、PE/VC/M\&A 取引データを 60 万件以上保有します。2024 年に **PitchBook AI** がリリースされ、自然言語で「直近 3 年のヘルスケア SaaS の平均 ARR マルチプル推移」のようなクエリが可能になりました。

PE/VC ワークフローで AI 適用が最も大きい領域は **ディールソーシング** と **ポートフォリオモニタリング** です。ソーシングは Crunchbase・PitchBook・LinkedIn データを LLM が統合し、ファンドの投資テーマに合致する会社を毎日レコメンドします。モニタリングは KPI 自動収集(Daloopa スタイル), 四半期報告書の自動要約, 危機アラートなどを自動化します。

特化ツールに **Affinity**(リレーションシップインテリジェンス, CRM)、**Visible**(スタートアップ → 投資家報告の自動化)、**Mosaic**(FP\&A SaaS, AI 統合)があります。

17. 信用 / レンディング / リスク AI — Zest · Upstart · Featurespace

**Zest AI** は 2009 年創業の信用引受 AI 企業で、「伝統的 FICO スコアを補完する機械学習モデル」がコア製品です。米国のクレジットユニオン 200+ 行と一部の中堅銀行に導入され、自動車ローン・個人ローンの引受を自動化します。差別化点は **モデルの説明可能性と差別影響検証 (Adverse Action Reasons)** で、米国 ECOA(Equal Credit Opportunity Act)規制に合わせて否認理由を明示できる必要があります。

**Upstart** は 2012 年創業、2020 年 Nasdaq 上場の AI レンディングプラットフォームで、独自モデルで個人ローン・自動車ローン・小型モーゲージを引き受けます。学歴・雇用履歴・支出パターンなど非伝統的データを活用し、FICO スコアだけでは否認される人もローンが可能というバリュープロポジションを持ちますが、2022~2024 年の金利上昇期に貸倒が急増し、株価は大きく下落しました。

**Featurespace** は 2008 年ケンブリッジで創業した詐欺検知会社で、2024 年に Visa が 9 億 5 千万 USD で買収しました。コア製品 **ARIC** は適応行動モデル(Adaptive Behavioral Analytics)で、トランザクション単位ではなくユーザーの時間的行動パターンを学習します。HSBC, NatWest, TSYS などが使用中です。

似たカテゴリに **Sift**(e コマス詐欺)、**Hawk:AI**(AML)、**Feedzai**(決済詐欺)、**NICE Actimize**(大手銀行 AML)、**Resistant AI**(文書詐欺)があります。

18. ロボアドバイザー — Wealthfront · Betterment · Empower

**Wealthfront** は 2008 年創業のロボアドバイザーで、2024 年時点で約 500 億 USD を運用します。コア製品は自動リバランス・tax-loss harvesting・smart beta ポートフォリオです。2024 年に **Wealthfront AI** がリリースされ、自然言語で「退職 60 歳に 80 万 USD の目標を達成するには月いくら投資すべきか」のようなクエリに回答します。

**Betterment** は 2008 年創業、約 450 億 USD 運用。Wealthfront とほぼ同じ製品ラインを持ちますが、401(k) 統合とヒューマンアドバイザーオプションが差別化点です。

**Empower**(旧 Personal Capital)は 2009 年創業、2020 年に Empower Retirement に買収され、約 1 兆 5 千億 USD をモニタリングします。単純なロボアドバイザーというより **資産統合ダッシュボード + ヒューマンアドバイザー** モデルで、2025 年に **Empower AI** が統合されました。

韓国には **AIM**, **Fount**, **Bulleo** が似たカテゴリにあり、日本には **WealthNavi**, **THEO** があります。すべて独自の AI レコメンデーションエンジンを運用します。

19. アルゴリズム取引 — QuantConnect · NautilusTrader · Backtrader

アルゴリズム取引は LLM とは別の ML/統計領域ですが、金融 AI エコシステムの一つの柱です。

**QuantConnect Lean** (`quantconnect.com`) はオープンソースのアルゴリズム取引エンジンで、C\#/Python で戦略を書いてバックテスト・ライブトレーディングが可能です。2024 年時点で約 30 万人の quant 開発者コミュニティがあり、Interactive Brokers・Tradier などと連携します。

**NautilusTrader** (`nautilustrader.io`) は Rust コア + Python API の高性能バックテスト・ライブエンジンで、2023 年以降オープンソース quant コミュニティで急速に採用されています。レイテンシ敏感な戦略とマルチアセット(株式・先物・暗号資産)サポートが強みです。

**Backtrader** は 2015 年リリースの Python バックテストライブラリで、入門の敷居が低く初心者に人気ですが、アクティブなアップデートは不足気味です。

**Zipline**(Quantopian のソース、現在は Stefan Jansen がメンテナー)、**Vectorbt**, **bt** などのオルタナティブもあります。

これらのツールは LLM と直接結合しませんが、「自然言語で戦略を記述するとバックテストコードを生成」する GPT 統合が 2024~2025 年に活発化しました。**Composer.trade**, **Trade Ideas Holly AI** がその方向の商用製品です。

20. コアデータセット — EDGAR · DART · EDINET · Compustat

金融 LLM の品質は学習/検索データの品質に直結します。2026 年現在、最も重要な公開・有料データソースは次のとおりです。

**米国 SEC EDGAR** (`www.sec.gov/edgar`) は米国上場企業のすべての公示 (10-K, 10-Q, 8-K, S-1, DEF 14A, 13F など) を無料で提供します。2024 年から XBRL 構造化データがほぼ完全に普及し、機械処理がはるかに容易になりました。

**韓国 DART** (`dart.fss.or.kr`) は金融監督院が運営する公示システムで、韓国上場企業の公示を無料提供します。Open DART API でプログラムアクセスが可能です。

**日本 EDINET** (`disclosure2.edinet-fsa.go.jp`) は日本金融庁運営の公示システムで、XBRL が完全普及しています。

**Yahoo Finance**, **IEX Cloud**, **Polygon.io** は価格データの一般的ソースです。Yahoo は無料ですが API レート制限が厳しく、IEX は SIP ライセンスなしで IEX 取引所データを提供し、Polygon は NMS フルデータを有料提供します。

**Compustat (S\&P)** と **CRSP (University of Chicago Booth)** はアカデミアと quant ファンドの標準データセットです。Compustat はファンダメンタル、CRSP は価格・配当・コーポレートアクション(corporate actions)の精密なバックテスト品質データを提供します。両方とも学術ライセンスが高い(年間数万 USD)ですが、データ品質は圧倒的です。

**WRDS (Wharton Research Data Services)** は上記データセットを一つの SQL インターフェースで束ねた学術プラットフォームで、大学院生 quant 研究の標準です。

オルタナティブデータには **YipitData**(e コマストラフィック)、**Second Measure / Bloomberg Second Measure**(カード決済)、**Thinknum**(ウェブスクレイピングベースの KPI)、**Predata**(地政学)があります。

21. 評価ベンチマーク — FinBen · FLUE · FinanceBench

ドメイン LLM の評価は汎用 LLM と異なるメトリックが必要です。2026 年現在、最もよく引用されるベンチマークは次のとおりです。

- **FinBen**: 24 の金融タスク(センチメント分析、NER、headline 分類、QA、要約、株価予測) — `github.com/The-FinAI/PIXIU`

- **FLUE (Financial Language Understanding Evaluation)**: センチメント・headline・QA の 5 タスク

- **FinanceBench**: 10,231 件の SEC filing QA — 学習ではなく評価専用

- **FNS-2023, ConvFinQA**: カンファレンスコールのマルチターン QA

- **MultiFin**: 多言語金融分類

FinanceBench が特に重要な理由は、一般 QA ベンチマークと違い、実際の 10-K/10-Q で人が検証した答えを使い、表・脚注を横断しないと正答が出ない難しいクエリが多いからです。2024 年発表時点で GPT-4 の正答率は約 19 パーセントで、「汎用 LLM が金融文書でどれだけ弱いか」を端的に示した例でした。

22. RAG パターン — 金融ドメイン特化検索

金融 LLM の 90 パーセントのユースケースは事前学習ではなく **RAG (Retrieval-Augmented Generation)** で解決されます。金融 RAG の特異点は次のとおりです。

金融 RAG パイプライン例(簡略化)

from langchain.vectorstores import Pinecone

from langchain.embeddings import OpenAIEmbeddings

from langchain.text_splitter import RecursiveCharacterTextSplitter

from langchain.chat_models import ChatOpenAI

1) Chunking — 表は丸ごと、テキストは段落単位

splitter = RecursiveCharacterTextSplitter(

chunk_size=1500,

chunk_overlap=200,

separators=['\n## ', '\n### ', '\n\n', '\n', '. ', ' '],

)

2) メタデータ付与 — 会社、会計年度、文書タイプ、ページ、表 ID

def add_metadata(chunks, filing):

return [{

'text': c.page_content,

'ticker': filing.ticker,

'fiscal_year': filing.fy,

'doc_type': filing.type,

'page': c.metadata.get('page'),

'section': c.metadata.get('section'),

} for c in chunks]

3) Hybrid search — BM25 + dense embedding

retriever = Pinecone(

embeddings=OpenAIEmbeddings(model='text-embedding-3-large'),

namespace='sec-filings',

hybrid_alpha=0.7, # 30 パーセント BM25, 70 パーセント dense

)

4) メタデータフィルタリング — "Apple 2024 年 10-K" のみ検索

results = retriever.similarity_search(

'gross margin trajectory',

filter={'ticker': 'AAPL', 'fiscal_year': 2024, 'doc_type': '10-K'},

k=10,

)

5) 引用付きで回答生成

llm = ChatOpenAI(model='gpt-4o')

answer = llm.invoke([

{'role': 'system', 'content': 'Cite source with [filing, page] format.'},

{'role': 'user', 'content': f'Context: {results}\n\nQuery: ...'}

])

コアなトリックは **(1) 表を丸ごと chunk** — 表が切れると意味が壊れます。**(2) Hybrid search** — 会計用語は正確なワードマッチングが重要なので BM25 を併用します。**(3) メタデータフィルタリング優先** — 会社・年を絞ってからセマンティック検索すると hallucination が大幅に減ります。**(4) 引用フォーマットの強制** — すべての回答が原文ページに追跡可能でなければなりません。

AlphaSense, Hebbia, Daloopa, Tegus はすべてこの RAG アーキテクチャの上にビルドされ、差別化はデータキュレーション品質とドメイン特化の後処理にあります。

23. 規制 — EU AI Act · 米国 SR 11-7 · 韓国金融 AI ガイドライン

金融 AI は最も規制が厳しい領域です。

**EU AI Act**(2024 年発効、2026~2027 年に段階適用)は信用評価・保険引受を「高リスク AI システム」に分類し、リスク評価・データガバナンス・文書化・人的監督・正確性・ロバストネスの義務を課します。

**米国 SR 11-7**(Federal Reserve "Guidance on Model Risk Management", 2011)は銀行が使うすべてのモデル(LLM を含む)に対して (1) 開発検証、(2) 使用モニタリング、(3) ガバナンスフレームワークを要求します。2023 年に OCC・FDIC の補完ガイダンスが LLM・生成 AI に対する解釈を追加しました。

**韓国金融委 AI ガイドライン**(2024 年発効)は説明可能性・差別禁止・人的監督・モデルガバナンス 5 大原則を明示し、信用評価・資産運用・保険引受に使う AI には事前申告義務を課しました。

**日本金融庁 (JFSA)** は「AI 活用原則」を 2024 年に発表、自律的ガバナンスモデルですが LLM の hallucination リスクを明示的に扱います。

この規制は LLM 導入速度の最大の制約であり、同時にガバナンスインフラ(LangChain Tracing, Anthropic AGI Safety, Confident AI)の成長ドライバでもあります。

24. 限界と未解決問題

2026 年 5 月時点でも金融 AI は次の限界を持ちます。

**1) Hallucination + 数値正確性**: LLM は依然として表から数字を間違って読んだり、会計期間を混同したりします。FinanceBench が示すように、汎用 LLM の正答率は人間よりずっと低いです。

**2) リアルタイムデータ統合**: LLM は基本的に学習時点のカットオフを持ち、リアルタイム市場データと結合するには RAG/Tool アーキテクチャが必要です。この統合が壊れると誤った価格・時点の回答が出ます。

**3) マルチモーダル — チャートと表**: GPT-4V, Claude 3.5/4 Vision がチャートをある程度読めますが、精密な数値抽出は依然として OCR + ルールベースの方が正確です。

**4) 因果推論**: LLM は相関は捉えやすいですが因果(なぜ為替が動いたか)は弱いです。マクロ分析は依然として人間の領域です。

**5) 規制ガバナンスコスト**: 一つの LLM 導入にモデル検証・文書化・モニタリングコストがモデル自体のコストの 5~10 倍かかることがあります。

**6) データライセンス**: Bloomberg, FactSet, S\&P データは LLM 学習自体がライセンス違反となる可能性があり、ドメイン LLM の真の事前学習は自社データを持つ少数のプレイヤーだけが可能です。

これらの限界のため、2026 年現在「AI がファンドマネージャーを置き換える」シナリオはまだ遠いです。しかしアナリストの情報収集・文書処理・シミュレーションツールは急速に AI に置き換えられており、同じリソースで 10 倍多くの銘柄・ディールを扱えるようにする生産性ツールとして定着しています。

25. 学習ロードマップ — どこから始めるか

金融 AI を初めて学習するなら、次の順序をお勧めします。

1. **基礎金融 + Python**: Investopedia シリーズ、McKinney の "Python for Data Analysis"、`yfinance` + Pandas で価格データ分析

2. **金融 NLP 入門**: FinBERT 論文、Hugging Face の `ProsusAI/finbert`、FinGPT GitHub README

3. **RAG 実習**: LangChain · LlamaIndex で SEC 10-K Q\&A ボットを作る、EDGAR API を使用

4. **ベンチマーク評価**: FinanceBench, FinBen 上で自社モデル/RAG を評価

5. **商用ツールの体験**: Bloomberg Terminal Anywhere の学生ライセンス、AlphaSense トライアル

6. **Quant 入門**: QuantConnect の無料コース、Hudson \& Thames の機械学習本

金融 AI は単なる NLP ではなく、会計・財務・市場マイクロストラクチャーへのドメイン理解を要求します。CFA Level 1~2 程度の会計・財務知識があれば LLM の出力を批判的に評価でき、大きな助けになります。

26. 参考 / References

- BloombergGPT paper — `https://arxiv.org/abs/2303.17564`

- Bloomberg AI blog — `https://www.bloomberg.com/company/values/tech-at-bloomberg/`

- FinGPT GitHub — `https://github.com/AI4Finance-Foundation/FinGPT`

- FinRobot GitHub — `https://github.com/AI4Finance-Foundation/FinRobot`

- InvestLM (NYU Stern) — `https://github.com/AbaciNLP/InvestLM`

- PIXIU / FinMA — `https://github.com/The-FinAI/PIXIU`

- DocLLM (JPMorgan) paper — `https://arxiv.org/abs/2401.00908`

- AlphaSense — `https://www.alpha-sense.com/`

- Tegus — `https://www.tegus.com/`

- Daloopa — `https://daloopa.com/`

- Hebbia — `https://www.hebbia.com/`

- BlackRock Aladdin — `https://www.blackrock.com/aladdin`

- JPMorgan AI Research — `https://www.jpmorgan.com/technology/artificial-intelligence`

- Goldman Sachs Engineering — `https://www.goldmansachs.com/our-firm/engineering`

- Morgan Stanley AI — `https://www.morganstanley.com/articles/ai-research-assistant`

- Bridgewater Associates — `https://www.bridgewater.com/`

- Two Sigma — `https://www.twosigma.com/`

- Numerai — `https://numer.ai/`

- Lemonade — `https://www.lemonade.com/`

- Tractable — `https://tractable.ai/`

- Carta — `https://carta.com/`

- Crunchbase — `https://www.crunchbase.com/`

- PitchBook — `https://pitchbook.com/`

- Zest AI — `https://www.zest.ai/`

- Upstart — `https://www.upstart.com/`

- QuantConnect Lean — `https://github.com/QuantConnect/Lean`

- NautilusTrader — `https://github.com/nautechsystems/nautilus_trader`

- SEC EDGAR — `https://www.sec.gov/edgar`

- 韓国 FSS DART — `https://opendart.fss.or.kr/`

- 日本 EDINET — `https://disclosure2.edinet-fsa.go.jp/`

- FinanceBench — `https://github.com/patronus-ai/financebench`

- EU AI Act — `https://artificialintelligenceact.eu/`

- 韓国金融委 AI ガイドライン — `https://www.fsc.go.kr/`