필사 모드: AIエージェントフレームワーク 2026 完全ガイド — LangGraph・AutoGen・CrewAI・Semantic Kernel・OpenAI Agents SDK・Claude Agent SDK・Pydantic AI 徹底比較
日本語はじめに — 2026年5月、「エージェントフレームワーク」カテゴリは決着したか
2025年末から2026年第1四半期にかけて、エージェントフレームワークの世界は二度の大きな転換を経た。ひとつは **OpenAI Swarm の廃止と OpenAI Agents SDK の GA**、もうひとつは **Anthropic による Claude Code SDK の Claude Agent SDK へのリブランド**だ。LangChain は LangGraph 0.3 で interrupt と human-in-the-loop を一級市民に格上げした。Microsoft は AutoGen 0.4(非同期アクターモデルへの全面リライト)と Semantic Kernel Agent Framework の二本立てで事実上両方を運営している。
本稿は「2026年5月時点で本番投入するエージェントフレームワークをどう選ぶか」のガイドだ。マーケティングページの引き写しはしない。実際のAPIの形、マルチエージェントパターン、可観測性、モデル非依存性、さらには日本と韓国のコミュニティ動向まで踏み込む。
評価軸 — 比較に使う8つの観点
比較には必ず基準が要る。本稿では次の8軸で各フレームワークを分解する。
1. **グラフ/状態モデル**: 明示的なステートマシンか、自由会話か、イベントワークフローか
2. **ツール呼び出し**: 関数シグネチャから JSON スキーマへの変換は誰の責任か
3. **マルチエージェントパターン**: handoff、supervisor-worker、magentic、role-based など
4. **割り込みと再開**: チェックポイント、human-in-the-loop、長時間実行の対応
5. **メモリ**: 短期(コンテキストウィンドウ)と長期(ベクター/グラフ)の抽象
6. **可観測性**: トレース、評価(eval)、デバッグ UI
7. **モデル非依存性**: OpenAI、Anthropic、Gemini、OSS モデルを切り替えるコスト
8. **言語 SDK**: Python 以外の .NET、TypeScript、Java サポートの幅
一覧 — 2026年5月のフレームワーク勢力図
| フレームワーク | 提供元 | 第一言語 | コアモデル | マルチエージェント |
| --- | --- | --- | --- | --- |
| LangGraph 0.3+ | LangChain | Python, TS | 状態グラフ + チェックポイント | supervisor, swarm |
| AutoGen 0.4 | Microsoft | Python | 非同期アクター | GroupChat, Magentic-One |
| CrewAI | CrewAI Inc. | Python | role-based crew + Flows | hierarchical, sequential |
| Semantic Kernel 1.30+ | Microsoft | .NET, Python, Java | plugin + planner | Agent Framework |
| OpenAI Agents SDK | OpenAI | Python, TS | Responses API + handoff | handoff DAG |
| Claude Agent SDK | Anthropic | Python, TS | system prompt + tools + MCP | subagents |
| Pydantic AI | Pydantic Team | Python | 型安全エージェント | delegation |
| Smol Agents | Hugging Face | Python | コード実行エージェント | managed agents |
| LlamaIndex Agent Workflows | LlamaIndex | Python, TS | イベント駆動ワークフロー | multi-agent workflow |
| Vercel AI SDK | Vercel | TypeScript | streaming + tool calling | 手動オーケストレーション |
各行はマーケティングではなく実際の API 形状から抽出した。ここから個別に見ていく。
LangGraph 0.3 — 状態グラフ + チェックポイントの事実上の標準
LangGraph は LangChain チームによるグラフベースのオーケストレーションライブラリだ。0.3 系の特徴は3つに集約できる。
- **割り込みと再開の一級化**: `interrupt()` でグラフの実行が停止し、人間の判断後に `Command` オブジェクトでグラフを再開する。
- **チェックポインタの多様化**: メモリ、SQLite、Postgres、Redis のチェックポインタが正式採用。
- **LangGraph Studio + LangSmith**: グラフを視覚的にデバッグし、トレースを LangSmith に自動送出。
典型的な LangGraph 0.3 のコードは次のようになる。
from typing import Annotated, TypedDict
from langgraph.graph import StateGraph, START, END
from langgraph.checkpoint.memory import MemorySaver
from langgraph.types import interrupt, Command
class State(TypedDict):
messages: Annotated[list, "msgs"]
approved: bool
def plan(state: State) -> State:
return {"messages": state["messages"] + ["plan drafted"]}
def human_review(state: State) -> State:
decision = interrupt({"plan": state["messages"][-1]})
return {"approved": decision == "approve"}
def execute(state: State) -> State:
if not state["approved"]:
return {"messages": state["messages"] + ["aborted"]}
return {"messages": state["messages"] + ["executed"]}
graph = (
StateGraph(State)
.add_node("plan", plan)
.add_node("human_review", human_review)
.add_node("execute", execute)
.add_edge(START, "plan")
.add_edge("plan", "human_review")
.add_edge("human_review", "execute")
.add_edge("execute", END)
.compile(checkpointer=MemorySaver())
)
LangGraph の強みは **グラフのトポロジーがそのままコードに現れる** ことだ。ノードとエッジが明示的でデバッグや再現がやりやすい。難点は学習コストで、単純なチャットボットを作るだけでもグラフ、状態、チェックポインタ、割り込みの概念を一通り覚える必要がある。
AutoGen 0.4 — アクターモデルによる非同期再構築
Microsoft Research の AutoGen は 0.4 で事実上ゼロから書き直された。0.2 系の同期 GroupChat モデルがデバッグと拡張性で限界に達したため、非同期アクターランタイムを基盤に再設計された。
コアコンポーネントは次のように分割された。
- **`autogen-core`**: アクターランタイム。非同期メッセージパッシングとルーティング。
- **`autogen-agentchat`**: 0.2 と類似のマルチエージェント会話抽象。
- **`autogen-ext`**: OpenAI、Anthropic、Azure OpenAI、Ollama などの統合。
- **AutoGen Studio**: ノーコードデザイナーとデバッガ UI。
- **Magentic-One**: 汎用マルチエージェントシステム。WebSurfer、FileSurfer、Coder、ComputerTerminal などが Orchestrator の下で協調動作する。
シンプルな2エージェント協調はこう書ける。
from autogen_agentchat.agents import AssistantAgent
from autogen_agentchat.teams import RoundRobinGroupChat
from autogen_agentchat.conditions import MaxMessageTermination
from autogen_ext.models.openai import OpenAIChatCompletionClient
async def main():
client = OpenAIChatCompletionClient(model="gpt-4o")
writer = AssistantAgent("writer", client, system_message="You write drafts.")
reviewer = AssistantAgent("reviewer", client, system_message="You critique drafts.")
team = RoundRobinGroupChat([writer, reviewer], termination_condition=MaxMessageTermination(6))
await team.run(task="Draft a 3-sentence pitch for a Japanese coffee subscription.")
asyncio.run(main())
0.4 の強みは **分散実行と可観測性** だ。OpenTelemetry トレースが組み込みで、アクター単位でログが分離される。Magentic-One は GAIA ベンチマークで SOTA 級の数値を叩き出す参照実装でもある。
CrewAI — 役割ベースの最も直感的な抽象
CrewAI は「役割を持った人々が集まる会社」をそのままモデル化する。コア抽象は Agent、Task、Crew、Process の4つだ。
- **Agent**: role(役割)、goal(目標)、backstory(背景)を持つエージェント。
- **Task**: 明示的な入力と期待出力を持つ作業単位。
- **Crew**: エージェントとタスクの束。
- **Process**: 逐次(sequential)または階層(hierarchical)実行。
- **Flows**: 2025年末に追加されたイベントベースの意思決定 API。Crew と組み合わせて条件分岐と状態保持を実現する。
典型的な CrewAI コードはこうなる。
from crewai import Agent, Task, Crew, Process
researcher = Agent(
role="シニアリサーチャー",
goal="AIエージェント市場の動向調査",
backstory="技術アナリスト10年のキャリア",
allow_delegation=False,
)
writer = Agent(
role="テックライター",
goal="調査結果をブログ記事に変換",
backstory="開発者出身の技術ライター",
)
research = Task(
description="2026年のAIエージェントフレームワーク10選を比較",
expected_output="markdown表とキーシグナル",
agent=researcher,
)
draft = Task(
description="research の結果を1500字の文章に変換",
expected_output="markdown本文",
agent=writer,
context=[research],
)
crew = Crew(agents=[researcher, writer], tasks=[research, draft], process=Process.sequential)
result = crew.kickoff()
CrewAI Enterprise は SaaS として提供され、セルフホスト版とあわせて評価・デプロイ・監視のパイプラインを束ねる。デモを最速で作れるフレームワークのひとつだ。
Semantic Kernel 1.30+ — Microsoft の .NET / Python / Java 統合トラック
Semantic Kernel は Microsoft が Copilot スタック全般で使う SDK だ。2026年5月時点の 1.30 系の特徴は次のとおり。
- **Agent Framework が正式 GA**: `ChatCompletionAgent`、`OpenAIAssistantAgent`、`AzureAIAgent`、`BedrockAgent` が統一インターフェースで露出。
- **プラグインシステム**: 属性を付けるだけで関数がツールとして自動公開される。C# は `KernelFunctionAttribute`、Python は `@kernel_function`。
- **プランナー**: 自然言語の目標から plugin 呼び出しシーケンスを生成。Function-Calling planner、Handlebars planner など。
- **メモリ**: Azure AI Search、Qdrant、Chroma、Postgres pgvector などのバックエンド。
C# サンプルは次のとおり。
using Microsoft.SemanticKernel;
using Microsoft.SemanticKernel.Agents;
var builder = Kernel.CreateBuilder();
builder.AddAzureOpenAIChatCompletion("gpt-4o", endpoint, apiKey);
builder.Plugins.AddFromType<WeatherPlugin>();
var kernel = builder.Build();
var agent = new ChatCompletionAgent
{
Name = "WeatherBot",
Instructions = "You answer weather questions using the Weather plugin.",
Kernel = kernel,
};
await foreach (var item in agent.InvokeAsync("東京の今日の天気は?"))
{
Console.WriteLine(item.Content);
}
.NET 環境や Microsoft 365 / Azure AI Foundry との統合が必要なら、Semantic Kernel は事実上の既定選択肢だ。Java SDK も 1.x 系で着実に追従している。
OpenAI Agents SDK — Swarm の後継
2024年秋の OpenAI Swarm は「教育用サンプル」だったが、2025年春に OpenAI Agents SDK として正式 GA した。コア抽象は4つだ。
- **`Agent`**: モデル、システムプロンプト、ツール、handoff、ガードレールをまとめる単位。
- **`handoff`**: あるエージェントから別のエージェントへ制御を渡す一級オブジェクト。
- **`guardrail`**: 入力/出力に適用する検証フック。ポリシー違反で停止。
- **`trace`**: Responses API ベースのトレースが既定で組み込み。OpenAI ダッシュボードで可視化。
コードは非常に短い。
from agents import Agent, Runner, handoff
triage = Agent(
name="Triage",
instructions="Decide whether the user wants billing or technical help.",
)
billing = Agent(name="Billing", instructions="Answer billing questions.")
tech = Agent(name="Tech", instructions="Answer technical questions.")
triage.handoffs = [handoff(billing), handoff(tech)]
result = Runner.run_sync(triage, "返金してほしい")
print(result.final_output)
OpenAI Agents SDK の強みは **OpenAI モデルとの統合の深さ** だ。Responses API、structured output、tools、traces が一つのパッケージとして動く。弱点はモデル非依存性で、LiteLLM 経由で他モデルを挿せるものの、一級市民は OpenAI である。
Claude Agent SDK — Claude Code SDK のリブランド
Anthropic は2025年末に Claude Code SDK を **Claude Agent SDK** にリブランドした。改名の意味は明快だ。「コーディング専用ツール」ではなく「Claude ベースのエージェントを作る汎用 SDK」として再定位したのである。
主要なビルディングブロックは次のとおり。
- **システムプロンプトビルダー**: 役割、ツール説明、安全ガイドラインを合成。
- **ツール(tools)**: 関数 + JSON スキーマ。`bash`、`file_edit`、`web_search` などのビルトイン。
- **MCP(Model Context Protocol)**: 外部コンテキストソースを標準プロトコルで接続。2025年11月に Anthropic が公開し、事実上の業界標準となった。
- **subagents**: メインエージェントが小さなエージェントを呼び出すパターン。
Anthropic SDK を使った Python サンプル。
from anthropic import Anthropic
client = Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=1024,
system="You are a helpful coding assistant.",
tools=[
{
"name": "read_file",
"description": "Read a file from disk",
"input_schema": {
"type": "object",
"properties": {"path": {"type": "string"}},
"required": ["path"],
},
}
],
messages=[{"role": "user", "content": "read README.md"}],
)
Claude Agent SDK の強みは **長いコンテキストと安定したツール呼び出し** だ。Claude 4.5 / 4.6 系は 200K トークンのコンテキストウィンドウと強いツール呼び出し一貫性で知られ、SDK がそれをそのまま露出する。
Pydantic AI — 型安全なエージェントフレームワーク
Pydantic チームが作った Pydantic AI は2024年末の初公開以降、急速にシェアを伸ばしている。スローガンは単純だ。「FastAPI が API サーバーに対してやったことを、エージェントに対してやる」。
設計上の決定事項は次のとおり。
- **型安全性**: 入力、ツール、出力すべてが Pydantic モデル。
- **依存性注入**: エージェント実行時に外部コンテキスト(DB 接続、API キー、ユーザー情報)を注入。
- **構造化レスポンス**: LLM 出力を常に Pydantic モデルに強制。
- **モデル非依存性**: OpenAI、Anthropic、Gemini、Groq、Mistral、Ollama を同一インターフェースで。
コードは非常に Pythonic だ。
from pydantic import BaseModel
from pydantic_ai import Agent, RunContext
class WeatherResponse(BaseModel):
city: str
temperature_c: float
condition: str
class Deps(BaseModel):
api_key: str
agent = Agent(
"anthropic:claude-sonnet-4-6",
deps_type=Deps,
output_type=WeatherResponse,
system_prompt="You answer weather questions using the get_weather tool.",
)
@agent.tool
def get_weather(ctx: RunContext[Deps], city: str) -> dict:
return {"city": city, "temperature_c": 21.0, "condition": "晴れ"}
result = agent.run_sync("東京の天気を教えて", deps=Deps(api_key="..."))
print(result.output)
型安全性を重視するチーム、特に FastAPI ベースのバックエンドチームが急速に採用している。
Smol Agents — Hugging Face のコード実行エージェント
Hugging Face が2024年末に公開した Smol Agents は「エージェントは関数呼び出しではなくコードを書くべき」という ReAct + CodeAct 路線を採る。
- **CodeAgent**: 毎ターン Python コードを書いて実行する。関数呼び出し JSON ではなく本物のコード。
- **ToolCallingAgent**: 従来の JSON 関数呼び出しモードも選べる。
- **サンドボックス**: E2B、Docker、ローカルインタプリタなど隔離された実行環境。
- **HF Hub 統合**: ツールとエージェントを Hub に push/pull できる。
from smolagents import CodeAgent, HfApiModel, DuckDuckGoSearchTool
model = HfApiModel("meta-llama/Llama-3.3-70B-Instruct")
agent = CodeAgent(tools=[DuckDuckGoSearchTool()], model=model)
agent.run("2026年のAIエージェント市場規模を一言で要約")
コード実行路線はツール合成とデータ変換の自由度が高い。代償はサンドボックスのコストと攻撃面積だ。
LlamaIndex Agent Workflows — イベント駆動ワークフロー
LlamaIndex は2025年初頭、従来の `AgentRunner` / `AgentWorker` を **Workflows** に統合した。中核はイベント駆動アーキテクチャだ。
- ノードはイベントを受け取り、別のイベントを emit する。
- 分岐はイベント型で自然に表現される。
- マルチエージェントワークフローは別モジュール(`MultiAgentWorkflow`)で提供。
- LlamaIndex のインデックス/リトリーバ生態系と自然に統合される。
from llama_index.core.workflow import Workflow, step, Event, StartEvent, StopEvent
class ResearchEvent(Event):
query: str
class MyWorkflow(Workflow):
@step
async def start(self, ev: StartEvent) -> ResearchEvent:
return ResearchEvent(query=ev.input)
@step
async def research(self, ev: ResearchEvent) -> StopEvent:
実際にはリトリーバを呼ぶ
return StopEvent(result=f"summary of {ev.query}")
asyncio.run(MyWorkflow().run(input="AI agents 2026"))
RAG が中心ユースケースなら LlamaIndex Workflows はほぼ自然な選択肢だ。
Vercel AI SDK — TypeScript ファーストのストリーミング + ツール呼び出し
Vercel AI SDK は TypeScript のフロントエンドとフルスタック界隈で事実上の標準だ。2026年5月時点の 4.x 系の特徴は次のとおり。
- **`streamText`、`generateText`、`generateObject`**: シンプルな関数型 API。
- **`tools`**: zod スキーマでツールを定義。型推論がきれい。
- **`useChat`、`useCompletion`**: React フックでストリーミング UI。
- **プロバイダ抽象**: `@ai-sdk/openai`、`@ai-sdk/anthropic`、`@ai-sdk/google`、`@ai-sdk/mistral` など。
const result = await generateText({
model: anthropic("claude-sonnet-4-6"),
tools: {
getWeather: tool({
description: "Get current weather for a city",
parameters: z.object({ city: z.string() }),
execute: async ({ city }) => ({ city, tempC: 21 }),
}),
},
prompt: "東京の天気を教えて",
});
Vercel AI SDK は意図的に **「エージェントオーケストレーションフレームワークではない」** という立場を取る。マルチエージェントは自分で実装してほしいということだ。シンプルなチャット + ツール呼び出しでは最速だが、複雑なグラフには不向きだ。
マルチエージェントパターン比較 — 同じ問題、異なる形
同じ「リサーチ → 執筆 → レビュー」ワークフローを5つのフレームワークがどう表現するかを並べる。
| フレームワーク | 表現方法 |
| --- | --- |
| LangGraph | ノード3個 + 明示的エッジ。すべての中間結果を State に保存。 |
| AutoGen | RoundRobinGroupChat または SelectorGroupChat。終了条件を明示。 |
| CrewAI | Agent 3 + Task 3 + `Process.sequential`。context で結果を引き渡す。 |
| OpenAI Agents SDK | トリアージエージェント + handoff 2個。Runner がルーティング。 |
| Claude Agent SDK | メインエージェントが subagent を呼び出す。ツールのように露出。 |
最大の違いは **「誰がルーティングを決めるか」** だ。LangGraph はコード(エッジ)、AutoGen はグループチャットポリシー、CrewAI はプロセスタイプ、OpenAI Agents SDK は handoff 判断、Claude Agent SDK はメインエージェントが決める。
ツール呼び出し — JSON スキーマ生成は誰の責任か
ツール呼び出しは全フレームワーク共通の抽象だが、責任分担が違う。
- **Pydantic AI / Semantic Kernel / Vercel AI SDK**: 型定義(Pydantic、C# シグネチャ、zod)から自動抽出。
- **LangGraph / OpenAI Agents SDK**: `@tool` デコレータまたは関数シグネチャから抽出。
- **CrewAI**: `BaseTool` のサブクラス化または `@tool` デコレータ。
- **Claude Agent SDK / AutoGen**: 明示的な JSON スキーマ記述も歓迎。
- **Smol Agents**: コード実行のためスキーマ自体が存在しない。Python 関数がそのままツール。
スキーマ自動生成が強いほうが開発速度は速く、明示的記述が強いほうが LLM に露出するインターフェースを精密に制御できる。
割り込みと human-in-the-loop — 誰が最も得意か
長時間実行エージェントの肝は「人間が介入できるか」だ。
- **LangGraph**: `interrupt()` + `Command` で一級市民。チェックポインタと組み合わせて停止/再開が自然。
- **AutoGen**: `UserProxyAgent` で表現。やや回りくどい。
- **CrewAI**: Human Input task で部分対応。
- **OpenAI Agents SDK**: ガードレール停止またはメインループ外で処理。
- **Semantic Kernel**: Process Framework で外部イベントと結合。
- **Claude Agent SDK**: ツール呼び出し承認インターフェースが SDK レベルで露出。
長時間実行と人間承認が重要なワークフロー(返金承認、コード変更マージなど)は LangGraph が最も自然だ。
可観測性 — トレースがなければデバッグは不可能
エージェントは非決定的で、トレースがなければ実質デバッグできない。
- **LangGraph**: LangSmith 自動統合。ノードごとの入出力、トークン、コストを可視化。
- **AutoGen 0.4**: OpenTelemetry 内蔵。Jaeger、Honeycomb、Datadog と接続。
- **CrewAI**: 独自ダッシュボード + 外部統合(W&B、Langfuse)。
- **OpenAI Agents SDK**: Responses API トレースが OpenAI ダッシュボードに自動表示。
- **Claude Agent SDK**: Anthropic コンソールの trace と eval。
- **Pydantic AI**: Logfire(同じく Pydantic チーム)と自然統合。
- **Vercel AI SDK**: OpenTelemetry + Vercel Observability。
フレームワーク非依存の選択肢として **Langfuse、Arize、Helicone** が頻出する。
モデル非依存性 — 切り替えやすさ
モデル価格が四半期ごとに動く時代、モデル非依存性はコスト問題だ。
- **強い非依存性**: LangGraph、AutoGen、CrewAI、Pydantic AI、Smol Agents、Vercel AI SDK、LlamaIndex。
- **自社モデル優先**: OpenAI Agents SDK(OpenAI 優先)、Claude Agent SDK(Claude 優先)。
- **Microsoft ライン優先**: Semantic Kernel(Azure OpenAI + Bedrock 互換)。
自社優先フレームワークでも LiteLLM や OpenAI 互換ゲートウェイで迂回できる。ただしトレースとツール形式が自社モデル基準で最適化されているため、差し替えると一部機能が弱くなる。
日本コミュニティ — Microsoft ライン強さと LlamaIndex の隆盛
日本では2つのトラックが目立つ。
- **Microsoft Tokyo + 日本の SI 業界**: Semantic Kernel と Azure AI Foundry の採用率が高い。日本語ドキュメントも整備されている。
- **LlamaIndex 日本ユーザーグループ**: 東京・大阪の定期ミートアップ。RAG 中心。
研究指向の **PFN(Preferred Networks)** や **Sakana AI** などは独自フレームワークを作るか、AutoGen / LangGraph をフォークして実験している。Qiita や Zenn では2026年に入って OpenAI Agents SDK と Claude Agent SDK の日本語チュートリアルが急増した。
韓国コミュニティ — LangChain Korea がハブ
韓国の AI エージェントコミュニティは2024年後半に始まった LangChain Korea が事実上のハブだ。定期ミートアップ、韓国語チュートリアル、LangGraph 韓国語ワークショップが活発。
もうひとつの軸は **モドゥの研究所 LLM フルスタックトラック** と **Fastcampus / Inflearn の有料講座**。2026年第1四半期時点で LangGraph、CrewAI、OpenAI Agents SDK の韓国語コースが出揃った。
企業導入パターンとしては次のような傾向が見える。
- Naver / Kakao / LG AI: 自社モデル + LangChain / LangGraph で社内エージェント。
- スタートアップ: OpenAI Agents SDK または Claude Agent SDK + Pydantic AI で高速 MVP。
- フィンテック: Semantic Kernel(.NET バックエンド)と human-in-the-loop 重視。
どのフレームワークを選ぶか — シナリオ別ガイド
結論をシナリオ別に圧縮するとこうなる。
- **長時間実行ワークフロー + human-in-the-loop**: LangGraph 0.3。
- **研究プロトタイプ + マルチエージェント実験**: AutoGen 0.4 + Magentic-One。
- **高速デモ + 役割ベース協調**: CrewAI。
- **.NET / Azure 統合**: Semantic Kernel。
- **OpenAI モデル中心 + handoff**: OpenAI Agents SDK。
- **Claude モデル + 長コンテキスト + MCP**: Claude Agent SDK。
- **型安全性 + FastAPI スタイル**: Pydantic AI。
- **コード実行 + HF エコシステム**: Smol Agents。
- **RAG 中心**: LlamaIndex Agent Workflows。
- **TypeScript フロントエンド + ストリーミング**: Vercel AI SDK。
プロダクションシステムの多くは **2つ以上を組み合わせる**。例えば Vercel AI SDK でフロントを作り、バックエンドを LangGraph でオーケストレーションする構成だ。
おわりに — フレームワークは収束せず分岐する
2026年5月時点で「フレームワークの統合」は起きていない。むしろ分岐は鋭くなった。OpenAI と Anthropic は自社モデル + SDK 統合路線へ、Microsoft は .NET + Azure 統合路線へ、LangChain はグラフ + 可観測性路線へ、Pydantic は型安全路線へと向かった。
この分岐自体が市場成熟のシグナルだ。「エージェントを作る唯一の方法」は存在しない。ワークロード特性、チームの言語選択、モデル依存性、可観測性要件がすべて異なるからだ。本稿が自分のユースケースに合うフレームワークを選ぶ出発点になれば幸いだ。
参考資料
1. [LangGraph 公式ドキュメント](https://langchain-ai.github.io/langgraph/)
2. [LangGraph GitHub](https://github.com/langchain-ai/langgraph)
3. [AutoGen 0.4 公式ドキュメント](https://microsoft.github.io/autogen/)
4. [AutoGen GitHub](https://github.com/microsoft/autogen)
5. [Magentic-One 論文](https://arxiv.org/abs/2411.04468)
6. [CrewAI 公式ドキュメント](https://docs.crewai.com/)
7. [CrewAI GitHub](https://github.com/crewAIInc/crewAI)
8. [Semantic Kernel 公式ドキュメント](https://learn.microsoft.com/en-us/semantic-kernel/)
9. [Semantic Kernel GitHub](https://github.com/microsoft/semantic-kernel)
10. [OpenAI Agents SDK 公式ドキュメント](https://openai.github.io/openai-agents-python/)
11. [OpenAI Agents SDK GitHub](https://github.com/openai/openai-agents-python)
12. [Claude Agent SDK 公式ドキュメント](https://docs.anthropic.com/en/docs/claude-code/sdk)
13. [Anthropic — Building Effective Agents](https://www.anthropic.com/research/building-effective-agents)
14. [Model Context Protocol](https://modelcontextprotocol.io/)
15. [Pydantic AI 公式ドキュメント](https://ai.pydantic.dev/)
16. [Pydantic AI GitHub](https://github.com/pydantic/pydantic-ai)
17. [Smol Agents ブログ](https://huggingface.co/blog/smolagents)
18. [Smol Agents GitHub](https://github.com/huggingface/smolagents)
19. [LlamaIndex Workflows ドキュメント](https://docs.llamaindex.ai/en/stable/module_guides/workflow/)
20. [LlamaIndex GitHub](https://github.com/run-llama/llama_index)
21. [Vercel AI SDK 公式ドキュメント](https://sdk.vercel.ai/docs)
22. [Vercel AI SDK GitHub](https://github.com/vercel/ai)
23. [LangSmith](https://www.langchain.com/langsmith)
24. [Langfuse](https://langfuse.com/)
25. [LangChain Korea GitHub](https://github.com/teddylee777/langchain-kr)
현재 단락 (1/335)
2025年末から2026年第1四半期にかけて、エージェントフレームワークの世界は二度の大きな転換を経た。ひとつは **OpenAI Swarm の廃止と OpenAI Agents SDK の GA*...