💡 왼쪽 원문을 읽으면서 오른쪽에 따라 써보세요. Tab 키로 힌트를 받을 수 있습니다.

원문 렌더가 준비되기 전까지 텍스트 가이드로 표시합니다.

はじめに — 2026 年 5 月、材料科学が「AlphaFold モーメント」を通過する

2024 年のノーベル化学賞が David Baker(タンパク質設計)と Demis Hassabis、John Jumper(AlphaFold)に贈られたのは、ただのニュースではなかった。**計算化学とディープラーニング**が学術的に認められた研究方法論になった、という宣言だった。同じ波はタンパク質を越えて、**無機結晶、触媒、電池電極、ポリマー**へと拡大している。

2023 年 11 月に DeepMind GNoME が **220 万個の安定結晶候補**を発表し、2025 年 1 月に Microsoft が生成型結晶モデル **MatterGen** を公開し、同じ四半期に Orbital Materials が GPT スタイルの材料基盤モデル **Orb-v3** をオープンソース化した時点で、盤面は完全に変わった。2026 年 5 月現在、「新素材 1 つを発見する平均コストが 10 年前の 1 万分の 1 に下がった」という推定が真面目に議論されている。iter86 の創薬編に続いて、本稿はその隣接領域である材料科学・化学を見ていく。

なぜ材料 AI が 2026 年の焦点なのか — 発見コストの崩壊

伝統的な材料科学は **推測 → 合成 → 測定** のループで、平均 18-30 年を要してきた。リチウムイオン電池、ペロブスカイト太陽電池、高温超伝導体、いずれも同程度の長さの発見-商用化サイクルを経ている。AI 材料科学がこのループを破ろうとする試みは、次の 3 つの道具を組み合わせる。

- **DFT(密度汎関数理論)シミュレーション**: 量子力学に基づく第一原理計算。正確だが 1 計算に数時間以上。

- **機械学習原子間ポテンシャル(MLIP)**: DFT の精度を保ったまま推論速度を 10^4-10^6 倍加速。

- **生成モデル**: 望む物性を持つ結晶構造を新たに生成する。

この 3 つを連結することで、「物性目標 → 候補構造の生成 → MLIP による高速 1 次評価 → DFT で検証 → 合成」という **逆設計パイプライン**が標準になった。

DeepMind GNoME — 220 万結晶候補が落とした衝撃

**GNoME(Graph Networks for Materials Exploration)** は DeepMind が 2023 年 11 月に Nature 論文で公開した結晶構造発見プロジェクトである。コア結果は 1 行で要約できる。

- **220 万個の新規安定結晶候補**: うち 38 万個が合成可能性が高いと分類。

- **能動学習ループ**: グラフニューラルネットが候補を提案 → DFT が検証 → 検証結果を再び学習。

- **公開**: データは **Materials Project Database** に統合公開。

GNoME が落とした衝撃は単なる数字ではない。**48,000 個**(2023 年時点で人類が把握していた安定無機結晶)から 220 万個へ、ひと段階で 2 桁単位がジャンプした。後続研究として、2024 年に **Berkeley A-Lab** が GNoME 候補のうち 41 個を自動合成に成功し、「AI 発見 + 自動合成」のループを実証した。

DeepMind は GNoME モデル自体は非公開とし、データのみを公開した。しかし同じ発想で作られたオープンモデルが、後続研究者によって急速に登場している状況である。

Microsoft MatterGen — 生成型結晶構造モデルの標準

2025 年 1 月に Microsoft Research が Nature で発表し、同時にオープンソース化した **MatterGen** は、**拡散(diffusion)モデルベースの結晶構造ジェネレータ**である。GNoME が「安定な結晶を発見する」役割だったのに対し、MatterGen は **「望む物性を持つ結晶を設計する」**役割を担う。

- **条件付き生成**: 化学組成、対称性、磁性、バンドギャップ、弾性率などの物性条件を入力に取る。

- **拡散モデル構造**: 結晶座標と格子パラメータにノイズを加えた後、逆拡散。

- **Equivariant GNN バックボーン**: 回転・並進対称性を学習段階で保証。

Microsoft は同じラインアップで **MatterSim** も公開している。MatterSim は MatterGen が生成した構造の安定性・物性を高速に評価するシミュレータの役割を担う。両モデルを束ねた「生成 + 評価」パイプラインを 1 社で完結させている点が大きい。

MatterGen の GitHub リポジトリは MIT ライセンスで公開されている。

MatterGen 推論例(公式 README の擬似コード)

from mattergen.evaluation import StructureValidator

from mattergen.generation import MatterGenPipeline

pipe = MatterGenPipeline.from_pretrained("microsoft/MatterGen")

structures = pipe.sample(

composition={"Li": 1, "Fe": 1, "P": 1, "O": 4},

target_bandgap=2.5,

n_samples=100,

)

validator = StructureValidator.from_pretrained("microsoft/MatterSim")

scored = validator.score(structures)

Orbital Materials Orb-v3 — オープンソース GPT スタイル材料基盤モデル

英国のスタートアップ **Orbital Materials** は、2024-2025 年にかけて **Orb シリーズ**を発表し急浮上した。2025 年末リリースの Orb-v3 は次の特徴を持つ。

- **GPT スタイルのデコーダアーキテクチャ**: 原子シーケンスを自己回帰で生成。

- **数億件の DFT シミュレーションデータ**で学習。

- **物性予測 + 構造生成 + 動力学シミュレーション**を 1 モデルで処理。

- **Apache 2.0 オープンソース**: Hugging Face Hub に重みを公開。

Orbital Materials は「材料科学版 GPT-3 モーメント」を目標として公言している。1 つの巨大な基盤モデルを学習しておき、多様な下流タスクにファインチューニングするパターンを材料科学に移植した、ということだ。

似た流れのモデルとして **DPA-2**(DeepModeling コンソーシアム、中国)、**EquiformerV2**(MIT、Hugging Face)、**PreFerredPotential**(PFN Matlantis 内)がある。2026 年 5 月時点で「材料基盤モデル」は 5-6 個が競合している。

MACE — 機械学習原子間ポテンシャルの精度リーダー

分子動力学(MD)シミュレーションで一番高コストなのは、毎タイムステップでの原子間力の計算である。DFT で直接計算すると 1 シミュレーションに数日かかる。**MLIP(Machine-Learned Interatomic Potential)** はこの力計算をニューラルネットに置き換え、**速度を 4-6 桁加速**する。

**MACE(MACE for Atomistic Simulations)** はケンブリッジ大学 ACEnet グループ製の equivariant MLIP で、2026 年 5 月時点で精度部門のリーダーと評価される。

- **高次多体メッセージパッシング**: 2 体・3 体・4 体相互作用を直接モデル化。

- **E(3) 等変性**: 回転と並進に対する対称性を構造的に保証。

- **マルチ忠実度**: 少ない DFT データでも学習可能。

- **MIT ライセンス**: Cambridge ACEnet の GitHub に公開。

MACE のパフォーマンスは、SPICE データセット、MPtrj(Materials Project 学習スプリット)、OC22/OC20(Open Catalyst)、Matbench で確認されており、いずれも上位に入る。とくに **基盤モデル変種(MACE-MP-0、MACE-MP-2)** は、事前学習済み重みをそのままダウンロードして多様な系に zero-shot 適用できる。

MACE Foundation Model 利用例

from mace.calculators import mace_mp

from ase.build import bulk

atoms = bulk("Si", "diamond", a=5.43)

calc = mace_mp(model="medium", dispersion=False, default_dtype="float32")

atoms.calc = calc

energy = atoms.get_potential_energy()

forces = atoms.get_forces()

NequIP、Allegro — 等変ニューラルポテンシャルのもう 1 つの軸

MACE と並ぶ等変 MLIP の二大軸が **NequIP(Neural Equivariant Interatomic Potentials)** とその後継 **Allegro** である。両方ともハーバード MIT 共同研究グループ(Boris Kozinsky 研)の成果。

- **NequIP**: 等変メッセージパッシング。小さなデータセットで SchNet 比で大幅な精度向上。

- **Allegro**: NequIP の後継。非チェイニング(局所)構造で GPU 並列効率が高い。

- どちらも **MIT ライセンスのオープンソース**。

同じ学習データを与えると、MACE と NequIP/Allegro の精度はしばしば伯仲する。差が出るのは **ハードウェア親和性と学習安定性**である。数万原子規模の大規模系では、メッセージパッシング深さの浅い Allegro の方が速い傾向がある。

DeePMD-kit — 中国発の大規模 MLIP フレームワーク

**DeePMD-kit**(DPMD)は北京計算機科学研究所とプリンストン e-CAS の協力で開発された MLIP フレームワークである。後続管理は **DeepModeling コンソーシアム**(Bohrium、AISI Beijing など)が担う。

- **Deep Potential Smooth Edition(DeepPot-SE)**: 原子座標を滑らかな入力に変換するエンコーディング。

- **DPA-1、DPA-2 基盤モデル**: 数十万の分子・結晶系で事前学習。

- **LAMMPS 統合**: 既存の分子動力学シミュレータにプラグインとして組み込み可能。

- **DP-GEN**: 能動学習ループの自動化ツール。

LLM 側の LLaMA に肩を並べる規模で、DPMD は材料科学 MLIP の「東方軸」として地位を確立した。論文引用数と GitHub スター数ともに、MACE/NequIP と肩を並べる。

SchNet、PaiNN、MatGL、CHGNet — 第 1 世代グラフニューラルポテンシャル

等変 MLIP が登場する前、材料 GNN の標準は **SchNet と PaiNN**(ともにベルリン TU グループ)だった。2026 年でも、軽量系や高速プロトタイプにはまだ使われている。

- **SchNet**: 距離ベースのメッセージパッシング。2017 年提案、分子・結晶ともに適用。

- **PaiNN**: SchNet の方向性拡張。高速・高精度。

- **MatGL/M3GNet**: カリフォルニア大学サンディエゴ校。Materials Project が公式後援。結晶 + 分子の統合モデル。

- **CHGNet**: バークレー LBNL。磁性状態や電荷分布まで学習する。

- **ALIGNN**: NIST JARVIS のラインアップ。ラインググラフエンコーディングを活用。

CHGNet は特に、Materials Project が学習データとして使った全ての磁性・非磁性構造を扱うという点で、「汎用結晶シミュレータ」候補として頻繁に挙げられる。

Materials Project — 公開データベースの皇帝

**Materials Project**(Lawrence Berkeley National Lab + UC Berkeley、Kristin Persson)は 2011 年発足の無機結晶 DFT データベースである。2026 年 5 月時点で、約 **15 万個の無機結晶**の DFT 計算結果を公開している。

- **提供される物性**: 形成エネルギー、バンドギャップ、弾性、磁性、誘電率など数十種類。

- **REST API**: `mp-api` Python ライブラリで直接クエリ可能。

- **MPContribs**: ユーザー寄稿データのトラック。

- **MatGL/M3GNet、CHGNet の学習データ**は主に MP から取得。

Materials Project API 利用例

from mp_api.client import MPRester

with MPRester(api_key="YOUR_KEY") as mpr:

results = mpr.materials.summary.search(

elements=["Li", "Fe", "P", "O"],

formula="LiFePO4",

fields=["material_id", "formula_pretty", "band_gap", "formation_energy_per_atom"],

)

for r in results:

print(r.material_id, r.formula_pretty, r.band_gap)

GNoME が発見した 220 万個の候補は 2024 年以降、徐々に MP に統合されている。つまり MP に行けば GNoME 結果をクエリできる。

OQMD、AFLOW、NOMAD、JARVIS — 公開 DB の 4 兄弟

Materials Project 以外にも、無機材料の公開 DB は 4 つある。

- **OQMD(Open Quantum Materials Database)**: ノースウェスタン大。100 万件以上の DFT 計算。合金中心。

- **AFLOWlib**: デューク大。自動化 DFT ワークフローの結果。Inorganic Crystal Structure Database(ICSD)と深く連携。

- **NOMAD**: マックスプランク + EU FAIR-DI コンソーシアム。あらゆる DFT コードの結果を統合保存。

- **JARVIS(Joint Automated Repository for Various Integrated Simulations)**: NIST。結晶 + 2D 材料 + 磁性 + トポロジカルなど幅広く扱う。

各 DB の強みは異なる。合金検索は OQMD、2D 材料は JARVIS、複数コード互換性は NOMAD、最初の入口は Materials Project が一般的である。

Citrine Informatics — エンタープライズ材料 AI の標準

**Citrine Informatics**(2013 年設立、本社カリフォルニア)は材料科学 AI をエンタープライズに販売する会社である。2026 年 5 月時点で、BASF、Panasonic、Boeing、Saint-Gobain など数十社のグローバル化学・素材企業の R&D パートナーである。

- **Citrination プラットフォーム**: データ取り込み + 能動学習 + 候補推薦 + 実験設計。

- **Pythonic SDK**: `citrine-python` でデータモデル定義と実験設計が可能。

- **オンプレミス + SaaS の両提供**: 化学・素材会社のセキュリティ要件に対応。

Citrine は「AI 発見」よりも **「意思決定の自動化」**に重点を置く。会社が抱える社内データ(特許、実験記録、シミュレーション結果)をすべて集めて意思決定モデルにする、というのが本質である。

類似ポジションの競合として **Materials Zone(イスラエル)**、**Uncountable(米国)**、**Phaseshift(米国)** がある。

Schrödinger — NASDAQ 上場の創薬・材料 AI 強者

**Schrödinger(NASDAQ: SDGR)** は 1990 年設立の量子化学ソフトウェア会社として出発した。2026 年 5 月時点で時価総額約 80 億ドル規模の上場企業であり、**創薬発見 + 材料発見**の 2 トラックを並行運営している。

- **Maestro**: 分子モデリング GUI 環境。

- **Jaguar**: 量子化学計算エンジン(DFT、MP2 など)。

- **Materials Science Suite**: ポリマー、OLED、電池電解液など材料トラック。

- **LiveDesign**: 創薬向けクラウド協業環境。

Schrödinger は自社創薬候補(SGR-1505、SGR-2921 など)を臨床まで進める一方で、大手製薬(BMS、J&J、武田)との協業 R&D 契約を結ぶ。売上の相当部分が **ソフトウェアライセンス + 創薬協業マイルストン**から生じる。

RoseTTAFold All-Atom — タンパク質と材料を 1 モデルに統合

2024 年 5 月に David Baker グループ(ワシントン大学 IPD)が Science に発表した **RoseTTAFold All-Atom(RFAA)** は、タンパク質・核酸・小分子・金属イオン・共有結合修飾を **すべて 1 モデルで**予測する。タンパク質のみを扱った RoseTTAFold 2 の後継である。

- 単一モデルで **タンパク質-薬剤ドッキング、核酸-タンパク質複合体、抗原-抗体複合体**を処理。

- **AlphaFold 3 と同時期に競合**: AF3 が非商用ライセンスを敷くなか、RFAA は学術 + 非商用利用をより広く認める。

- **RoseTTAFold Diffusion(RFdiffusion)**: タンパク質生成モデル。新たな結合体を設計する。

David Baker は RoseTTAFold + RFdiffusion + タンパク質設計パラダイムで 2024 年ノーベル化学賞を共同受賞した。iter86 創薬編で、タンパク質側はより深く扱っている。

Boltz-1、Chai-1、ESM-3 — AlphaFold 3 のオープン代替ラインアップ

AlphaFold 3 が 2024 年 5 月に Nature に登場した直後、**オープンソースの代替**が一気に出てきた。

- **Boltz-1**(MIT、2024 年 11 月): AlphaFold 3 に匹敵するタンパク質-リガンド複合体予測。MIT ライセンス。

- **Boltz-2**(2025 年後半): 親和性(affinity)予測まで統合。

- **Chai-1**(Chai Discovery、2024): 営利スタートアップによるオープン重みモデル。

- **ESM-3**(EvolutionaryScale、Meta FAIR スピンオフ): タンパク質シーケンス・構造・機能を統合した LLM。

- **OpenFold**: AlphaFold 2 のオープン再実装。Columbia + AQEMIA の協力。

- **ColabFold**: AlphaFold/RoseTTAFold を Google Colab で実行可能にした人気ツール。

2026 年 5 月時点では **Boltz-2** が学術界で最も頻繁に引用される AF3 代替である。Chai-1 は商用創薬ワークフローでの採用が多い。

Atomwise、Isomorphic Labs、Genesis Therapeutics — AI 創薬の二大トラック

材料科学と分子設計の境界に位置する **AI 創薬**会社は別途整理する。iter86 創薬編の補足として、短くまとめる。

- **Isomorphic Labs**(2021 年分社、Alphabet 傘下): DeepMind から分社した創薬会社。AlphaFold 3 のコアチームが合流。Novartis、Eli Lilly と協業契約。

- **Atomwise**(2012 年設立、サンフランシスコ): AtomNet 畳み込みネットワークによるドッキング。数十の臨床候補。

- **Genesis Therapeutics**(スタンフォードスピンアウト、2019): GEMS プラットフォーム。グラフニューラルネット分子設計。Genentech と協業。

- **Recursion Pharmaceuticals(NASDAQ: RXRX)**: 表現型スクリーニング + AI。NVIDIA が 5 千万ドル投資。

- **Exscientia**(NASDAQ 合併後 Recursion に吸収): 自動化創薬設計。

- **Insitro**(2018 年設立、Daphne Koller): ML + 誘導多能性幹細胞(iPSC)を組み合わせた新薬。

これらは材料科学会社というより **AI 創薬**が本業だが、同じ分子シミュレーション + グラフニューラルネット + 生成モデルスタックを共有する。

DFT + AI — VASP、Quantum ESPRESSO、JAX-DFT、DM21

古典的な DFT ツールは依然として材料科学のバックボーンである。AI はこれらを **置き換える**のではなく **加速する**役割で合流する。

- **VASP(Vienna Ab initio Simulation Package)**: 独自ライセンス。企業と国研の標準。

- **Quantum ESPRESSO**: GPL オープンソース。学界の標準。

- **Gaussian、ORCA、Psi4**: 分子量子化学用。

- **CP2K、ABINIT**: 結晶・表面シミュレーション。

- **JAX-DFT**(Google DeepMind、2024): 自動微分に優しい DFT 実装。

- **DM21**(DeepMind、2021): 機械学習による交換相関汎関数。精度向上を実現。

ASE(Atomic Simulation Environment、Python)は上記ツール群を **共通インターフェース**で束ねる標準ライブラリである。2026 年でも ASE 抜きの材料科学は想像しがたい。

合成経路計画 — IBM RXN、AiZynthFinder、Synthia、Postera

創薬・素材候補の分子が見つかれば、次のステップは **合成経路**である。どの出発物質からどの反応を経て作れるかを AI が予測する。

- **IBM RXN for Chemistry**: Transformer ベースの retrosynthesis。IBM Cloud SaaS。

- **AiZynthFinder**(AstraZeneca、2020 オープン化): モンテカルロ木探索 + ニューラルネット。MIT ライセンス。

- **Synthia(旧 SciFinder Synthia)**: CAS の商用 retrosynthesis。

- **Postera Manifold**: COVID-19 Moonshot プロジェクト発。商用 SaaS。

- **Molecule.one**: ポーランドのスタートアップ。合成可能性スコア + 経路予測。

retrosynthesis モデルの精度は 2026 年時点で「専門化学者レベル」に迫ると評価される。AiZynthFinder はオープンソース公開で、学術研究で最も頻繁に登場する。

AiZynthFinder の利用例

from aizynthfinder.aizynthfinder import AiZynthFinder

filename = "config.yml"

finder = AiZynthFinder(configfile=filename)

finder.stock.select("zinc")

finder.expansion_policy.select("uspto")

finder.target_smiles = "Cn1cnc2c1c(=O)n(C)c(=O)n2C"

finder.tree_search()

finder.build_routes()

print(finder.routes[0].metadata)

自動化合成ラボ — Strateos、Emerald Cloud Labs、OpenTrons

AI が候補を推薦し合成経路を組めば、**実際に合成してみる段階**が残る。2026 年の自動化合成ラボは次の 2 系統に分かれる。

- **クラウドラボ**: 実験をコードで書けば遠隔施設が自動実行。**Strateos**(旧 Transcriptic)と **Emerald Cloud Lab** が二強。

- **デスクトップ自動化**: 研究室に設置する自動化機器。**OpenTrons**(液体ハンドリングのオープンハードウェア)、**Chemspeed**(商用)。

- **自律合成ロボット**: AI の意思決定 + ロボットアーム。**Berkeley A-Lab**、**リバプール大学のモバイル化学ロボット**。

A-Lab は GNoME 候補 41 個を 17 日間で自動合成に成功して話題になった(Nature 2023)。この流れは「AI が発見 → 自動合成 → データを再学習」という自己発展ループを完成させる核心である。

電池・エネルギー材料 — 固体電池と分子シミュレーション

電池は材料科学 AI の最大の応用分野である。注目どころは以下。

- **固体電解質**: A123 Systems、QuantumScape、Solid Power。AI が新しい固体電解質候補を発掘。

- **Form Energy**: 鉄空気の長時間貯蔵。素材候補スクリーニングに ML を積極活用(iter96 エネルギー編)。

- **DeepMind 電池協業**: 2024 年に LBNL と結晶・電解質協業。GNoME 結果を活用。

- **Toyota Research Institute(TRI)**: 2017 年から ML 加速電池発見プログラム。UC Berkeley + Stanford + MIT と協業。

電池は「材料 + セル設計 + サイクル寿命 + 安全性」をすべて扱う必要があるため、MLIP だけでは不十分で、**電気化学 + 熱力学 + 機械工学のシミュレーション**を組み合わせる必要がある。Citrine や Materials Zone のような会社がこの統合シミュレーション領域を狙っている。

米国 Materials Genome Initiative + EU Battery 2030+

政府単位の材料 AI プログラムは、米国と EU が最もよく整理されている。

- **US MGI 2.0**(2021 年発表): NIST 主導。データ標準化 + AI/ML 統合 + 人材育成。

- **NIST JARVIS**、**MGI Hub**: MGI 配下のデータ・ツールインフラ。

- **EU Battery 2030+**: 2020 年発表、2030 年までの電池 R&D 加速ロードマップ。

- **EU NOMAD Lab**: 多国籍 DFT データ統合。

- **EU AI4Industry**: 産業 AI コンソーシアム。

各プログラムの核は **データ標準 + オープンツール + 産学協同**である。米国がデータとツールを作って企業が応用するのに対し、EU は同じツールを共有しつつ産業転換にもっと比重を置く。

韓国の材料 AI — KIST、KIMS、POSTECH、サムスン、LG

韓国の材料 AI エコシステムは次の軸で構成される。

- **韓国科学技術研究院(KIST)人工知能研究団**: AI 材料発見トラック。電池・触媒応用。

- **韓国材料研究院(KIMS)**: 合金、磁性、セラミックドメイン。韓国材料ゲノムイニシアチブ(KMGI)主導。

- **POSTECH 新素材工学科**: 材料 AI トラック。Han Yong Kim グループなど。

- **KAIST 生命化学工学科 + 新素材工学科**: 分子・電池 ML 研究。

- **サムスン SDI / LG エナジーソリューション / SK オン**: 電池材料 AI。自社データ + Citrine・Schrödinger との協業。

- **サムスン総合技術院**: 半導体・ディスプレイ新素材 AI。

- **LG 化学未来技術センター**: ポリマー・バイオ化学 AI。

- **SK ハイニックス HBM 材料 AI トラック**: HBM インターコネクト・熱界面材料の最適化。

韓国政府も 2023 年から「韓国型材料ゲノムイニシアチブ」予算を本格増額している。2026 年 5 月時点で KMGI 配下のデータプラットフォーム(MaPS)がベータ運営中である。

日本の材料 AI — NIMS、PFN Matlantis、AIST、三菱ケミカル

日本は材料 AI において政府 + 大企業 + 大学の連携が特に緻密である。

- **NIMS(国立物質・材料研究機構)**: 日本の材料研究の本山。1956 年設立。MI2I(Materials Integration by Network Initiative)プログラムを主導。

- **AIST(産業技術総合研究所)**: AI4Materials コンソーシアム。

- **東京大学 + 京都大学 + 東北大学**: 材料情報学(MI)学科が定着。

- **三菱ケミカルホールディングス + Preferred Networks(PFN)**: 2021 年に合弁 **Matlantis** を発表。PFN の PreFerredPotential 基盤モデルをクラウド SaaS として提供。

- **旭化成、昭和電工、東レ、住友化学**: 自社 ML 材料グループを保有。

- **Toyota Research Institute(TRI、米国カリフォルニア)**: 日系資本による米国 AI 材料拠点。

Matlantis は特に注目に値する。学術ツールではなく **商用 SaaS** で MLIP を提供した最初のグローバルサービスである。化学・素材会社が API でシミュレーションを依頼し結果を受け取るモデルだ。

化学情報学ライブラリ — RDKit、DeepChem、PyG、e3nn

分子・結晶を扱う Python 標準ライブラリは次の 4 つである。

- **RDKit**: BSD ライセンス。分子 SMILES/SDF パース、フィンガープリント、可視化。化学情報学の定石。

- **DeepChem**: Vijay Pande(元スタンフォード)グループ発。化学 ML ワークフロー統合。

- **PyG(PyTorch Geometric)**: グラフニューラルネット汎用ライブラリ。分子・結晶でよく利用。

- **e3nn**: 等変ニューラルネットライブラリ。MACE、NequIP、Allegro のバックエンド。

- **ASE(Atomic Simulation Environment)**: 上で触れたシミュレーションコードを統合する標準。

- **Pymatgen**: Materials Project の公式 Python ライブラリ。結晶構造の操作。

- **PySCF**: 量子化学の Python 実装。分子 DFT/HF 計算。

RDKit 分子フィンガープリント例

from rdkit import Chem

from rdkit.Chem import AllChem

mol = Chem.MolFromSmiles("CC(=O)OC1=CC=CC=C1C(=O)O") # アスピリン

fp = AllChem.GetMorganFingerprintAsBitVect(mol, radius=2, nBits=2048)

print(f"fingerprint bits set: {sum(fp)}")

学会・ワークショップ — MRS、ACS、NeurIPS AI4Mat

材料 AI 研究が発表される主要な舞台は以下のとおり。

- **MRS Spring/Fall Meeting**: Materials Research Society。材料科学全般。

- **ACS National Meeting**: American Chemical Society。化学 + 材料統合。

- **APS March Meeting**: American Physical Society。凝縮系物理中心。

- **NeurIPS AI4Mat ワークショップ**: 2022 年から毎年開催。ML 側から見た材料科学。

- **ICML AI4Science**: 同分野の ICML トラック。

- **AI for Science Workshop(ICLR、NeurIPS)**。

- **MGI Annual Meeting**、**日本化学会年会**、**韓国材料学会春秋季**などの地域学会。

学会トレンドは明確だ。**純 ML 学会(NeurIPS、ICML)で材料トラックが急成長**する一方、伝統的な材料学会(MRS、ACS)は ML セッションを本トラックに編入する流れである。

限界と課題 — AI 材料科学がまだ解けていないもの

2026 年 5 月時点で AI 材料科学はなお以下の限界を抱える。

- **合成可能性と安定性のギャップ**: GNoME 候補 220 万個のうち、実際に合成されたのは数十〜数百個レベル。「仮想で安定」と「実際に合成可能」は同義ではない。

- **データバイアス**: DFT データは単純結晶中心。非結晶材料(ガラス、ポリマー、合金)、欠陥、表面、界面はデータ不足。

- **有機材料の精度**: 無機結晶に比べて OLED、ポリマー、薬物分子の ML 予測精度はまだ不十分。

- **磁性・強相関系**: DFT 自体の限界で、磁性・高温超伝導・強相関系では信頼度が落ちる。

- **ブラックボックス懸念**: 生成モデルがなぜその構造を推薦したかの説明力が弱い。

- **再現性危機**: 学習データ、コード、ハイパーパラメータがすべて公開される必要がある。OSS 化が進んでいるが 100% ではない。

これらの限界がどのスピードで解けるかが、「材料 AlphaFold モーメント」がどこまで行くかを決める。

おわりに — 2026 年 5 月、「推測の時代」が終わりつつある

本稿の出発点は単純な問いだった。「材料科学にも AlphaFold のような出来事は起きうるか」。2026 年 5 月の答えは「すでに起きている」である。GNoME の 220 万候補、MatterGen の条件付き生成、Orb-v3 のオープン基盤、MACE/NequIP の MLIP、Materials Project インフラ、A-Lab の自動合成ロボット — これらすべてのピースが 2-3 年の間にそろった。

残った課題は **これらのツールをいかに産業転換につなげるか**である。学術論文ではなく、実際の電池セル、実際の抗がん剤、実際の OLED パネルが出てこなければならない。だからこそ Citrine・Schrödinger・Matlantis のような **商用ブリッジ(commercial bridge)** が今後 5 年の核心変数になる。

材料科学に携わる人にとって、今は最も変動性の高い時期である。同時に最も報酬が大きい時期でもある。AI ツールを恐れず、自分のドメイン知識の上に一層乗せて使う人が、もっとも早く成果を出す。

References

- DeepMind GNoME 論文: https://www.nature.com/articles/s41586-023-06735-9

- Microsoft MatterGen GitHub: https://github.com/microsoft/mattergen

- Microsoft MatterSim 発表: https://www.microsoft.com/en-us/research/blog/mattersim-a-deep-learning-atomistic-model-across-elements-temperatures-and-pressures/

- Orbital Materials Orb シリーズ GitHub: https://github.com/orbital-materials/orb-models

- MACE GitHub(Cambridge ACEnet): https://github.com/ACEsuit/mace

- NequIP GitHub(Harvard MIT): https://github.com/mir-group/nequip

- Allegro GitHub: https://github.com/mir-group/allegro

- DeePMD-kit 公式サイト: https://docs.deepmodeling.com/projects/deepmd/en/master/

- SchNetPack GitHub: https://github.com/atomistic-machine-learning/schnetpack

- M3GNet GitHub: https://github.com/materialsvirtuallab/m3gnet

- CHGNet GitHub: https://github.com/CederGroupHub/chgnet

- Materials Project 公式サイト: https://materialsproject.org/

- OQMD 公式サイト: https://oqmd.org/

- AFLOWlib 公式サイト: https://aflowlib.org/

- NOMAD Repository: https://nomad-lab.eu/

- NIST JARVIS: https://jarvis.nist.gov/

- Citrine Informatics 公式サイト: https://citrine.io/

- Schrödinger 公式サイト: https://www.schrodinger.com/

- RoseTTAFold All-Atom 論文: https://www.science.org/doi/10.1126/science.adl2528

- Boltz-1 GitHub(MIT): https://github.com/jwohlwend/boltz

- Chai-1 発表: https://www.chaidiscovery.com/blog/introducing-chai-1

- ESM-3 発表(EvolutionaryScale): https://www.evolutionaryscale.ai/blog/esm3-release

- IBM RXN for Chemistry: https://rxn.app.accelerate.science/

- AiZynthFinder GitHub: https://github.com/MolecularAI/aizynthfinder

- Berkeley A-Lab 論文: https://www.nature.com/articles/s41586-023-06734-w

- Materials Genome Initiative: https://www.mgi.gov/

- NIMS MI2I: https://www.nims.go.jp/MII-I/en/

- Preferred Networks Matlantis: https://matlantis.com/

- RDKit 公式ドキュメント: https://www.rdkit.org/docs/

- Pymatgen 公式ドキュメント: https://pymatgen.org/

- e3nn 公式ドキュメント: https://docs.e3nn.org/