Skip to content
Published on

AI 材料科学・化学 2026 完全ガイド - DeepMind GNoME / Microsoft MatterGen / Orbital Materials / Citrine Informatics / Schrödinger / RoseTTAFold All-Atom / Boltz-1 / MACE / NequIP / DPMD 徹底解説

Authors

はじめに — 2026 年 5 月、材料科学が「AlphaFold モーメント」を通過する

2024 年のノーベル化学賞が David Baker(タンパク質設計)と Demis Hassabis、John Jumper(AlphaFold)に贈られたのは、ただのニュースではなかった。計算化学とディープラーニングが学術的に認められた研究方法論になった、という宣言だった。同じ波はタンパク質を越えて、無機結晶、触媒、電池電極、ポリマーへと拡大している。

2023 年 11 月に DeepMind GNoME が 220 万個の安定結晶候補を発表し、2025 年 1 月に Microsoft が生成型結晶モデル MatterGen を公開し、同じ四半期に Orbital Materials が GPT スタイルの材料基盤モデル Orb-v3 をオープンソース化した時点で、盤面は完全に変わった。2026 年 5 月現在、「新素材 1 つを発見する平均コストが 10 年前の 1 万分の 1 に下がった」という推定が真面目に議論されている。iter86 の創薬編に続いて、本稿はその隣接領域である材料科学・化学を見ていく。

なぜ材料 AI が 2026 年の焦点なのか — 発見コストの崩壊

伝統的な材料科学は 推測 → 合成 → 測定 のループで、平均 18-30 年を要してきた。リチウムイオン電池、ペロブスカイト太陽電池、高温超伝導体、いずれも同程度の長さの発見-商用化サイクルを経ている。AI 材料科学がこのループを破ろうとする試みは、次の 3 つの道具を組み合わせる。

  • DFT(密度汎関数理論)シミュレーション: 量子力学に基づく第一原理計算。正確だが 1 計算に数時間以上。
  • 機械学習原子間ポテンシャル(MLIP): DFT の精度を保ったまま推論速度を 10^4-10^6 倍加速。
  • 生成モデル: 望む物性を持つ結晶構造を新たに生成する。

この 3 つを連結することで、「物性目標 → 候補構造の生成 → MLIP による高速 1 次評価 → DFT で検証 → 合成」という 逆設計パイプラインが標準になった。

DeepMind GNoME — 220 万結晶候補が落とした衝撃

GNoME(Graph Networks for Materials Exploration) は DeepMind が 2023 年 11 月に Nature 論文で公開した結晶構造発見プロジェクトである。コア結果は 1 行で要約できる。

  • 220 万個の新規安定結晶候補: うち 38 万個が合成可能性が高いと分類。
  • 能動学習ループ: グラフニューラルネットが候補を提案 → DFT が検証 → 検証結果を再び学習。
  • 公開: データは Materials Project Database に統合公開。

GNoME が落とした衝撃は単なる数字ではない。48,000 個(2023 年時点で人類が把握していた安定無機結晶)から 220 万個へ、ひと段階で 2 桁単位がジャンプした。後続研究として、2024 年に Berkeley A-Lab が GNoME 候補のうち 41 個を自動合成に成功し、「AI 発見 + 自動合成」のループを実証した。

DeepMind は GNoME モデル自体は非公開とし、データのみを公開した。しかし同じ発想で作られたオープンモデルが、後続研究者によって急速に登場している状況である。

Microsoft MatterGen — 生成型結晶構造モデルの標準

2025 年 1 月に Microsoft Research が Nature で発表し、同時にオープンソース化した MatterGen は、拡散(diffusion)モデルベースの結晶構造ジェネレータである。GNoME が「安定な結晶を発見する」役割だったのに対し、MatterGen は **「望む物性を持つ結晶を設計する」**役割を担う。

  • 条件付き生成: 化学組成、対称性、磁性、バンドギャップ、弾性率などの物性条件を入力に取る。
  • 拡散モデル構造: 結晶座標と格子パラメータにノイズを加えた後、逆拡散。
  • Equivariant GNN バックボーン: 回転・並進対称性を学習段階で保証。

Microsoft は同じラインアップで MatterSim も公開している。MatterSim は MatterGen が生成した構造の安定性・物性を高速に評価するシミュレータの役割を担う。両モデルを束ねた「生成 + 評価」パイプラインを 1 社で完結させている点が大きい。

MatterGen の GitHub リポジトリは MIT ライセンスで公開されている。

# MatterGen 推論例(公式 README の擬似コード)
from mattergen.evaluation import StructureValidator
from mattergen.generation import MatterGenPipeline

pipe = MatterGenPipeline.from_pretrained("microsoft/MatterGen")
structures = pipe.sample(
    composition={"Li": 1, "Fe": 1, "P": 1, "O": 4},
    target_bandgap=2.5,
    n_samples=100,
)

validator = StructureValidator.from_pretrained("microsoft/MatterSim")
scored = validator.score(structures)

Orbital Materials Orb-v3 — オープンソース GPT スタイル材料基盤モデル

英国のスタートアップ Orbital Materials は、2024-2025 年にかけて Orb シリーズを発表し急浮上した。2025 年末リリースの Orb-v3 は次の特徴を持つ。

  • GPT スタイルのデコーダアーキテクチャ: 原子シーケンスを自己回帰で生成。
  • 数億件の DFT シミュレーションデータで学習。
  • 物性予測 + 構造生成 + 動力学シミュレーションを 1 モデルで処理。
  • Apache 2.0 オープンソース: Hugging Face Hub に重みを公開。

Orbital Materials は「材料科学版 GPT-3 モーメント」を目標として公言している。1 つの巨大な基盤モデルを学習しておき、多様な下流タスクにファインチューニングするパターンを材料科学に移植した、ということだ。

似た流れのモデルとして DPA-2(DeepModeling コンソーシアム、中国)、EquiformerV2(MIT、Hugging Face)、PreFerredPotential(PFN Matlantis 内)がある。2026 年 5 月時点で「材料基盤モデル」は 5-6 個が競合している。

MACE — 機械学習原子間ポテンシャルの精度リーダー

分子動力学(MD)シミュレーションで一番高コストなのは、毎タイムステップでの原子間力の計算である。DFT で直接計算すると 1 シミュレーションに数日かかる。MLIP(Machine-Learned Interatomic Potential) はこの力計算をニューラルネットに置き換え、速度を 4-6 桁加速する。

MACE(MACE for Atomistic Simulations) はケンブリッジ大学 ACEnet グループ製の equivariant MLIP で、2026 年 5 月時点で精度部門のリーダーと評価される。

  • 高次多体メッセージパッシング: 2 体・3 体・4 体相互作用を直接モデル化。
  • E(3) 等変性: 回転と並進に対する対称性を構造的に保証。
  • マルチ忠実度: 少ない DFT データでも学習可能。
  • MIT ライセンス: Cambridge ACEnet の GitHub に公開。

MACE のパフォーマンスは、SPICE データセット、MPtrj(Materials Project 学習スプリット)、OC22/OC20(Open Catalyst)、Matbench で確認されており、いずれも上位に入る。とくに 基盤モデル変種(MACE-MP-0、MACE-MP-2) は、事前学習済み重みをそのままダウンロードして多様な系に zero-shot 適用できる。

# MACE Foundation Model 利用例
from mace.calculators import mace_mp
from ase.build import bulk

atoms = bulk("Si", "diamond", a=5.43)
calc = mace_mp(model="medium", dispersion=False, default_dtype="float32")
atoms.calc = calc
energy = atoms.get_potential_energy()
forces = atoms.get_forces()

NequIP、Allegro — 等変ニューラルポテンシャルのもう 1 つの軸

MACE と並ぶ等変 MLIP の二大軸が NequIP(Neural Equivariant Interatomic Potentials) とその後継 Allegro である。両方ともハーバード MIT 共同研究グループ(Boris Kozinsky 研)の成果。

  • NequIP: 等変メッセージパッシング。小さなデータセットで SchNet 比で大幅な精度向上。
  • Allegro: NequIP の後継。非チェイニング(局所)構造で GPU 並列効率が高い。
  • どちらも MIT ライセンスのオープンソース

同じ学習データを与えると、MACE と NequIP/Allegro の精度はしばしば伯仲する。差が出るのは ハードウェア親和性と学習安定性である。数万原子規模の大規模系では、メッセージパッシング深さの浅い Allegro の方が速い傾向がある。

DeePMD-kit — 中国発の大規模 MLIP フレームワーク

DeePMD-kit(DPMD)は北京計算機科学研究所とプリンストン e-CAS の協力で開発された MLIP フレームワークである。後続管理は DeepModeling コンソーシアム(Bohrium、AISI Beijing など)が担う。

  • Deep Potential Smooth Edition(DeepPot-SE): 原子座標を滑らかな入力に変換するエンコーディング。
  • DPA-1、DPA-2 基盤モデル: 数十万の分子・結晶系で事前学習。
  • LAMMPS 統合: 既存の分子動力学シミュレータにプラグインとして組み込み可能。
  • DP-GEN: 能動学習ループの自動化ツール。

LLM 側の LLaMA に肩を並べる規模で、DPMD は材料科学 MLIP の「東方軸」として地位を確立した。論文引用数と GitHub スター数ともに、MACE/NequIP と肩を並べる。

SchNet、PaiNN、MatGL、CHGNet — 第 1 世代グラフニューラルポテンシャル

等変 MLIP が登場する前、材料 GNN の標準は SchNet と PaiNN(ともにベルリン TU グループ)だった。2026 年でも、軽量系や高速プロトタイプにはまだ使われている。

  • SchNet: 距離ベースのメッセージパッシング。2017 年提案、分子・結晶ともに適用。
  • PaiNN: SchNet の方向性拡張。高速・高精度。
  • MatGL/M3GNet: カリフォルニア大学サンディエゴ校。Materials Project が公式後援。結晶 + 分子の統合モデル。
  • CHGNet: バークレー LBNL。磁性状態や電荷分布まで学習する。
  • ALIGNN: NIST JARVIS のラインアップ。ラインググラフエンコーディングを活用。

CHGNet は特に、Materials Project が学習データとして使った全ての磁性・非磁性構造を扱うという点で、「汎用結晶シミュレータ」候補として頻繁に挙げられる。

Materials Project — 公開データベースの皇帝

Materials Project(Lawrence Berkeley National Lab + UC Berkeley、Kristin Persson)は 2011 年発足の無機結晶 DFT データベースである。2026 年 5 月時点で、約 15 万個の無機結晶の DFT 計算結果を公開している。

  • 提供される物性: 形成エネルギー、バンドギャップ、弾性、磁性、誘電率など数十種類。
  • REST API: mp-api Python ライブラリで直接クエリ可能。
  • MPContribs: ユーザー寄稿データのトラック。
  • MatGL/M3GNet、CHGNet の学習データは主に MP から取得。
# Materials Project API 利用例
from mp_api.client import MPRester

with MPRester(api_key="YOUR_KEY") as mpr:
    results = mpr.materials.summary.search(
        elements=["Li", "Fe", "P", "O"],
        formula="LiFePO4",
        fields=["material_id", "formula_pretty", "band_gap", "formation_energy_per_atom"],
    )
    for r in results:
        print(r.material_id, r.formula_pretty, r.band_gap)

GNoME が発見した 220 万個の候補は 2024 年以降、徐々に MP に統合されている。つまり MP に行けば GNoME 結果をクエリできる。

OQMD、AFLOW、NOMAD、JARVIS — 公開 DB の 4 兄弟

Materials Project 以外にも、無機材料の公開 DB は 4 つある。

  • OQMD(Open Quantum Materials Database): ノースウェスタン大。100 万件以上の DFT 計算。合金中心。
  • AFLOWlib: デューク大。自動化 DFT ワークフローの結果。Inorganic Crystal Structure Database(ICSD)と深く連携。
  • NOMAD: マックスプランク + EU FAIR-DI コンソーシアム。あらゆる DFT コードの結果を統合保存。
  • JARVIS(Joint Automated Repository for Various Integrated Simulations): NIST。結晶 + 2D 材料 + 磁性 + トポロジカルなど幅広く扱う。

各 DB の強みは異なる。合金検索は OQMD、2D 材料は JARVIS、複数コード互換性は NOMAD、最初の入口は Materials Project が一般的である。

Citrine Informatics — エンタープライズ材料 AI の標準

Citrine Informatics(2013 年設立、本社カリフォルニア)は材料科学 AI をエンタープライズに販売する会社である。2026 年 5 月時点で、BASF、Panasonic、Boeing、Saint-Gobain など数十社のグローバル化学・素材企業の R&D パートナーである。

  • Citrination プラットフォーム: データ取り込み + 能動学習 + 候補推薦 + 実験設計。
  • Pythonic SDK: citrine-python でデータモデル定義と実験設計が可能。
  • オンプレミス + SaaS の両提供: 化学・素材会社のセキュリティ要件に対応。

Citrine は「AI 発見」よりも **「意思決定の自動化」**に重点を置く。会社が抱える社内データ(特許、実験記録、シミュレーション結果)をすべて集めて意思決定モデルにする、というのが本質である。

類似ポジションの競合として Materials Zone(イスラエル)Uncountable(米国)Phaseshift(米国) がある。

Schrödinger — NASDAQ 上場の創薬・材料 AI 強者

Schrödinger(NASDAQ: SDGR) は 1990 年設立の量子化学ソフトウェア会社として出発した。2026 年 5 月時点で時価総額約 80 億ドル規模の上場企業であり、創薬発見 + 材料発見の 2 トラックを並行運営している。

  • Maestro: 分子モデリング GUI 環境。
  • Jaguar: 量子化学計算エンジン(DFT、MP2 など)。
  • Materials Science Suite: ポリマー、OLED、電池電解液など材料トラック。
  • LiveDesign: 創薬向けクラウド協業環境。

Schrödinger は自社創薬候補(SGR-1505、SGR-2921 など)を臨床まで進める一方で、大手製薬(BMS、J&J、武田)との協業 R&D 契約を結ぶ。売上の相当部分が ソフトウェアライセンス + 創薬協業マイルストンから生じる。

RoseTTAFold All-Atom — タンパク質と材料を 1 モデルに統合

2024 年 5 月に David Baker グループ(ワシントン大学 IPD)が Science に発表した RoseTTAFold All-Atom(RFAA) は、タンパク質・核酸・小分子・金属イオン・共有結合修飾を すべて 1 モデルで予測する。タンパク質のみを扱った RoseTTAFold 2 の後継である。

  • 単一モデルで タンパク質-薬剤ドッキング、核酸-タンパク質複合体、抗原-抗体複合体を処理。
  • AlphaFold 3 と同時期に競合: AF3 が非商用ライセンスを敷くなか、RFAA は学術 + 非商用利用をより広く認める。
  • RoseTTAFold Diffusion(RFdiffusion): タンパク質生成モデル。新たな結合体を設計する。

David Baker は RoseTTAFold + RFdiffusion + タンパク質設計パラダイムで 2024 年ノーベル化学賞を共同受賞した。iter86 創薬編で、タンパク質側はより深く扱っている。

Boltz-1、Chai-1、ESM-3 — AlphaFold 3 のオープン代替ラインアップ

AlphaFold 3 が 2024 年 5 月に Nature に登場した直後、オープンソースの代替が一気に出てきた。

  • Boltz-1(MIT、2024 年 11 月): AlphaFold 3 に匹敵するタンパク質-リガンド複合体予測。MIT ライセンス。
  • Boltz-2(2025 年後半): 親和性(affinity)予測まで統合。
  • Chai-1(Chai Discovery、2024): 営利スタートアップによるオープン重みモデル。
  • ESM-3(EvolutionaryScale、Meta FAIR スピンオフ): タンパク質シーケンス・構造・機能を統合した LLM。
  • OpenFold: AlphaFold 2 のオープン再実装。Columbia + AQEMIA の協力。
  • ColabFold: AlphaFold/RoseTTAFold を Google Colab で実行可能にした人気ツール。

2026 年 5 月時点では Boltz-2 が学術界で最も頻繁に引用される AF3 代替である。Chai-1 は商用創薬ワークフローでの採用が多い。

Atomwise、Isomorphic Labs、Genesis Therapeutics — AI 創薬の二大トラック

材料科学と分子設計の境界に位置する AI 創薬会社は別途整理する。iter86 創薬編の補足として、短くまとめる。

  • Isomorphic Labs(2021 年分社、Alphabet 傘下): DeepMind から分社した創薬会社。AlphaFold 3 のコアチームが合流。Novartis、Eli Lilly と協業契約。
  • Atomwise(2012 年設立、サンフランシスコ): AtomNet 畳み込みネットワークによるドッキング。数十の臨床候補。
  • Genesis Therapeutics(スタンフォードスピンアウト、2019): GEMS プラットフォーム。グラフニューラルネット分子設計。Genentech と協業。
  • Recursion Pharmaceuticals(NASDAQ: RXRX): 表現型スクリーニング + AI。NVIDIA が 5 千万ドル投資。
  • Exscientia(NASDAQ 合併後 Recursion に吸収): 自動化創薬設計。
  • Insitro(2018 年設立、Daphne Koller): ML + 誘導多能性幹細胞(iPSC)を組み合わせた新薬。

これらは材料科学会社というより AI 創薬が本業だが、同じ分子シミュレーション + グラフニューラルネット + 生成モデルスタックを共有する。

DFT + AI — VASP、Quantum ESPRESSO、JAX-DFT、DM21

古典的な DFT ツールは依然として材料科学のバックボーンである。AI はこれらを 置き換えるのではなく 加速する役割で合流する。

  • VASP(Vienna Ab initio Simulation Package): 独自ライセンス。企業と国研の標準。
  • Quantum ESPRESSO: GPL オープンソース。学界の標準。
  • Gaussian、ORCA、Psi4: 分子量子化学用。
  • CP2K、ABINIT: 結晶・表面シミュレーション。
  • JAX-DFT(Google DeepMind、2024): 自動微分に優しい DFT 実装。
  • DM21(DeepMind、2021): 機械学習による交換相関汎関数。精度向上を実現。

ASE(Atomic Simulation Environment、Python)は上記ツール群を 共通インターフェースで束ねる標準ライブラリである。2026 年でも ASE 抜きの材料科学は想像しがたい。

合成経路計画 — IBM RXN、AiZynthFinder、Synthia、Postera

創薬・素材候補の分子が見つかれば、次のステップは 合成経路である。どの出発物質からどの反応を経て作れるかを AI が予測する。

  • IBM RXN for Chemistry: Transformer ベースの retrosynthesis。IBM Cloud SaaS。
  • AiZynthFinder(AstraZeneca、2020 オープン化): モンテカルロ木探索 + ニューラルネット。MIT ライセンス。
  • Synthia(旧 SciFinder Synthia): CAS の商用 retrosynthesis。
  • Postera Manifold: COVID-19 Moonshot プロジェクト発。商用 SaaS。
  • Molecule.one: ポーランドのスタートアップ。合成可能性スコア + 経路予測。

retrosynthesis モデルの精度は 2026 年時点で「専門化学者レベル」に迫ると評価される。AiZynthFinder はオープンソース公開で、学術研究で最も頻繁に登場する。

# AiZynthFinder の利用例
from aizynthfinder.aizynthfinder import AiZynthFinder

filename = "config.yml"
finder = AiZynthFinder(configfile=filename)
finder.stock.select("zinc")
finder.expansion_policy.select("uspto")
finder.target_smiles = "Cn1cnc2c1c(=O)n(C)c(=O)n2C"
finder.tree_search()
finder.build_routes()
print(finder.routes[0].metadata)

自動化合成ラボ — Strateos、Emerald Cloud Labs、OpenTrons

AI が候補を推薦し合成経路を組めば、実際に合成してみる段階が残る。2026 年の自動化合成ラボは次の 2 系統に分かれる。

  • クラウドラボ: 実験をコードで書けば遠隔施設が自動実行。Strateos(旧 Transcriptic)と Emerald Cloud Lab が二強。
  • デスクトップ自動化: 研究室に設置する自動化機器。OpenTrons(液体ハンドリングのオープンハードウェア)、Chemspeed(商用)。
  • 自律合成ロボット: AI の意思決定 + ロボットアーム。Berkeley A-Labリバプール大学のモバイル化学ロボット

A-Lab は GNoME 候補 41 個を 17 日間で自動合成に成功して話題になった(Nature 2023)。この流れは「AI が発見 → 自動合成 → データを再学習」という自己発展ループを完成させる核心である。

電池・エネルギー材料 — 固体電池と分子シミュレーション

電池は材料科学 AI の最大の応用分野である。注目どころは以下。

  • 固体電解質: A123 Systems、QuantumScape、Solid Power。AI が新しい固体電解質候補を発掘。
  • Form Energy: 鉄空気の長時間貯蔵。素材候補スクリーニングに ML を積極活用(iter96 エネルギー編)。
  • DeepMind 電池協業: 2024 年に LBNL と結晶・電解質協業。GNoME 結果を活用。
  • Toyota Research Institute(TRI): 2017 年から ML 加速電池発見プログラム。UC Berkeley + Stanford + MIT と協業。

電池は「材料 + セル設計 + サイクル寿命 + 安全性」をすべて扱う必要があるため、MLIP だけでは不十分で、電気化学 + 熱力学 + 機械工学のシミュレーションを組み合わせる必要がある。Citrine や Materials Zone のような会社がこの統合シミュレーション領域を狙っている。

米国 Materials Genome Initiative + EU Battery 2030+

政府単位の材料 AI プログラムは、米国と EU が最もよく整理されている。

  • US MGI 2.0(2021 年発表): NIST 主導。データ標準化 + AI/ML 統合 + 人材育成。
  • NIST JARVISMGI Hub: MGI 配下のデータ・ツールインフラ。
  • EU Battery 2030+: 2020 年発表、2030 年までの電池 R&D 加速ロードマップ。
  • EU NOMAD Lab: 多国籍 DFT データ統合。
  • EU AI4Industry: 産業 AI コンソーシアム。

各プログラムの核は データ標準 + オープンツール + 産学協同である。米国がデータとツールを作って企業が応用するのに対し、EU は同じツールを共有しつつ産業転換にもっと比重を置く。

韓国の材料 AI — KIST、KIMS、POSTECH、サムスン、LG

韓国の材料 AI エコシステムは次の軸で構成される。

  • 韓国科学技術研究院(KIST)人工知能研究団: AI 材料発見トラック。電池・触媒応用。
  • 韓国材料研究院(KIMS): 合金、磁性、セラミックドメイン。韓国材料ゲノムイニシアチブ(KMGI)主導。
  • POSTECH 新素材工学科: 材料 AI トラック。Han Yong Kim グループなど。
  • KAIST 生命化学工学科 + 新素材工学科: 分子・電池 ML 研究。
  • サムスン SDI / LG エナジーソリューション / SK オン: 電池材料 AI。自社データ + Citrine・Schrödinger との協業。
  • サムスン総合技術院: 半導体・ディスプレイ新素材 AI。
  • LG 化学未来技術センター: ポリマー・バイオ化学 AI。
  • SK ハイニックス HBM 材料 AI トラック: HBM インターコネクト・熱界面材料の最適化。

韓国政府も 2023 年から「韓国型材料ゲノムイニシアチブ」予算を本格増額している。2026 年 5 月時点で KMGI 配下のデータプラットフォーム(MaPS)がベータ運営中である。

日本の材料 AI — NIMS、PFN Matlantis、AIST、三菱ケミカル

日本は材料 AI において政府 + 大企業 + 大学の連携が特に緻密である。

  • NIMS(国立物質・材料研究機構): 日本の材料研究の本山。1956 年設立。MI2I(Materials Integration by Network Initiative)プログラムを主導。
  • AIST(産業技術総合研究所): AI4Materials コンソーシアム。
  • 東京大学 + 京都大学 + 東北大学: 材料情報学(MI)学科が定着。
  • 三菱ケミカルホールディングス + Preferred Networks(PFN): 2021 年に合弁 Matlantis を発表。PFN の PreFerredPotential 基盤モデルをクラウド SaaS として提供。
  • 旭化成、昭和電工、東レ、住友化学: 自社 ML 材料グループを保有。
  • Toyota Research Institute(TRI、米国カリフォルニア): 日系資本による米国 AI 材料拠点。

Matlantis は特に注目に値する。学術ツールではなく 商用 SaaS で MLIP を提供した最初のグローバルサービスである。化学・素材会社が API でシミュレーションを依頼し結果を受け取るモデルだ。

化学情報学ライブラリ — RDKit、DeepChem、PyG、e3nn

分子・結晶を扱う Python 標準ライブラリは次の 4 つである。

  • RDKit: BSD ライセンス。分子 SMILES/SDF パース、フィンガープリント、可視化。化学情報学の定石。
  • DeepChem: Vijay Pande(元スタンフォード)グループ発。化学 ML ワークフロー統合。
  • PyG(PyTorch Geometric): グラフニューラルネット汎用ライブラリ。分子・結晶でよく利用。
  • e3nn: 等変ニューラルネットライブラリ。MACE、NequIP、Allegro のバックエンド。
  • ASE(Atomic Simulation Environment): 上で触れたシミュレーションコードを統合する標準。
  • Pymatgen: Materials Project の公式 Python ライブラリ。結晶構造の操作。
  • PySCF: 量子化学の Python 実装。分子 DFT/HF 計算。
# RDKit 分子フィンガープリント例
from rdkit import Chem
from rdkit.Chem import AllChem

mol = Chem.MolFromSmiles("CC(=O)OC1=CC=CC=C1C(=O)O")  # アスピリン
fp = AllChem.GetMorganFingerprintAsBitVect(mol, radius=2, nBits=2048)
print(f"fingerprint bits set: {sum(fp)}")

学会・ワークショップ — MRS、ACS、NeurIPS AI4Mat

材料 AI 研究が発表される主要な舞台は以下のとおり。

  • MRS Spring/Fall Meeting: Materials Research Society。材料科学全般。
  • ACS National Meeting: American Chemical Society。化学 + 材料統合。
  • APS March Meeting: American Physical Society。凝縮系物理中心。
  • NeurIPS AI4Mat ワークショップ: 2022 年から毎年開催。ML 側から見た材料科学。
  • ICML AI4Science: 同分野の ICML トラック。
  • AI for Science Workshop(ICLR、NeurIPS)
  • MGI Annual Meeting日本化学会年会韓国材料学会春秋季などの地域学会。

学会トレンドは明確だ。純 ML 学会(NeurIPS、ICML)で材料トラックが急成長する一方、伝統的な材料学会(MRS、ACS)は ML セッションを本トラックに編入する流れである。

限界と課題 — AI 材料科学がまだ解けていないもの

2026 年 5 月時点で AI 材料科学はなお以下の限界を抱える。

  • 合成可能性と安定性のギャップ: GNoME 候補 220 万個のうち、実際に合成されたのは数十〜数百個レベル。「仮想で安定」と「実際に合成可能」は同義ではない。
  • データバイアス: DFT データは単純結晶中心。非結晶材料(ガラス、ポリマー、合金)、欠陥、表面、界面はデータ不足。
  • 有機材料の精度: 無機結晶に比べて OLED、ポリマー、薬物分子の ML 予測精度はまだ不十分。
  • 磁性・強相関系: DFT 自体の限界で、磁性・高温超伝導・強相関系では信頼度が落ちる。
  • ブラックボックス懸念: 生成モデルがなぜその構造を推薦したかの説明力が弱い。
  • 再現性危機: 学習データ、コード、ハイパーパラメータがすべて公開される必要がある。OSS 化が進んでいるが 100% ではない。

これらの限界がどのスピードで解けるかが、「材料 AlphaFold モーメント」がどこまで行くかを決める。

おわりに — 2026 年 5 月、「推測の時代」が終わりつつある

本稿の出発点は単純な問いだった。「材料科学にも AlphaFold のような出来事は起きうるか」。2026 年 5 月の答えは「すでに起きている」である。GNoME の 220 万候補、MatterGen の条件付き生成、Orb-v3 のオープン基盤、MACE/NequIP の MLIP、Materials Project インフラ、A-Lab の自動合成ロボット — これらすべてのピースが 2-3 年の間にそろった。

残った課題は これらのツールをいかに産業転換につなげるかである。学術論文ではなく、実際の電池セル、実際の抗がん剤、実際の OLED パネルが出てこなければならない。だからこそ Citrine・Schrödinger・Matlantis のような 商用ブリッジ(commercial bridge) が今後 5 年の核心変数になる。

材料科学に携わる人にとって、今は最も変動性の高い時期である。同時に最も報酬が大きい時期でもある。AI ツールを恐れず、自分のドメイン知識の上に一層乗せて使う人が、もっとも早く成果を出す。

References