- Published on
AI 材料科学・化学 2026 完全ガイド - DeepMind GNoME / Microsoft MatterGen / Orbital Materials / Citrine Informatics / Schrödinger / RoseTTAFold All-Atom / Boltz-1 / MACE / NequIP / DPMD 徹底解説
- Authors

- Name
- Youngju Kim
- @fjvbn20031
はじめに — 2026 年 5 月、材料科学が「AlphaFold モーメント」を通過する
2024 年のノーベル化学賞が David Baker(タンパク質設計)と Demis Hassabis、John Jumper(AlphaFold)に贈られたのは、ただのニュースではなかった。計算化学とディープラーニングが学術的に認められた研究方法論になった、という宣言だった。同じ波はタンパク質を越えて、無機結晶、触媒、電池電極、ポリマーへと拡大している。
2023 年 11 月に DeepMind GNoME が 220 万個の安定結晶候補を発表し、2025 年 1 月に Microsoft が生成型結晶モデル MatterGen を公開し、同じ四半期に Orbital Materials が GPT スタイルの材料基盤モデル Orb-v3 をオープンソース化した時点で、盤面は完全に変わった。2026 年 5 月現在、「新素材 1 つを発見する平均コストが 10 年前の 1 万分の 1 に下がった」という推定が真面目に議論されている。iter86 の創薬編に続いて、本稿はその隣接領域である材料科学・化学を見ていく。
なぜ材料 AI が 2026 年の焦点なのか — 発見コストの崩壊
伝統的な材料科学は 推測 → 合成 → 測定 のループで、平均 18-30 年を要してきた。リチウムイオン電池、ペロブスカイト太陽電池、高温超伝導体、いずれも同程度の長さの発見-商用化サイクルを経ている。AI 材料科学がこのループを破ろうとする試みは、次の 3 つの道具を組み合わせる。
- DFT(密度汎関数理論)シミュレーション: 量子力学に基づく第一原理計算。正確だが 1 計算に数時間以上。
- 機械学習原子間ポテンシャル(MLIP): DFT の精度を保ったまま推論速度を 10^4-10^6 倍加速。
- 生成モデル: 望む物性を持つ結晶構造を新たに生成する。
この 3 つを連結することで、「物性目標 → 候補構造の生成 → MLIP による高速 1 次評価 → DFT で検証 → 合成」という 逆設計パイプラインが標準になった。
DeepMind GNoME — 220 万結晶候補が落とした衝撃
GNoME(Graph Networks for Materials Exploration) は DeepMind が 2023 年 11 月に Nature 論文で公開した結晶構造発見プロジェクトである。コア結果は 1 行で要約できる。
- 220 万個の新規安定結晶候補: うち 38 万個が合成可能性が高いと分類。
- 能動学習ループ: グラフニューラルネットが候補を提案 → DFT が検証 → 検証結果を再び学習。
- 公開: データは Materials Project Database に統合公開。
GNoME が落とした衝撃は単なる数字ではない。48,000 個(2023 年時点で人類が把握していた安定無機結晶)から 220 万個へ、ひと段階で 2 桁単位がジャンプした。後続研究として、2024 年に Berkeley A-Lab が GNoME 候補のうち 41 個を自動合成に成功し、「AI 発見 + 自動合成」のループを実証した。
DeepMind は GNoME モデル自体は非公開とし、データのみを公開した。しかし同じ発想で作られたオープンモデルが、後続研究者によって急速に登場している状況である。
Microsoft MatterGen — 生成型結晶構造モデルの標準
2025 年 1 月に Microsoft Research が Nature で発表し、同時にオープンソース化した MatterGen は、拡散(diffusion)モデルベースの結晶構造ジェネレータである。GNoME が「安定な結晶を発見する」役割だったのに対し、MatterGen は **「望む物性を持つ結晶を設計する」**役割を担う。
- 条件付き生成: 化学組成、対称性、磁性、バンドギャップ、弾性率などの物性条件を入力に取る。
- 拡散モデル構造: 結晶座標と格子パラメータにノイズを加えた後、逆拡散。
- Equivariant GNN バックボーン: 回転・並進対称性を学習段階で保証。
Microsoft は同じラインアップで MatterSim も公開している。MatterSim は MatterGen が生成した構造の安定性・物性を高速に評価するシミュレータの役割を担う。両モデルを束ねた「生成 + 評価」パイプラインを 1 社で完結させている点が大きい。
MatterGen の GitHub リポジトリは MIT ライセンスで公開されている。
# MatterGen 推論例(公式 README の擬似コード)
from mattergen.evaluation import StructureValidator
from mattergen.generation import MatterGenPipeline
pipe = MatterGenPipeline.from_pretrained("microsoft/MatterGen")
structures = pipe.sample(
composition={"Li": 1, "Fe": 1, "P": 1, "O": 4},
target_bandgap=2.5,
n_samples=100,
)
validator = StructureValidator.from_pretrained("microsoft/MatterSim")
scored = validator.score(structures)
Orbital Materials Orb-v3 — オープンソース GPT スタイル材料基盤モデル
英国のスタートアップ Orbital Materials は、2024-2025 年にかけて Orb シリーズを発表し急浮上した。2025 年末リリースの Orb-v3 は次の特徴を持つ。
- GPT スタイルのデコーダアーキテクチャ: 原子シーケンスを自己回帰で生成。
- 数億件の DFT シミュレーションデータで学習。
- 物性予測 + 構造生成 + 動力学シミュレーションを 1 モデルで処理。
- Apache 2.0 オープンソース: Hugging Face Hub に重みを公開。
Orbital Materials は「材料科学版 GPT-3 モーメント」を目標として公言している。1 つの巨大な基盤モデルを学習しておき、多様な下流タスクにファインチューニングするパターンを材料科学に移植した、ということだ。
似た流れのモデルとして DPA-2(DeepModeling コンソーシアム、中国)、EquiformerV2(MIT、Hugging Face)、PreFerredPotential(PFN Matlantis 内)がある。2026 年 5 月時点で「材料基盤モデル」は 5-6 個が競合している。
MACE — 機械学習原子間ポテンシャルの精度リーダー
分子動力学(MD)シミュレーションで一番高コストなのは、毎タイムステップでの原子間力の計算である。DFT で直接計算すると 1 シミュレーションに数日かかる。MLIP(Machine-Learned Interatomic Potential) はこの力計算をニューラルネットに置き換え、速度を 4-6 桁加速する。
MACE(MACE for Atomistic Simulations) はケンブリッジ大学 ACEnet グループ製の equivariant MLIP で、2026 年 5 月時点で精度部門のリーダーと評価される。
- 高次多体メッセージパッシング: 2 体・3 体・4 体相互作用を直接モデル化。
- E(3) 等変性: 回転と並進に対する対称性を構造的に保証。
- マルチ忠実度: 少ない DFT データでも学習可能。
- MIT ライセンス: Cambridge ACEnet の GitHub に公開。
MACE のパフォーマンスは、SPICE データセット、MPtrj(Materials Project 学習スプリット)、OC22/OC20(Open Catalyst)、Matbench で確認されており、いずれも上位に入る。とくに 基盤モデル変種(MACE-MP-0、MACE-MP-2) は、事前学習済み重みをそのままダウンロードして多様な系に zero-shot 適用できる。
# MACE Foundation Model 利用例
from mace.calculators import mace_mp
from ase.build import bulk
atoms = bulk("Si", "diamond", a=5.43)
calc = mace_mp(model="medium", dispersion=False, default_dtype="float32")
atoms.calc = calc
energy = atoms.get_potential_energy()
forces = atoms.get_forces()
NequIP、Allegro — 等変ニューラルポテンシャルのもう 1 つの軸
MACE と並ぶ等変 MLIP の二大軸が NequIP(Neural Equivariant Interatomic Potentials) とその後継 Allegro である。両方ともハーバード MIT 共同研究グループ(Boris Kozinsky 研)の成果。
- NequIP: 等変メッセージパッシング。小さなデータセットで SchNet 比で大幅な精度向上。
- Allegro: NequIP の後継。非チェイニング(局所)構造で GPU 並列効率が高い。
- どちらも MIT ライセンスのオープンソース。
同じ学習データを与えると、MACE と NequIP/Allegro の精度はしばしば伯仲する。差が出るのは ハードウェア親和性と学習安定性である。数万原子規模の大規模系では、メッセージパッシング深さの浅い Allegro の方が速い傾向がある。
DeePMD-kit — 中国発の大規模 MLIP フレームワーク
DeePMD-kit(DPMD)は北京計算機科学研究所とプリンストン e-CAS の協力で開発された MLIP フレームワークである。後続管理は DeepModeling コンソーシアム(Bohrium、AISI Beijing など)が担う。
- Deep Potential Smooth Edition(DeepPot-SE): 原子座標を滑らかな入力に変換するエンコーディング。
- DPA-1、DPA-2 基盤モデル: 数十万の分子・結晶系で事前学習。
- LAMMPS 統合: 既存の分子動力学シミュレータにプラグインとして組み込み可能。
- DP-GEN: 能動学習ループの自動化ツール。
LLM 側の LLaMA に肩を並べる規模で、DPMD は材料科学 MLIP の「東方軸」として地位を確立した。論文引用数と GitHub スター数ともに、MACE/NequIP と肩を並べる。
SchNet、PaiNN、MatGL、CHGNet — 第 1 世代グラフニューラルポテンシャル
等変 MLIP が登場する前、材料 GNN の標準は SchNet と PaiNN(ともにベルリン TU グループ)だった。2026 年でも、軽量系や高速プロトタイプにはまだ使われている。
- SchNet: 距離ベースのメッセージパッシング。2017 年提案、分子・結晶ともに適用。
- PaiNN: SchNet の方向性拡張。高速・高精度。
- MatGL/M3GNet: カリフォルニア大学サンディエゴ校。Materials Project が公式後援。結晶 + 分子の統合モデル。
- CHGNet: バークレー LBNL。磁性状態や電荷分布まで学習する。
- ALIGNN: NIST JARVIS のラインアップ。ラインググラフエンコーディングを活用。
CHGNet は特に、Materials Project が学習データとして使った全ての磁性・非磁性構造を扱うという点で、「汎用結晶シミュレータ」候補として頻繁に挙げられる。
Materials Project — 公開データベースの皇帝
Materials Project(Lawrence Berkeley National Lab + UC Berkeley、Kristin Persson)は 2011 年発足の無機結晶 DFT データベースである。2026 年 5 月時点で、約 15 万個の無機結晶の DFT 計算結果を公開している。
- 提供される物性: 形成エネルギー、バンドギャップ、弾性、磁性、誘電率など数十種類。
- REST API:
mp-apiPython ライブラリで直接クエリ可能。 - MPContribs: ユーザー寄稿データのトラック。
- MatGL/M3GNet、CHGNet の学習データは主に MP から取得。
# Materials Project API 利用例
from mp_api.client import MPRester
with MPRester(api_key="YOUR_KEY") as mpr:
results = mpr.materials.summary.search(
elements=["Li", "Fe", "P", "O"],
formula="LiFePO4",
fields=["material_id", "formula_pretty", "band_gap", "formation_energy_per_atom"],
)
for r in results:
print(r.material_id, r.formula_pretty, r.band_gap)
GNoME が発見した 220 万個の候補は 2024 年以降、徐々に MP に統合されている。つまり MP に行けば GNoME 結果をクエリできる。
OQMD、AFLOW、NOMAD、JARVIS — 公開 DB の 4 兄弟
Materials Project 以外にも、無機材料の公開 DB は 4 つある。
- OQMD(Open Quantum Materials Database): ノースウェスタン大。100 万件以上の DFT 計算。合金中心。
- AFLOWlib: デューク大。自動化 DFT ワークフローの結果。Inorganic Crystal Structure Database(ICSD)と深く連携。
- NOMAD: マックスプランク + EU FAIR-DI コンソーシアム。あらゆる DFT コードの結果を統合保存。
- JARVIS(Joint Automated Repository for Various Integrated Simulations): NIST。結晶 + 2D 材料 + 磁性 + トポロジカルなど幅広く扱う。
各 DB の強みは異なる。合金検索は OQMD、2D 材料は JARVIS、複数コード互換性は NOMAD、最初の入口は Materials Project が一般的である。
Citrine Informatics — エンタープライズ材料 AI の標準
Citrine Informatics(2013 年設立、本社カリフォルニア)は材料科学 AI をエンタープライズに販売する会社である。2026 年 5 月時点で、BASF、Panasonic、Boeing、Saint-Gobain など数十社のグローバル化学・素材企業の R&D パートナーである。
- Citrination プラットフォーム: データ取り込み + 能動学習 + 候補推薦 + 実験設計。
- Pythonic SDK:
citrine-pythonでデータモデル定義と実験設計が可能。 - オンプレミス + SaaS の両提供: 化学・素材会社のセキュリティ要件に対応。
Citrine は「AI 発見」よりも **「意思決定の自動化」**に重点を置く。会社が抱える社内データ(特許、実験記録、シミュレーション結果)をすべて集めて意思決定モデルにする、というのが本質である。
類似ポジションの競合として Materials Zone(イスラエル)、Uncountable(米国)、Phaseshift(米国) がある。
Schrödinger — NASDAQ 上場の創薬・材料 AI 強者
Schrödinger(NASDAQ: SDGR) は 1990 年設立の量子化学ソフトウェア会社として出発した。2026 年 5 月時点で時価総額約 80 億ドル規模の上場企業であり、創薬発見 + 材料発見の 2 トラックを並行運営している。
- Maestro: 分子モデリング GUI 環境。
- Jaguar: 量子化学計算エンジン(DFT、MP2 など)。
- Materials Science Suite: ポリマー、OLED、電池電解液など材料トラック。
- LiveDesign: 創薬向けクラウド協業環境。
Schrödinger は自社創薬候補(SGR-1505、SGR-2921 など)を臨床まで進める一方で、大手製薬(BMS、J&J、武田)との協業 R&D 契約を結ぶ。売上の相当部分が ソフトウェアライセンス + 創薬協業マイルストンから生じる。
RoseTTAFold All-Atom — タンパク質と材料を 1 モデルに統合
2024 年 5 月に David Baker グループ(ワシントン大学 IPD)が Science に発表した RoseTTAFold All-Atom(RFAA) は、タンパク質・核酸・小分子・金属イオン・共有結合修飾を すべて 1 モデルで予測する。タンパク質のみを扱った RoseTTAFold 2 の後継である。
- 単一モデルで タンパク質-薬剤ドッキング、核酸-タンパク質複合体、抗原-抗体複合体を処理。
- AlphaFold 3 と同時期に競合: AF3 が非商用ライセンスを敷くなか、RFAA は学術 + 非商用利用をより広く認める。
- RoseTTAFold Diffusion(RFdiffusion): タンパク質生成モデル。新たな結合体を設計する。
David Baker は RoseTTAFold + RFdiffusion + タンパク質設計パラダイムで 2024 年ノーベル化学賞を共同受賞した。iter86 創薬編で、タンパク質側はより深く扱っている。
Boltz-1、Chai-1、ESM-3 — AlphaFold 3 のオープン代替ラインアップ
AlphaFold 3 が 2024 年 5 月に Nature に登場した直後、オープンソースの代替が一気に出てきた。
- Boltz-1(MIT、2024 年 11 月): AlphaFold 3 に匹敵するタンパク質-リガンド複合体予測。MIT ライセンス。
- Boltz-2(2025 年後半): 親和性(affinity)予測まで統合。
- Chai-1(Chai Discovery、2024): 営利スタートアップによるオープン重みモデル。
- ESM-3(EvolutionaryScale、Meta FAIR スピンオフ): タンパク質シーケンス・構造・機能を統合した LLM。
- OpenFold: AlphaFold 2 のオープン再実装。Columbia + AQEMIA の協力。
- ColabFold: AlphaFold/RoseTTAFold を Google Colab で実行可能にした人気ツール。
2026 年 5 月時点では Boltz-2 が学術界で最も頻繁に引用される AF3 代替である。Chai-1 は商用創薬ワークフローでの採用が多い。
Atomwise、Isomorphic Labs、Genesis Therapeutics — AI 創薬の二大トラック
材料科学と分子設計の境界に位置する AI 創薬会社は別途整理する。iter86 創薬編の補足として、短くまとめる。
- Isomorphic Labs(2021 年分社、Alphabet 傘下): DeepMind から分社した創薬会社。AlphaFold 3 のコアチームが合流。Novartis、Eli Lilly と協業契約。
- Atomwise(2012 年設立、サンフランシスコ): AtomNet 畳み込みネットワークによるドッキング。数十の臨床候補。
- Genesis Therapeutics(スタンフォードスピンアウト、2019): GEMS プラットフォーム。グラフニューラルネット分子設計。Genentech と協業。
- Recursion Pharmaceuticals(NASDAQ: RXRX): 表現型スクリーニング + AI。NVIDIA が 5 千万ドル投資。
- Exscientia(NASDAQ 合併後 Recursion に吸収): 自動化創薬設計。
- Insitro(2018 年設立、Daphne Koller): ML + 誘導多能性幹細胞(iPSC)を組み合わせた新薬。
これらは材料科学会社というより AI 創薬が本業だが、同じ分子シミュレーション + グラフニューラルネット + 生成モデルスタックを共有する。
DFT + AI — VASP、Quantum ESPRESSO、JAX-DFT、DM21
古典的な DFT ツールは依然として材料科学のバックボーンである。AI はこれらを 置き換えるのではなく 加速する役割で合流する。
- VASP(Vienna Ab initio Simulation Package): 独自ライセンス。企業と国研の標準。
- Quantum ESPRESSO: GPL オープンソース。学界の標準。
- Gaussian、ORCA、Psi4: 分子量子化学用。
- CP2K、ABINIT: 結晶・表面シミュレーション。
- JAX-DFT(Google DeepMind、2024): 自動微分に優しい DFT 実装。
- DM21(DeepMind、2021): 機械学習による交換相関汎関数。精度向上を実現。
ASE(Atomic Simulation Environment、Python)は上記ツール群を 共通インターフェースで束ねる標準ライブラリである。2026 年でも ASE 抜きの材料科学は想像しがたい。
合成経路計画 — IBM RXN、AiZynthFinder、Synthia、Postera
創薬・素材候補の分子が見つかれば、次のステップは 合成経路である。どの出発物質からどの反応を経て作れるかを AI が予測する。
- IBM RXN for Chemistry: Transformer ベースの retrosynthesis。IBM Cloud SaaS。
- AiZynthFinder(AstraZeneca、2020 オープン化): モンテカルロ木探索 + ニューラルネット。MIT ライセンス。
- Synthia(旧 SciFinder Synthia): CAS の商用 retrosynthesis。
- Postera Manifold: COVID-19 Moonshot プロジェクト発。商用 SaaS。
- Molecule.one: ポーランドのスタートアップ。合成可能性スコア + 経路予測。
retrosynthesis モデルの精度は 2026 年時点で「専門化学者レベル」に迫ると評価される。AiZynthFinder はオープンソース公開で、学術研究で最も頻繁に登場する。
# AiZynthFinder の利用例
from aizynthfinder.aizynthfinder import AiZynthFinder
filename = "config.yml"
finder = AiZynthFinder(configfile=filename)
finder.stock.select("zinc")
finder.expansion_policy.select("uspto")
finder.target_smiles = "Cn1cnc2c1c(=O)n(C)c(=O)n2C"
finder.tree_search()
finder.build_routes()
print(finder.routes[0].metadata)
自動化合成ラボ — Strateos、Emerald Cloud Labs、OpenTrons
AI が候補を推薦し合成経路を組めば、実際に合成してみる段階が残る。2026 年の自動化合成ラボは次の 2 系統に分かれる。
- クラウドラボ: 実験をコードで書けば遠隔施設が自動実行。Strateos(旧 Transcriptic)と Emerald Cloud Lab が二強。
- デスクトップ自動化: 研究室に設置する自動化機器。OpenTrons(液体ハンドリングのオープンハードウェア)、Chemspeed(商用)。
- 自律合成ロボット: AI の意思決定 + ロボットアーム。Berkeley A-Lab、リバプール大学のモバイル化学ロボット。
A-Lab は GNoME 候補 41 個を 17 日間で自動合成に成功して話題になった(Nature 2023)。この流れは「AI が発見 → 自動合成 → データを再学習」という自己発展ループを完成させる核心である。
電池・エネルギー材料 — 固体電池と分子シミュレーション
電池は材料科学 AI の最大の応用分野である。注目どころは以下。
- 固体電解質: A123 Systems、QuantumScape、Solid Power。AI が新しい固体電解質候補を発掘。
- Form Energy: 鉄空気の長時間貯蔵。素材候補スクリーニングに ML を積極活用(iter96 エネルギー編)。
- DeepMind 電池協業: 2024 年に LBNL と結晶・電解質協業。GNoME 結果を活用。
- Toyota Research Institute(TRI): 2017 年から ML 加速電池発見プログラム。UC Berkeley + Stanford + MIT と協業。
電池は「材料 + セル設計 + サイクル寿命 + 安全性」をすべて扱う必要があるため、MLIP だけでは不十分で、電気化学 + 熱力学 + 機械工学のシミュレーションを組み合わせる必要がある。Citrine や Materials Zone のような会社がこの統合シミュレーション領域を狙っている。
米国 Materials Genome Initiative + EU Battery 2030+
政府単位の材料 AI プログラムは、米国と EU が最もよく整理されている。
- US MGI 2.0(2021 年発表): NIST 主導。データ標準化 + AI/ML 統合 + 人材育成。
- NIST JARVIS、MGI Hub: MGI 配下のデータ・ツールインフラ。
- EU Battery 2030+: 2020 年発表、2030 年までの電池 R&D 加速ロードマップ。
- EU NOMAD Lab: 多国籍 DFT データ統合。
- EU AI4Industry: 産業 AI コンソーシアム。
各プログラムの核は データ標準 + オープンツール + 産学協同である。米国がデータとツールを作って企業が応用するのに対し、EU は同じツールを共有しつつ産業転換にもっと比重を置く。
韓国の材料 AI — KIST、KIMS、POSTECH、サムスン、LG
韓国の材料 AI エコシステムは次の軸で構成される。
- 韓国科学技術研究院(KIST)人工知能研究団: AI 材料発見トラック。電池・触媒応用。
- 韓国材料研究院(KIMS): 合金、磁性、セラミックドメイン。韓国材料ゲノムイニシアチブ(KMGI)主導。
- POSTECH 新素材工学科: 材料 AI トラック。Han Yong Kim グループなど。
- KAIST 生命化学工学科 + 新素材工学科: 分子・電池 ML 研究。
- サムスン SDI / LG エナジーソリューション / SK オン: 電池材料 AI。自社データ + Citrine・Schrödinger との協業。
- サムスン総合技術院: 半導体・ディスプレイ新素材 AI。
- LG 化学未来技術センター: ポリマー・バイオ化学 AI。
- SK ハイニックス HBM 材料 AI トラック: HBM インターコネクト・熱界面材料の最適化。
韓国政府も 2023 年から「韓国型材料ゲノムイニシアチブ」予算を本格増額している。2026 年 5 月時点で KMGI 配下のデータプラットフォーム(MaPS)がベータ運営中である。
日本の材料 AI — NIMS、PFN Matlantis、AIST、三菱ケミカル
日本は材料 AI において政府 + 大企業 + 大学の連携が特に緻密である。
- NIMS(国立物質・材料研究機構): 日本の材料研究の本山。1956 年設立。MI2I(Materials Integration by Network Initiative)プログラムを主導。
- AIST(産業技術総合研究所): AI4Materials コンソーシアム。
- 東京大学 + 京都大学 + 東北大学: 材料情報学(MI)学科が定着。
- 三菱ケミカルホールディングス + Preferred Networks(PFN): 2021 年に合弁 Matlantis を発表。PFN の PreFerredPotential 基盤モデルをクラウド SaaS として提供。
- 旭化成、昭和電工、東レ、住友化学: 自社 ML 材料グループを保有。
- Toyota Research Institute(TRI、米国カリフォルニア): 日系資本による米国 AI 材料拠点。
Matlantis は特に注目に値する。学術ツールではなく 商用 SaaS で MLIP を提供した最初のグローバルサービスである。化学・素材会社が API でシミュレーションを依頼し結果を受け取るモデルだ。
化学情報学ライブラリ — RDKit、DeepChem、PyG、e3nn
分子・結晶を扱う Python 標準ライブラリは次の 4 つである。
- RDKit: BSD ライセンス。分子 SMILES/SDF パース、フィンガープリント、可視化。化学情報学の定石。
- DeepChem: Vijay Pande(元スタンフォード)グループ発。化学 ML ワークフロー統合。
- PyG(PyTorch Geometric): グラフニューラルネット汎用ライブラリ。分子・結晶でよく利用。
- e3nn: 等変ニューラルネットライブラリ。MACE、NequIP、Allegro のバックエンド。
- ASE(Atomic Simulation Environment): 上で触れたシミュレーションコードを統合する標準。
- Pymatgen: Materials Project の公式 Python ライブラリ。結晶構造の操作。
- PySCF: 量子化学の Python 実装。分子 DFT/HF 計算。
# RDKit 分子フィンガープリント例
from rdkit import Chem
from rdkit.Chem import AllChem
mol = Chem.MolFromSmiles("CC(=O)OC1=CC=CC=C1C(=O)O") # アスピリン
fp = AllChem.GetMorganFingerprintAsBitVect(mol, radius=2, nBits=2048)
print(f"fingerprint bits set: {sum(fp)}")
学会・ワークショップ — MRS、ACS、NeurIPS AI4Mat
材料 AI 研究が発表される主要な舞台は以下のとおり。
- MRS Spring/Fall Meeting: Materials Research Society。材料科学全般。
- ACS National Meeting: American Chemical Society。化学 + 材料統合。
- APS March Meeting: American Physical Society。凝縮系物理中心。
- NeurIPS AI4Mat ワークショップ: 2022 年から毎年開催。ML 側から見た材料科学。
- ICML AI4Science: 同分野の ICML トラック。
- AI for Science Workshop(ICLR、NeurIPS)。
- MGI Annual Meeting、日本化学会年会、韓国材料学会春秋季などの地域学会。
学会トレンドは明確だ。純 ML 学会(NeurIPS、ICML)で材料トラックが急成長する一方、伝統的な材料学会(MRS、ACS)は ML セッションを本トラックに編入する流れである。
限界と課題 — AI 材料科学がまだ解けていないもの
2026 年 5 月時点で AI 材料科学はなお以下の限界を抱える。
- 合成可能性と安定性のギャップ: GNoME 候補 220 万個のうち、実際に合成されたのは数十〜数百個レベル。「仮想で安定」と「実際に合成可能」は同義ではない。
- データバイアス: DFT データは単純結晶中心。非結晶材料(ガラス、ポリマー、合金)、欠陥、表面、界面はデータ不足。
- 有機材料の精度: 無機結晶に比べて OLED、ポリマー、薬物分子の ML 予測精度はまだ不十分。
- 磁性・強相関系: DFT 自体の限界で、磁性・高温超伝導・強相関系では信頼度が落ちる。
- ブラックボックス懸念: 生成モデルがなぜその構造を推薦したかの説明力が弱い。
- 再現性危機: 学習データ、コード、ハイパーパラメータがすべて公開される必要がある。OSS 化が進んでいるが 100% ではない。
これらの限界がどのスピードで解けるかが、「材料 AlphaFold モーメント」がどこまで行くかを決める。
おわりに — 2026 年 5 月、「推測の時代」が終わりつつある
本稿の出発点は単純な問いだった。「材料科学にも AlphaFold のような出来事は起きうるか」。2026 年 5 月の答えは「すでに起きている」である。GNoME の 220 万候補、MatterGen の条件付き生成、Orb-v3 のオープン基盤、MACE/NequIP の MLIP、Materials Project インフラ、A-Lab の自動合成ロボット — これらすべてのピースが 2-3 年の間にそろった。
残った課題は これらのツールをいかに産業転換につなげるかである。学術論文ではなく、実際の電池セル、実際の抗がん剤、実際の OLED パネルが出てこなければならない。だからこそ Citrine・Schrödinger・Matlantis のような 商用ブリッジ(commercial bridge) が今後 5 年の核心変数になる。
材料科学に携わる人にとって、今は最も変動性の高い時期である。同時に最も報酬が大きい時期でもある。AI ツールを恐れず、自分のドメイン知識の上に一層乗せて使う人が、もっとも早く成果を出す。
References
- DeepMind GNoME 論文: https://www.nature.com/articles/s41586-023-06735-9
- Microsoft MatterGen GitHub: https://github.com/microsoft/mattergen
- Microsoft MatterSim 発表: https://www.microsoft.com/en-us/research/blog/mattersim-a-deep-learning-atomistic-model-across-elements-temperatures-and-pressures/
- Orbital Materials Orb シリーズ GitHub: https://github.com/orbital-materials/orb-models
- MACE GitHub(Cambridge ACEnet): https://github.com/ACEsuit/mace
- NequIP GitHub(Harvard MIT): https://github.com/mir-group/nequip
- Allegro GitHub: https://github.com/mir-group/allegro
- DeePMD-kit 公式サイト: https://docs.deepmodeling.com/projects/deepmd/en/master/
- SchNetPack GitHub: https://github.com/atomistic-machine-learning/schnetpack
- M3GNet GitHub: https://github.com/materialsvirtuallab/m3gnet
- CHGNet GitHub: https://github.com/CederGroupHub/chgnet
- Materials Project 公式サイト: https://materialsproject.org/
- OQMD 公式サイト: https://oqmd.org/
- AFLOWlib 公式サイト: https://aflowlib.org/
- NOMAD Repository: https://nomad-lab.eu/
- NIST JARVIS: https://jarvis.nist.gov/
- Citrine Informatics 公式サイト: https://citrine.io/
- Schrödinger 公式サイト: https://www.schrodinger.com/
- RoseTTAFold All-Atom 論文: https://www.science.org/doi/10.1126/science.adl2528
- Boltz-1 GitHub(MIT): https://github.com/jwohlwend/boltz
- Chai-1 発表: https://www.chaidiscovery.com/blog/introducing-chai-1
- ESM-3 発表(EvolutionaryScale): https://www.evolutionaryscale.ai/blog/esm3-release
- IBM RXN for Chemistry: https://rxn.app.accelerate.science/
- AiZynthFinder GitHub: https://github.com/MolecularAI/aizynthfinder
- Berkeley A-Lab 論文: https://www.nature.com/articles/s41586-023-06734-w
- Materials Genome Initiative: https://www.mgi.gov/
- NIMS MI2I: https://www.nims.go.jp/MII-I/en/
- Preferred Networks Matlantis: https://matlantis.com/
- RDKit 公式ドキュメント: https://www.rdkit.org/docs/
- Pymatgen 公式ドキュメント: https://pymatgen.org/
- e3nn 公式ドキュメント: https://docs.e3nn.org/