- Published on
AI 재료과학 & 화학 2026 완벽 가이드 - DeepMind GNoME · Microsoft MatterGen · Orbital Materials · Citrine Informatics · Schrödinger · RoseTTAFold All-Atom · Boltz-1 · MACE · NequIP · DPMD 심층 분석
- Authors

- Name
- Youngju Kim
- @fjvbn20031
들어가며 — 2026년 5월, 재료과학이 "AlphaFold 모먼트"를 통과하다
2024년 노벨 화학상을 David Baker(단백질 설계)와 Demis Hassabis · John Jumper(AlphaFold)가 가져간 사건은 단순한 뉴스가 아니었다. 계산 화학 + 딥러닝이 학계가 인정한 새로운 연구 방법론이 됐다는 선언이었다. 같은 흐름은 단백질을 넘어 무기 결정, 촉매, 배터리 전극, 폴리머로 확산 중이다.
2023년 11월 DeepMind GNoME가 220만 개 안정 결정 후보를 발표하고, 2025년 1월 Microsoft가 생성형 결정 모델 MatterGen을 공개하고, 같은 분기 Orbital Materials가 GPT 스타일 재료 파운데이션 모델 Orb-v3를 오픈소스로 풀면서 판이 완전히 바뀌었다. 2026년 5월 현재, "신소재 한 개를 발견하는 평균 비용"이 10년 전 1만 분의 1로 떨어졌다는 추정이 진지하게 논의된다. iter86 약물 설계 글에 이어, 이번 글은 그 인접 영역인 재료과학·화학을 본다.
왜 재료과학 AI가 2026년의 화두인가 — 발견 비용의 붕괴
전통 재료과학은 추측 → 합성 → 측정의 루프로 평균 18-30년이 걸렸다. 리튬이온 배터리, 페로브스카이트 태양전지, 고온 초전도체 모두 비슷한 길이의 발견-상용화 주기를 거쳤다. AI 재료과학이 이 주기를 깨려는 시도는 다음 세 가지 도구를 결합한다.
- DFT(밀도범함수 이론) 시뮬레이션: 양자역학 기반 첫 원리 계산. 정확하지만 한 계산에 수 시간 이상.
- 머신러닝 원자간 포텐셜(MLIP): DFT 정확도를 유지하면서 추론 속도를 10^4-10^6 배 가속.
- 생성형 모델: 원하는 물성을 갖는 결정 구조를 새로 만들어 낸다.
이 세 도구를 결합해 "물성으로부터 후보 구조 생성 → MLIP로 빠른 1차 평가 → DFT로 검증 → 합성"이라는 역설계 파이프라인이 표준이 됐다.
DeepMind GNoME — 2.2M 결정 후보가 던진 충격
**GNoME(Graph Networks for Materials Exploration)**는 DeepMind가 2023년 11월 Nature 논문으로 공개한 결정 구조 발견 프로젝트다. 핵심 결과는 한 줄로 요약된다.
- 220만 개 새로운 안정 결정 후보: 그중 38만 개가 합성 가능성이 높다고 분류.
- 활성 학습 루프: 그래프 신경망이 후보를 제안 → DFT로 검증 → 검증된 결과를 다시 학습.
- 공개: 데이터는 Materials Project Database에 통합 공개.
GNoME가 던진 충격은 단순한 숫자가 아니다. 48,000개(2023년까지 인류가 알던 안정 무기 결정)에서 220만 개로 한 단계에 단위가 두 자릿수 뛰었다. 후속 연구로 2024년에는 Berkeley A-Lab이 GNoME 후보 중 41개를 자동 합성에 성공하면서 "AI 발견 + 자동 합성" 루프가 실증됐다.
DeepMind는 GNoME 모델 자체는 비공개로 두고 데이터만 풀었다. 그러나 후속 연구자들이 같은 아이디어로 만든 오픈 모델이 빠르게 나오고 있는 상황이다.
Microsoft MatterGen — 생성형 결정 구조 모델의 표준
2025년 1월 Microsoft Research가 Nature에 발표하고 동시에 오픈소스로 푼 MatterGen은 확산(diffusion) 모델 기반 결정 구조 생성기다. GNoME가 "안정한 결정을 발견"했다면, MatterGen은 **"원하는 물성을 갖는 결정을 디자인"**한다.
- 조건부 생성: 화학 조성, 대칭성, 자성, 밴드갭, 탄성률 등 물성 조건을 입력으로 받음.
- 확산 모델 구조: 결정 좌표 + 격자 매개변수에 노이즈를 더한 후 역확산.
- Equivariant GNN 백본: 회전·평행이동 대칭성을 학습 단계에서 보장.
Microsoft는 동일 라인업으로 MatterSim도 공개했다. MatterSim은 MatterGen이 생성한 구조의 안정성/물성을 빠르게 평가하는 시뮬레이터 역할이다. 두 모델을 묶어 "생성 + 평가" 파이프라인을 한 회사가 모두 제공한다는 점이 의미 있다.
MatterGen의 GitHub 리포지토리는 MIT 라이선스로 공개되어 있다.
# MatterGen 추론 예시(공식 README 의사 코드)
from mattergen.evaluation import StructureValidator
from mattergen.generation import MatterGenPipeline
pipe = MatterGenPipeline.from_pretrained("microsoft/MatterGen")
structures = pipe.sample(
composition={"Li": 1, "Fe": 1, "P": 1, "O": 4},
target_bandgap=2.5,
n_samples=100,
)
validator = StructureValidator.from_pretrained("microsoft/MatterSim")
scored = validator.score(structures)
Orbital Materials Orb-v3 — 오픈소스 GPT 스타일 재료 파운데이션 모델
영국 스타트업 Orbital Materials는 2024-2025년 사이 Orb 시리즈를 발표하면서 빠르게 떠올랐다. Orb-v3(2025년 말)는 다음 특징을 가진다.
- GPT 스타일 디코더 아키텍처: 원자 시퀀스를 자기회귀로 생성.
- 수억 개 DFT 시뮬레이션 데이터로 학습.
- 물성 예측 + 구조 생성 + 동역학 시뮬레이션을 한 모델로 처리.
- Apache 2.0 오픈소스: Hugging Face Hub에 가중치 공개.
Orbital Materials는 "재료과학용 GPT-3 모먼트"를 목표로 한다고 명시한다. 단일 거대 모델을 학습해 두고, 다양한 다운스트림 태스크에 파인튜닝하는 패턴을 재료과학에 옮긴 것이다.
비슷한 흐름의 모델로 DPA-2(DeepModeling 컨소시엄, 중국), EquiformerV2(MIT, Hugging Face), PreFerredPotential(PFN 매트랜티스)가 있다. 2026년 5월 기준 "재료 파운데이션 모델"은 5-6개가 경쟁 중이다.
MACE — 머신러닝 원자간 포텐셜의 정확도 리더
분자동역학(MD) 시뮬레이션에서 가장 비싼 부분은 매 시간 스텝마다 원자 간 힘을 계산하는 것이다. DFT로 직접 계산하면 한 시뮬레이션에 며칠이 걸린다. MLIP(Machine-Learned Interatomic Potential) 는 이 힘 계산을 신경망으로 대체해 속도를 4-6 자릿수 가속한다.
**MACE(MACE for atomistic simulations)**는 케임브리지 대학 ACEnet 그룹이 만든 등변(equivariant) MLIP다. 2026년 5월 기준 정확도 부문 리더로 평가된다.
- 고차 다체 메시지 패싱: 2-, 3-, 4-체 상호작용을 직접 모델링.
- E(3) 등변성: 회전과 평행이동에 대한 대칭성을 구조적으로 보장.
- Multi-fidelity: 적은 DFT 데이터로도 학습 가능.
- MIT 라이선스: Cambridge ACEnet GitHub에 공개.
MACE의 성능은 다음 벤치마크에서 확인된다. SPICE 데이터셋, MPtrj(Materials Project 학습 분할), OC22/OC20(Open Catalyst), Matbench 등에서 상위권. 특히 **Foundation Model 변형(MACE-MP-0, MACE-MP-2)**은 사전학습된 가중치를 그대로 다운로드해 다양한 시스템에 zero-shot으로 적용할 수 있다.
# MACE Foundation Model 사용 예시
from mace.calculators import mace_mp
from ase.build import bulk
atoms = bulk("Si", "diamond", a=5.43)
calc = mace_mp(model="medium", dispersion=False, default_dtype="float32")
atoms.calc = calc
energy = atoms.get_potential_energy()
forces = atoms.get_forces()
NequIP, Allegro — 등변 신경망 포텐셜의 또 다른 축
MACE와 함께 등변 MLIP 진영의 양대 축은 **NequIP(Neural Equivariant Interatomic Potentials)**와 그 후속 Allegro다. 둘 다 하버드 MIT 공동연구진(Boris Kozinsky 그룹)의 작품이다.
- NequIP: 등변 메시지 패싱. 작은 데이터셋에서 SchNet 대비 정확도 큰 폭 향상.
- Allegro: NequIP의 후속. 비-체이닝(local) 구조로 GPU 병렬화 효율 높음.
- 둘 다 MIT 라이선스 오픈소스.
학습 데이터를 똑같이 주면 MACE와 NequIP/Allegro의 정확도는 종종 동률에 가깝다. 차이는 하드웨어 친화성과 학습 안정성에서 갈린다. 대규모 시스템(수만 원자)에서는 Allegro가 메시지 패싱 깊이가 얕아서 더 빠른 경향이 있다.
DeePMD-kit — 중국발 대규모 MLIP 프레임워크
DeePMD-kit(DPMD)은 베이징 컴퓨터과학연구원과 프린스턴 e-CAS 협력으로 개발된 MLIP 프레임워크다. DeepModeling 컨소시엄(Bohrium, AISI Beijing 등)이 후속 관리.
- Deep Potential Smooth Edition(DeepPot-SE): 원자 좌표를 매끄러운 입력으로 변환하는 인코딩.
- DPA-1, DPA-2 파운데이션 모델: 수십만 분자/결정 시스템 사전학습.
- LAMMPS 통합: 기존 분자동역학 시뮬레이터에 플러그인으로 들어감.
- DP-GEN: 활성 학습 루프 자동화 도구.
중국발 LLaMA에 견줄 만큼, DPMD는 재료과학 MLIP의 "동방 축"으로 자리잡았다. 학술논문 인용 수와 깃허브 스타 모두 MACE/NequIP과 어깨를 나란히 한다.
SchNet, PaiNN, MatGL, CHGNet — 1세대 그래프 신경망 포텐셜 라인업
등변 MLIP가 등장하기 전, 재료과학 GNN의 표준은 SchNet과 PaiNN(둘 다 베를린 TU 그룹)이었다. 2026년에도 가벼운 시스템이나 빠른 프로토타입에는 여전히 쓰인다.
- SchNet: 거리 기반 메시지 패싱. 2017년 제안, 분자/결정 모두 적용.
- PaiNN: SchNet의 방향성 확장. 더 빠르고 정확.
- MatGL/M3GNet: 캘리포니아대 산디에고. Materials Project가 공식 후원. 결정 + 분자 통합 모델.
- CHGNet: 버클리 LBNL. 자성 상태와 전하 분포까지 학습.
- ALIGNN: NIST JARVIS의 라인업. 라인 그래프 인코딩 활용.
CHGNet은 특히 Materials Project가 학습 데이터로 사용한 모든 자성/비자성 구조를 다룬다는 점에서 "범용 결정 시뮬레이터" 후보로 자주 등장한다.
Materials Project — 공개 데이터베이스의 황제
Materials Project(Lawrence Berkeley National Lab + UC Berkeley, Kristin Persson)는 2011년 출범한 무기 결정 DFT 데이터베이스다. 2026년 5월 기준 약 15만 개 무기 결정의 DFT 계산 결과를 공개한다.
- 속성 제공: 형성 에너지, 밴드갭, 탄성, 자성, 유전상수 등 수십 가지.
- REST API:
mp-api파이썬 라이브러리로 직접 조회. - MPContribs: 사용자 기여 데이터 트랙.
- MatGL/M3GNet, CHGNet의 학습 데이터가 주로 MP에서 나온다.
# Materials Project API 사용 예시
from mp_api.client import MPRester
with MPRester(api_key="YOUR_KEY") as mpr:
results = mpr.materials.summary.search(
elements=["Li", "Fe", "P", "O"],
formula="LiFePO4",
fields=["material_id", "formula_pretty", "band_gap", "formation_energy_per_atom"],
)
for r in results:
print(r.material_id, r.formula_pretty, r.band_gap)
GNoME가 발견한 220만 개 후보는 2024년 이후 점진적으로 MP에 통합되고 있다. 즉, MP에 가면 GNoME 결과를 쿼리할 수 있다.
OQMD, AFLOW, NOMAD, JARVIS — 공개 DB 4대 형제
Materials Project 외에도 무기 재료 공개 DB는 4개가 더 있다.
- OQMD(Open Quantum Materials Database): 노스웨스턴대. 100만 개 이상의 DFT 계산. 합금 위주.
- AFLOWlib: 듀크대. 자동화된 DFT 워크플로 결과. Inorganic Crystal Structure Database(ICSD)와 깊이 연계.
- NOMAD: 막스플랑크 + EU FAIR-DI 컨소시엄. 모든 DFT 코드의 결과를 통합 저장.
- JARVIS(Joint Automated Repository for Various Integrated Simulations): NIST. 결정 + 2D 재료 + 자성 + 토폴로지컬 + Allyn 인쇄 등.
각 DB의 강점이 다르다. 합금 검색은 OQMD, 2D 재료는 JARVIS, 다중 코드 호환은 NOMAD, 첫 진입은 Materials Project가 보통이다.
Citrine Informatics — 엔터프라이즈 재료 AI의 표준
Citrine Informatics(2013 설립, 본사 캘리포니아)는 재료과학 AI를 엔터프라이즈에 파는 회사다. 2026년 5월 기준 BASF, Panasonic, Boeing, Saint-Gobain 등 수십 개 글로벌 화학·소재 기업의 R&D 파트너다.
- Citrination 플랫폼: 데이터 인제스천 + 활성 학습 + 후보 추천 + 실험 디자인.
- Pythonic SDK:
citrine-python으로 데이터 모델 정의와 실험 디자인 가능. - 온프레미스 + SaaS 양쪽 제공: 화학·소재 회사의 보안 요구사항 대응.
Citrine은 "AI 발견"보다 **"의사결정 자동화"**에 초점을 둔다. 회사가 가진 사내 데이터(특허, 실험 기록, 시뮬레이션 결과)를 모두 모아 의사결정 모델로 만드는 것이 본질이다.
비슷한 포지셔닝의 경쟁사로 Materials Zone(이스라엘), Uncountable(미국), **Phaseshift(미국)**가 있다.
Schrödinger — NASDAQ 상장 약물·재료 AI 강자
**Schrödinger(NASDAQ: SDGR)**는 1990년 설립된 양자화학 소프트웨어 회사로 출발했다. 2026년 5월 기준 시가총액 약 80억 달러 규모의 상장사이며, 약물 발견 + 재료 발견 두 트랙을 모두 운영한다.
- Maestro: 분자 모델링 GUI 환경.
- Jaguar: 양자화학 계산 엔진(DFT, MP2 등).
- Materials Science Suite: 폴리머, OLED, 배터리 전해질 등 재료 트랙.
- LiveDesign: 약물 발견용 클라우드 협업 환경.
Schrödinger는 자체 약물 후보(SGR-1505, SGR-2921 등)를 임상까지 진행하는 동시에, 대형 제약사(BMS, J&J, 다케다)와 협력 R&D 계약을 맺는다. 매출의 상당 부분이 소프트웨어 라이선스 + 약물 협업 마일스톤에서 발생한다.
RoseTTAFold All-Atom — 단백질·재료 통합 모델
2024년 5월 David Baker 그룹(워싱턴대학 IPD)이 Science에 발표한 RoseTTAFold All-Atom(RFAA) 은 단백질·핵산·소분자·금속이온·공유결합 변형을 모두 한 모델로 예측한다. 단백질만 다루던 RoseTTAFold 2의 후속이다.
- 단일 모델로 단백질-약물 도킹, 핵산-단백질 복합체, 항원-항체 복합체 등 처리.
- AlphaFold 3와 동시기 경쟁: AF3가 비상업 라이선스를 두는 동안 RFAA는 학술 + 비상업 사용을 더 넓게 허용.
- RoseTTAFold Diffusion(RFdiffusion): 단백질 생성 모델. 새로운 결합체를 디자인.
David Baker는 RoseTTAFold + RFdiffusion + 단백질 디자인 패러다임으로 2024년 노벨 화학상을 공동 수상했다. iter86 약물 설계 글에서 단백질 측면을 더 깊게 다뤘다.
Boltz-1, Chai-1, ESM-3 — AlphaFold 3 오픈 대안 라인업
AlphaFold 3가 2024년 5월 Nature에 등장한 직후, 오픈소스 대안이 빠르게 나왔다.
- Boltz-1(MIT, 2024년 11월): AlphaFold 3에 견줄 단백질-리간드 복합체 예측. MIT 라이선스.
- Boltz-2(2025년 후반): 친화도(affinity) 예측까지 통합.
- Chai-1(Chai Discovery, 2024): 영리 스타트업의 오픈 가중치 모델.
- ESM-3(EvolutionaryScale, Meta FAIR 스핀오프): 단백질 시퀀스/구조/함수 통합 LLM.
- OpenFold: AlphaFold 2 오픈 재구현. Columbia + AQEMIA 협력.
- ColabFold: AlphaFold/RoseTTAFold를 Google Colab에서 실행 가능하게 만든 인기 도구.
2026년 5월 기준 Boltz-2가 학술 진영에서 가장 자주 인용되는 AF3 대안이다. Chai-1은 상용 약물 발견 워크플로에 더 많이 채택된다.
Atomwise, Isomorphic Labs, Genesis Therapeutics — AI 신약 발견 양대 트랙
재료과학과 분자 설계 경계에 있는 AI 신약 발견 회사들은 따로 정리해야 한다. iter86 약물 설계 글의 보완 차원에서 짧게 본다.
- Isomorphic Labs(2021 분사, Alphabet 산하): DeepMind에서 분사된 약물 발견 회사. AlphaFold 3 핵심 팀이 합류. Novartis, Eli Lilly와 협업 계약.
- Atomwise(2012 설립, 샌프란시스코): AtomNet 합성곱 신경망 기반 도킹. 수십 개 약물 후보를 임상까지.
- Genesis Therapeutics(스탠퍼드 분사, 2019): GEMS 플랫폼. 그래프 신경망 기반 분자 설계. Genentech와 협업.
- Recursion Pharmaceuticals(NASDAQ: RXRX): 표현형 스크리닝 + AI. NVIDIA가 5천만 달러 투자.
- Exscientia(나스닥 합병 후 Recursion에 인수): 자동화 약물 디자인.
- Insitro(2018 설립, 다프네 콜러): ML + 유도만능줄기세포(iPSC) 결합 신약.
이 회사들은 재료과학 회사라기보다 AI 신약 발견이 본업이지만, 같은 분자 시뮬레이션 + 그래프 신경망 + 생성형 모델 스택을 공유한다.
DFT + AI — VASP, Quantum ESPRESSO, JAX-DFT, DM21
고전 DFT 도구는 여전히 재료과학의 백본이다. AI는 이들을 대체하기보다 가속하는 역할로 합류한다.
- VASP(Vienna Ab initio Simulation Package): 독점 라이선스. 기업·국가연구소 표준.
- Quantum ESPRESSO: GPL 오픈소스. 학계 표준.
- Gaussian, ORCA, Psi4: 분자 양자화학용.
- CP2K, ABINIT: 결정·표면 시뮬레이션.
- JAX-DFT(Google DeepMind, 2024): 자동미분 친화 DFT 구현.
- DM21(DeepMind, 2021): 머신러닝 교환-상관 범함수. 정확도 향상.
ASE(Atomic Simulation Environment, Python)는 위 도구들을 공통 인터페이스로 묶는 표준 라이브러리다. 2026년에도 ASE 없이 재료과학을 한다는 건 상상하기 어렵다.
합성 경로 계획 — IBM RXN, AiZynthFinder, Synthia, Postera
약물·소재 후보 분자를 찾으면 다음 단계는 합성 경로다. 어떤 출발물질로 어떤 반응을 거쳐 만들 수 있는지를 AI가 예측한다.
- IBM RXN for Chemistry: 트랜스포머 기반 retrosynthesis. IBM Cloud SaaS.
- AiZynthFinder(AstraZeneca, 2020 오픈): 몬테카를로 트리 서치 + 신경망. MIT 라이선스.
- Synthia(전 SciFinder Synthia): CAS의 상용 retrosynthesis.
- Postera Manifold: COVID-19 Moonshot 프로젝트에서 출발. 상용 SaaS.
- Molecule.one: 폴란드 스타트업. 합성 가능성 점수 + 경로 예측.
retrosynthesis 모델의 정확도는 2026년 기준 "전문 화학자 수준"에 근접한 것으로 평가된다. AiZynthFinder는 오픈소스로 공개되어 있어 학술 연구에 가장 자주 등장한다.
# AiZynthFinder 사용 예시
from aizynthfinder.aizynthfinder import AiZynthFinder
filename = "config.yml"
finder = AiZynthFinder(configfile=filename)
finder.stock.select("zinc")
finder.expansion_policy.select("uspto")
finder.target_smiles = "Cn1cnc2c1c(=O)n(C)c(=O)n2C"
finder.tree_search()
finder.build_routes()
print(finder.routes[0].metadata)
자동화 합성 랩 — Strateos, Emerald Cloud Labs, OpenTrons
AI가 후보를 추천하고 합성 경로를 짜면, 실제로 합성해 보는 단계가 남는다. 2026년 자동화 합성 랩은 다음 두 갈래다.
- 클라우드 랩: 실험을 코드로 작성하면 원격 시설이 자동 실행. Strateos(전 Transcriptic), Emerald Cloud Lab 양강.
- 데스크톱 자동화: 연구실에 설치하는 자동화 장비. OpenTrons(액체 핸들링 오픈하드웨어), Chemspeed(상용).
- 자율 합성 로봇: AI 의사결정 + 로봇 팔. Berkeley A-Lab, University of Liverpool's mobile robotic chemist.
A-Lab은 GNoME 후보 41개를 17일 만에 자동 합성에 성공해 화제가 됐다(Nature 2023). 이 흐름은 "AI가 발견 → 자동 합성 → 데이터 다시 학습"의 자가 발전 루프를 완성하는 핵심이다.
배터리 + 에너지 재료 — 솔리드 스테이트와 분자 시뮬레이션
배터리는 재료과학 AI의 가장 큰 응용 분야다. 다음이 주목할 만하다.
- 고체전해질: A123 Systems, QuantumScape, Solid Power. AI가 새 고체전해질 후보를 발굴.
- Form Energy: 철-공기 장기 저장. 재료 후보 스크리닝에 ML 적극 활용(iter96 에너지 글).
- DeepMind 배터리 협업: 2024년 LBNL과 결정 + 전해질 협력. GNoME 결과 활용.
- Toyota Research Institute(TRI): 2017년부터 ML 가속 배터리 발견 프로그램. UC Berkeley + Stanford + MIT와 협력.
배터리는 "재료 + 셀 디자인 + 사이클 수명 + 안전성"을 모두 다뤄야 해서, MLIP만으로는 부족하고 전기화학 + 열역학 + 기계공학 시뮬레이션의 결합이 필요하다. Citrine, Materials Zone 같은 회사가 이 통합 시뮬레이션 영역을 노린다.
미국 재료 게놈 이니셔티브(MGI) + EU Battery 2030+
정부 단위 재료 AI 프로그램은 미국과 EU가 가장 잘 정리되어 있다.
- US MGI 2.0(2021 발표): NIST 주도. 데이터 표준화 + AI/ML 통합 + 인력 양성.
- NIST JARVIS, MGI Hub: MGI 산하 데이터·도구 인프라.
- EU Battery 2030+: 2020 발표, 2030년까지 배터리 R&D 가속 로드맵.
- EU NOMAD Lab: 다국적 DFT 데이터 통합.
- EU AI4Industry: 산업 AI 컨소시엄.
각 프로그램의 핵심은 데이터 표준 + 오픈 도구 + 산학협력이다. 미국이 데이터·도구를 만들고 기업이 응용하면, EU는 같은 도구를 공유하면서 산업 전환에 더 무게를 둔다.
한국 재료 AI — KIST, KIMS, POSTECH, 삼성, LG
한국 재료 AI 생태계는 다음 축으로 구성된다.
- 한국과학기술연구원(KIST) 인공지능연구단: AI 재료 디스커버리 트랙. 배터리·촉매 응용.
- 한국재료연구원(KIMS): 합금, 자성, 세라믹 도메인. 한국 재료 게놈 이니셔티브(KMGI) 주도.
- POSTECH 신소재공학과: 재료 AI 트랙. Han Yong Kim 그룹 등.
- KAIST 생명화학공학과 + 신소재공학과: 분자/배터리 ML 연구.
- 삼성 SDI / LG에너지솔루션 / SK온: 배터리 재료 AI. 자체 데이터 + Citrine·Schrödinger 협업.
- 삼성종합기술원: 반도체·디스플레이 신소재 AI.
- LG화학 미래기술센터: 폴리머·바이오 화학 AI.
- SK하이닉스 HBM 재료 AI 트랙: HBM 인터커넥트·열계면 재료 최적화.
한국 정부도 2023년부터 "한국형 재료 게놈 이니셔티브" 예산을 본격 증액했다. 2026년 5월 기준 KMGI 산하 데이터 플랫폼(MaPS)이 베타 운영 중이다.
일본 재료 AI — NIMS, PFN Matlantis, AIST, Mitsubishi Chemical
일본은 재료 AI에서 정부 + 대기업 + 대학의 연계가 특히 촘촘하다.
- NIMS(国立物質・材料研究機構): 일본 재료 연구의 본산. 1956년 설립. MI2I(Materials Integration by Network Initiative) 프로그램 주도.
- AIST(産業技術総合研究所): AI4Materials 컨소시엄.
- 東京大学 + 京都大学 + 東北大学: 재료 정보학(MI) 학과 정착.
- Mitsubishi Chemical Holdings + Preferred Networks(PFN): 2021년 합작 Matlantis 발표. PFN의 PreFerredPotential 파운데이션 모델을 클라우드 SaaS로 제공.
- Asahi Kasei, Showa Denko, Toray, Sumitomo Chemical: 자체 ML 재료 그룹.
- Toyota Research Institute(TRI, 미국 캘리포니아): 일본계 자본의 미국 AI 재료 거점.
Matlantis는 특히 주목할 만하다. 학술 도구가 아니라 상용 SaaS로 MLIP를 제공한 최초의 글로벌 서비스다. 화학·소재 회사가 API로 시뮬레이션을 요청하고 결과를 받는 모델이다.
화학정보학 라이브러리 — RDKit, DeepChem, PyG, e3nn
분자/결정을 다루는 파이썬 표준 라이브러리는 다음 4개다.
- RDKit: BSD 라이선스. 분자 SMILES/SDF 파싱, 지문(fingerprint), 시각화. 화학정보학의 정석.
- DeepChem: Vijay Pande(전 스탠퍼드) 그룹 출발. 화학 ML 워크플로 통합.
- PyG(PyTorch Geometric): 그래프 신경망 일반 라이브러리. 분자/결정에 자주 사용.
- e3nn: 등변 신경망 라이브러리. MACE, NequIP, Allegro의 백엔드.
- ASE(Atomic Simulation Environment): 위에서 다룬 시뮬레이션 코드 통합 표준.
- Pymatgen: Materials Project 공식 파이썬 라이브러리. 결정 구조 조작.
- PySCF: 양자화학 파이썬 구현. 분자 DFT/HF 계산.
# RDKit 분자 지문 예시
from rdkit import Chem
from rdkit.Chem import AllChem
mol = Chem.MolFromSmiles("CC(=O)OC1=CC=CC=C1C(=O)O") # 아스피린
fp = AllChem.GetMorganFingerprintAsBitVect(mol, radius=2, nBits=2048)
print(f"fingerprint bits set: {sum(fp)}")
학회와 워크숍 — MRS, ACS, NeurIPS AI4Mat
재료 AI 연구가 발표되는 주요 무대는 다음과 같다.
- MRS Spring/Fall Meeting: Materials Research Society. 재료과학 전반.
- ACS National Meeting: American Chemical Society. 화학 + 재료 통합.
- APS March Meeting: American Physical Society. 응집물질물리 위주.
- NeurIPS AI4Mat 워크숍: 2022년부터 매년. ML 진영에서 본 재료과학.
- ICML AI4Science: 동일 분야 ICML 트랙.
- AI for Science Workshop(ICLR, NeurIPS).
- MGI Annual Meeting, Korean Materials Society 춘추계 학회.
학회 트렌드는 분명하다. 순수 ML 학회(NeurIPS, ICML)에서 재료 트랙이 빠르게 성장하면서, 전통 재료 학회(MRS, ACS)는 ML 세션을 본 트랙에 편입하는 흐름이다.
한계와 과제 — AI 재료과학이 아직 못 푸는 것
2026년 5월 기준 AI 재료과학은 여전히 다음 한계를 가진다.
- 합성 가능성과 안정성의 격차: 220만 개 GNoME 후보 중 실제 합성된 것은 수십~수백 개 수준. "가상으로 안정"과 "실제로 합성 가능"은 같지 않다.
- 데이터 편향: DFT 데이터가 단순 결정 위주. 비결정 재료(유리, 폴리머, 합금), 결함, 표면, 인터페이스는 데이터 부족.
- 유기 재료의 정확도: 무기 결정에 비해 OLED, 폴리머, 약물 분자의 ML 예측 정확도는 아직 부족.
- 자성·강상관 시스템: DFT 자체의 한계로 자성·고온 초전도·강상관 시스템은 신뢰도가 떨어진다.
- 블랙박스 우려: 생성형 모델이 왜 그 구조를 추천했는지 설명력이 약하다.
- 재현성 위기: 학습 데이터, 코드, 하이퍼파라미터가 모두 공개되어야 재현 가능. OSS화가 진행 중이지만 100%는 아니다.
이 한계들이 풀리는 속도는 곧 "재료과학 AlphaFold 모먼트"가 어디까지 갈지를 결정한다.
마치며 — 2026년 5월, "추측의 시대"가 끝나고 있다
이 글의 출발 질문은 단순했다. "재료과학에 AlphaFold 같은 게 가능한가." 2026년 5월의 답은 "이미 일어나고 있다"이다. GNoME 220만 후보, MatterGen 조건부 생성, Orb-v3 오픈 파운데이션, MACE/NequIP MLIP, Materials Project 인프라, A-Lab 자동 합성 로봇 — 이 모든 조각이 2-3년 사이에 한꺼번에 갖춰졌다.
남은 과제는 이 도구들을 어떻게 산업 전환에 연결할 것인가다. 학술 논문이 아니라 실제 배터리 셀, 실제 항암제, 실제 OLED 패널이 나와야 한다. 그래서 Citrine·Schrödinger·Matlantis 같은 **상용 다리(commercial bridge)**가 향후 5년의 핵심 변수다.
재료과학 종사자라면 지금이 가장 변동성이 높은 시기다. 동시에 가장 보상이 큰 시기이기도 하다. AI 도구를 두려워하지 말고, 자기 도메인 지식 위에 한 겹 올려 사용하는 사람이 가장 빠르게 결과를 낸다.
References
- DeepMind GNoME 논문: https://www.nature.com/articles/s41586-023-06735-9
- Microsoft MatterGen GitHub: https://github.com/microsoft/mattergen
- Microsoft MatterSim 발표: https://www.microsoft.com/en-us/research/blog/mattersim-a-deep-learning-atomistic-model-across-elements-temperatures-and-pressures/
- Orbital Materials Orb 시리즈 GitHub: https://github.com/orbital-materials/orb-models
- MACE GitHub(Cambridge ACEnet): https://github.com/ACEsuit/mace
- NequIP GitHub(Harvard MIT): https://github.com/mir-group/nequip
- Allegro GitHub: https://github.com/mir-group/allegro
- DeePMD-kit 공식 사이트: https://docs.deepmodeling.com/projects/deepmd/en/master/
- SchNetPack GitHub: https://github.com/atomistic-machine-learning/schnetpack
- M3GNet GitHub: https://github.com/materialsvirtuallab/m3gnet
- CHGNet GitHub: https://github.com/CederGroupHub/chgnet
- Materials Project 공식 사이트: https://materialsproject.org/
- OQMD 공식 사이트: https://oqmd.org/
- AFLOWlib 공식 사이트: https://aflowlib.org/
- NOMAD Repository: https://nomad-lab.eu/
- NIST JARVIS: https://jarvis.nist.gov/
- Citrine Informatics 공식 사이트: https://citrine.io/
- Schrödinger 공식 사이트: https://www.schrodinger.com/
- RoseTTAFold All-Atom 논문: https://www.science.org/doi/10.1126/science.adl2528
- Boltz-1 GitHub(MIT): https://github.com/jwohlwend/boltz
- Chai-1 발표: https://www.chaidiscovery.com/blog/introducing-chai-1
- ESM-3 발표(EvolutionaryScale): https://www.evolutionaryscale.ai/blog/esm3-release
- IBM RXN for Chemistry: https://rxn.app.accelerate.science/
- AiZynthFinder GitHub: https://github.com/MolecularAI/aizynthfinder
- Berkeley A-Lab 논문: https://www.nature.com/articles/s41586-023-06734-w
- Materials Genome Initiative: https://www.mgi.gov/
- NIMS MI2I: https://www.nims.go.jp/MII-I/en/
- Preferred Networks Matlantis: https://matlantis.com/
- RDKit 공식 문서: https://www.rdkit.org/docs/
- Pymatgen 공식 문서: https://pymatgen.org/
- e3nn 공식 문서: https://docs.e3nn.org/