필사 모드: AI 재료과학 & 화학 2026 완벽 가이드 - DeepMind GNoME · Microsoft MatterGen · Orbital Materials · Citrine Informatics · Schrödinger · RoseTTAFold All-Atom · Boltz-1 · MACE · NequIP · DPMD 심층 분석
한국어들어가며 — 2026년 5월, 재료과학이 "AlphaFold 모먼트"를 통과하다
2024년 노벨 화학상을 David Baker(단백질 설계)와 Demis Hassabis · John Jumper(AlphaFold)가 가져간 사건은 단순한 뉴스가 아니었다. **계산 화학 + 딥러닝**이 학계가 인정한 새로운 연구 방법론이 됐다는 선언이었다. 같은 흐름은 단백질을 넘어 **무기 결정, 촉매, 배터리 전극, 폴리머**로 확산 중이다.
2023년 11월 DeepMind GNoME가 **220만 개 안정 결정 후보**를 발표하고, 2025년 1월 Microsoft가 생성형 결정 모델 **MatterGen**을 공개하고, 같은 분기 Orbital Materials가 GPT 스타일 재료 파운데이션 모델 **Orb-v3**를 오픈소스로 풀면서 판이 완전히 바뀌었다. 2026년 5월 현재, "신소재 한 개를 발견하는 평균 비용"이 10년 전 1만 분의 1로 떨어졌다는 추정이 진지하게 논의된다. iter86 약물 설계 글에 이어, 이번 글은 그 인접 영역인 재료과학·화학을 본다.
왜 재료과학 AI가 2026년의 화두인가 — 발견 비용의 붕괴
전통 재료과학은 **추측 → 합성 → 측정**의 루프로 평균 18-30년이 걸렸다. 리튬이온 배터리, 페로브스카이트 태양전지, 고온 초전도체 모두 비슷한 길이의 발견-상용화 주기를 거쳤다. AI 재료과학이 이 주기를 깨려는 시도는 다음 세 가지 도구를 결합한다.
- **DFT(밀도범함수 이론) 시뮬레이션**: 양자역학 기반 첫 원리 계산. 정확하지만 한 계산에 수 시간 이상.
- **머신러닝 원자간 포텐셜(MLIP)**: DFT 정확도를 유지하면서 추론 속도를 10^4-10^6 배 가속.
- **생성형 모델**: 원하는 물성을 갖는 결정 구조를 새로 만들어 낸다.
이 세 도구를 결합해 "물성으로부터 후보 구조 생성 → MLIP로 빠른 1차 평가 → DFT로 검증 → 합성"이라는 **역설계 파이프라인**이 표준이 됐다.
DeepMind GNoME — 2.2M 결정 후보가 던진 충격
**GNoME(Graph Networks for Materials Exploration)**는 DeepMind가 2023년 11월 Nature 논문으로 공개한 결정 구조 발견 프로젝트다. 핵심 결과는 한 줄로 요약된다.
- **220만 개 새로운 안정 결정 후보**: 그중 38만 개가 합성 가능성이 높다고 분류.
- **활성 학습 루프**: 그래프 신경망이 후보를 제안 → DFT로 검증 → 검증된 결과를 다시 학습.
- **공개**: 데이터는 **Materials Project Database**에 통합 공개.
GNoME가 던진 충격은 단순한 숫자가 아니다. **48,000개**(2023년까지 인류가 알던 안정 무기 결정)에서 220만 개로 한 단계에 단위가 두 자릿수 뛰었다. 후속 연구로 2024년에는 **Berkeley A-Lab**이 GNoME 후보 중 41개를 자동 합성에 성공하면서 "AI 발견 + 자동 합성" 루프가 실증됐다.
DeepMind는 GNoME 모델 자체는 비공개로 두고 데이터만 풀었다. 그러나 후속 연구자들이 같은 아이디어로 만든 오픈 모델이 빠르게 나오고 있는 상황이다.
Microsoft MatterGen — 생성형 결정 구조 모델의 표준
2025년 1월 Microsoft Research가 Nature에 발표하고 동시에 오픈소스로 푼 **MatterGen**은 **확산(diffusion) 모델 기반 결정 구조 생성기**다. GNoME가 "안정한 결정을 발견"했다면, MatterGen은 **"원하는 물성을 갖는 결정을 디자인"**한다.
- **조건부 생성**: 화학 조성, 대칭성, 자성, 밴드갭, 탄성률 등 물성 조건을 입력으로 받음.
- **확산 모델 구조**: 결정 좌표 + 격자 매개변수에 노이즈를 더한 후 역확산.
- **Equivariant GNN 백본**: 회전·평행이동 대칭성을 학습 단계에서 보장.
Microsoft는 동일 라인업으로 **MatterSim**도 공개했다. MatterSim은 MatterGen이 생성한 구조의 안정성/물성을 빠르게 평가하는 시뮬레이터 역할이다. 두 모델을 묶어 "생성 + 평가" 파이프라인을 한 회사가 모두 제공한다는 점이 의미 있다.
MatterGen의 GitHub 리포지토리는 MIT 라이선스로 공개되어 있다.
MatterGen 추론 예시(공식 README 의사 코드)
from mattergen.evaluation import StructureValidator
from mattergen.generation import MatterGenPipeline
pipe = MatterGenPipeline.from_pretrained("microsoft/MatterGen")
structures = pipe.sample(
composition={"Li": 1, "Fe": 1, "P": 1, "O": 4},
target_bandgap=2.5,
n_samples=100,
)
validator = StructureValidator.from_pretrained("microsoft/MatterSim")
scored = validator.score(structures)
Orbital Materials Orb-v3 — 오픈소스 GPT 스타일 재료 파운데이션 모델
영국 스타트업 **Orbital Materials**는 2024-2025년 사이 **Orb 시리즈**를 발표하면서 빠르게 떠올랐다. Orb-v3(2025년 말)는 다음 특징을 가진다.
- **GPT 스타일 디코더 아키텍처**: 원자 시퀀스를 자기회귀로 생성.
- **수억 개 DFT 시뮬레이션 데이터**로 학습.
- **물성 예측 + 구조 생성 + 동역학 시뮬레이션**을 한 모델로 처리.
- **Apache 2.0 오픈소스**: Hugging Face Hub에 가중치 공개.
Orbital Materials는 "재료과학용 GPT-3 모먼트"를 목표로 한다고 명시한다. 단일 거대 모델을 학습해 두고, 다양한 다운스트림 태스크에 파인튜닝하는 패턴을 재료과학에 옮긴 것이다.
비슷한 흐름의 모델로 **DPA-2**(DeepModeling 컨소시엄, 중국), **EquiformerV2**(MIT, Hugging Face), **PreFerredPotential**(PFN 매트랜티스)가 있다. 2026년 5월 기준 "재료 파운데이션 모델"은 5-6개가 경쟁 중이다.
MACE — 머신러닝 원자간 포텐셜의 정확도 리더
분자동역학(MD) 시뮬레이션에서 가장 비싼 부분은 매 시간 스텝마다 원자 간 힘을 계산하는 것이다. DFT로 직접 계산하면 한 시뮬레이션에 며칠이 걸린다. **MLIP(Machine-Learned Interatomic Potential)** 는 이 힘 계산을 신경망으로 대체해 **속도를 4-6 자릿수 가속**한다.
**MACE(MACE for atomistic simulations)**는 케임브리지 대학 ACEnet 그룹이 만든 등변(equivariant) MLIP다. 2026년 5월 기준 정확도 부문 리더로 평가된다.
- **고차 다체 메시지 패싱**: 2-, 3-, 4-체 상호작용을 직접 모델링.
- **E(3) 등변성**: 회전과 평행이동에 대한 대칭성을 구조적으로 보장.
- **Multi-fidelity**: 적은 DFT 데이터로도 학습 가능.
- **MIT 라이선스**: Cambridge ACEnet GitHub에 공개.
MACE의 성능은 다음 벤치마크에서 확인된다. SPICE 데이터셋, MPtrj(Materials Project 학습 분할), OC22/OC20(Open Catalyst), Matbench 등에서 상위권. 특히 **Foundation Model 변형(MACE-MP-0, MACE-MP-2)**은 사전학습된 가중치를 그대로 다운로드해 다양한 시스템에 zero-shot으로 적용할 수 있다.
MACE Foundation Model 사용 예시
from mace.calculators import mace_mp
from ase.build import bulk
atoms = bulk("Si", "diamond", a=5.43)
calc = mace_mp(model="medium", dispersion=False, default_dtype="float32")
atoms.calc = calc
energy = atoms.get_potential_energy()
forces = atoms.get_forces()
NequIP, Allegro — 등변 신경망 포텐셜의 또 다른 축
MACE와 함께 등변 MLIP 진영의 양대 축은 **NequIP(Neural Equivariant Interatomic Potentials)**와 그 후속 **Allegro**다. 둘 다 하버드 MIT 공동연구진(Boris Kozinsky 그룹)의 작품이다.
- **NequIP**: 등변 메시지 패싱. 작은 데이터셋에서 SchNet 대비 정확도 큰 폭 향상.
- **Allegro**: NequIP의 후속. 비-체이닝(local) 구조로 GPU 병렬화 효율 높음.
- **둘 다 MIT 라이선스 오픈소스**.
학습 데이터를 똑같이 주면 MACE와 NequIP/Allegro의 정확도는 종종 동률에 가깝다. 차이는 **하드웨어 친화성과 학습 안정성**에서 갈린다. 대규모 시스템(수만 원자)에서는 Allegro가 메시지 패싱 깊이가 얕아서 더 빠른 경향이 있다.
DeePMD-kit — 중국발 대규모 MLIP 프레임워크
**DeePMD-kit**(DPMD)은 베이징 컴퓨터과학연구원과 프린스턴 e-CAS 협력으로 개발된 MLIP 프레임워크다. **DeepModeling 컨소시엄**(Bohrium, AISI Beijing 등)이 후속 관리.
- **Deep Potential Smooth Edition(DeepPot-SE)**: 원자 좌표를 매끄러운 입력으로 변환하는 인코딩.
- **DPA-1, DPA-2 파운데이션 모델**: 수십만 분자/결정 시스템 사전학습.
- **LAMMPS 통합**: 기존 분자동역학 시뮬레이터에 플러그인으로 들어감.
- **DP-GEN**: 활성 학습 루프 자동화 도구.
중국발 LLaMA에 견줄 만큼, DPMD는 재료과학 MLIP의 "동방 축"으로 자리잡았다. 학술논문 인용 수와 깃허브 스타 모두 MACE/NequIP과 어깨를 나란히 한다.
SchNet, PaiNN, MatGL, CHGNet — 1세대 그래프 신경망 포텐셜 라인업
등변 MLIP가 등장하기 전, 재료과학 GNN의 표준은 **SchNet과 PaiNN**(둘 다 베를린 TU 그룹)이었다. 2026년에도 가벼운 시스템이나 빠른 프로토타입에는 여전히 쓰인다.
- **SchNet**: 거리 기반 메시지 패싱. 2017년 제안, 분자/결정 모두 적용.
- **PaiNN**: SchNet의 방향성 확장. 더 빠르고 정확.
- **MatGL/M3GNet**: 캘리포니아대 산디에고. Materials Project가 공식 후원. 결정 + 분자 통합 모델.
- **CHGNet**: 버클리 LBNL. 자성 상태와 전하 분포까지 학습.
- **ALIGNN**: NIST JARVIS의 라인업. 라인 그래프 인코딩 활용.
CHGNet은 특히 Materials Project가 학습 데이터로 사용한 모든 자성/비자성 구조를 다룬다는 점에서 "범용 결정 시뮬레이터" 후보로 자주 등장한다.
Materials Project — 공개 데이터베이스의 황제
**Materials Project**(Lawrence Berkeley National Lab + UC Berkeley, Kristin Persson)는 2011년 출범한 무기 결정 DFT 데이터베이스다. 2026년 5월 기준 약 **15만 개 무기 결정**의 DFT 계산 결과를 공개한다.
- **속성 제공**: 형성 에너지, 밴드갭, 탄성, 자성, 유전상수 등 수십 가지.
- **REST API**: `mp-api` 파이썬 라이브러리로 직접 조회.
- **MPContribs**: 사용자 기여 데이터 트랙.
- **MatGL/M3GNet, CHGNet의 학습 데이터**가 주로 MP에서 나온다.
Materials Project API 사용 예시
from mp_api.client import MPRester
with MPRester(api_key="YOUR_KEY") as mpr:
results = mpr.materials.summary.search(
elements=["Li", "Fe", "P", "O"],
formula="LiFePO4",
fields=["material_id", "formula_pretty", "band_gap", "formation_energy_per_atom"],
)
for r in results:
print(r.material_id, r.formula_pretty, r.band_gap)
GNoME가 발견한 220만 개 후보는 2024년 이후 점진적으로 MP에 통합되고 있다. 즉, MP에 가면 GNoME 결과를 쿼리할 수 있다.
OQMD, AFLOW, NOMAD, JARVIS — 공개 DB 4대 형제
Materials Project 외에도 무기 재료 공개 DB는 4개가 더 있다.
- **OQMD(Open Quantum Materials Database)**: 노스웨스턴대. 100만 개 이상의 DFT 계산. 합금 위주.
- **AFLOWlib**: 듀크대. 자동화된 DFT 워크플로 결과. Inorganic Crystal Structure Database(ICSD)와 깊이 연계.
- **NOMAD**: 막스플랑크 + EU FAIR-DI 컨소시엄. 모든 DFT 코드의 결과를 통합 저장.
- **JARVIS(Joint Automated Repository for Various Integrated Simulations)**: NIST. 결정 + 2D 재료 + 자성 + 토폴로지컬 + Allyn 인쇄 등.
각 DB의 강점이 다르다. 합금 검색은 OQMD, 2D 재료는 JARVIS, 다중 코드 호환은 NOMAD, 첫 진입은 Materials Project가 보통이다.
Citrine Informatics — 엔터프라이즈 재료 AI의 표준
**Citrine Informatics**(2013 설립, 본사 캘리포니아)는 재료과학 AI를 엔터프라이즈에 파는 회사다. 2026년 5월 기준 BASF, Panasonic, Boeing, Saint-Gobain 등 수십 개 글로벌 화학·소재 기업의 R&D 파트너다.
- **Citrination 플랫폼**: 데이터 인제스천 + 활성 학습 + 후보 추천 + 실험 디자인.
- **Pythonic SDK**: `citrine-python`으로 데이터 모델 정의와 실험 디자인 가능.
- **온프레미스 + SaaS 양쪽 제공**: 화학·소재 회사의 보안 요구사항 대응.
Citrine은 "AI 발견"보다 **"의사결정 자동화"**에 초점을 둔다. 회사가 가진 사내 데이터(특허, 실험 기록, 시뮬레이션 결과)를 모두 모아 의사결정 모델로 만드는 것이 본질이다.
비슷한 포지셔닝의 경쟁사로 **Materials Zone(이스라엘)**, **Uncountable(미국)**, **Phaseshift(미국)**가 있다.
Schrödinger — NASDAQ 상장 약물·재료 AI 강자
**Schrödinger(NASDAQ: SDGR)**는 1990년 설립된 양자화학 소프트웨어 회사로 출발했다. 2026년 5월 기준 시가총액 약 80억 달러 규모의 상장사이며, **약물 발견 + 재료 발견** 두 트랙을 모두 운영한다.
- **Maestro**: 분자 모델링 GUI 환경.
- **Jaguar**: 양자화학 계산 엔진(DFT, MP2 등).
- **Materials Science Suite**: 폴리머, OLED, 배터리 전해질 등 재료 트랙.
- **LiveDesign**: 약물 발견용 클라우드 협업 환경.
Schrödinger는 자체 약물 후보(SGR-1505, SGR-2921 등)를 임상까지 진행하는 동시에, 대형 제약사(BMS, J&J, 다케다)와 협력 R&D 계약을 맺는다. 매출의 상당 부분이 **소프트웨어 라이선스 + 약물 협업 마일스톤**에서 발생한다.
RoseTTAFold All-Atom — 단백질·재료 통합 모델
2024년 5월 David Baker 그룹(워싱턴대학 IPD)이 Science에 발표한 **RoseTTAFold All-Atom(RFAA)** 은 단백질·핵산·소분자·금속이온·공유결합 변형을 **모두 한 모델로** 예측한다. 단백질만 다루던 RoseTTAFold 2의 후속이다.
- **단일 모델로 단백질-약물 도킹, 핵산-단백질 복합체, 항원-항체 복합체** 등 처리.
- **AlphaFold 3와 동시기 경쟁**: AF3가 비상업 라이선스를 두는 동안 RFAA는 학술 + 비상업 사용을 더 넓게 허용.
- **RoseTTAFold Diffusion(RFdiffusion)**: 단백질 생성 모델. 새로운 결합체를 디자인.
David Baker는 RoseTTAFold + RFdiffusion + 단백질 디자인 패러다임으로 2024년 노벨 화학상을 공동 수상했다. iter86 약물 설계 글에서 단백질 측면을 더 깊게 다뤘다.
Boltz-1, Chai-1, ESM-3 — AlphaFold 3 오픈 대안 라인업
AlphaFold 3가 2024년 5월 Nature에 등장한 직후, **오픈소스 대안**이 빠르게 나왔다.
- **Boltz-1**(MIT, 2024년 11월): AlphaFold 3에 견줄 단백질-리간드 복합체 예측. MIT 라이선스.
- **Boltz-2**(2025년 후반): 친화도(affinity) 예측까지 통합.
- **Chai-1**(Chai Discovery, 2024): 영리 스타트업의 오픈 가중치 모델.
- **ESM-3**(EvolutionaryScale, Meta FAIR 스핀오프): 단백질 시퀀스/구조/함수 통합 LLM.
- **OpenFold**: AlphaFold 2 오픈 재구현. Columbia + AQEMIA 협력.
- **ColabFold**: AlphaFold/RoseTTAFold를 Google Colab에서 실행 가능하게 만든 인기 도구.
2026년 5월 기준 **Boltz-2**가 학술 진영에서 가장 자주 인용되는 AF3 대안이다. Chai-1은 상용 약물 발견 워크플로에 더 많이 채택된다.
Atomwise, Isomorphic Labs, Genesis Therapeutics — AI 신약 발견 양대 트랙
재료과학과 분자 설계 경계에 있는 **AI 신약 발견** 회사들은 따로 정리해야 한다. iter86 약물 설계 글의 보완 차원에서 짧게 본다.
- **Isomorphic Labs**(2021 분사, Alphabet 산하): DeepMind에서 분사된 약물 발견 회사. AlphaFold 3 핵심 팀이 합류. Novartis, Eli Lilly와 협업 계약.
- **Atomwise**(2012 설립, 샌프란시스코): AtomNet 합성곱 신경망 기반 도킹. 수십 개 약물 후보를 임상까지.
- **Genesis Therapeutics**(스탠퍼드 분사, 2019): GEMS 플랫폼. 그래프 신경망 기반 분자 설계. Genentech와 협업.
- **Recursion Pharmaceuticals**(NASDAQ: RXRX): 표현형 스크리닝 + AI. NVIDIA가 5천만 달러 투자.
- **Exscientia**(나스닥 합병 후 Recursion에 인수): 자동화 약물 디자인.
- **Insitro**(2018 설립, 다프네 콜러): ML + 유도만능줄기세포(iPSC) 결합 신약.
이 회사들은 재료과학 회사라기보다 **AI 신약 발견**이 본업이지만, 같은 분자 시뮬레이션 + 그래프 신경망 + 생성형 모델 스택을 공유한다.
DFT + AI — VASP, Quantum ESPRESSO, JAX-DFT, DM21
고전 DFT 도구는 여전히 재료과학의 백본이다. AI는 이들을 **대체하기보다 가속**하는 역할로 합류한다.
- **VASP(Vienna Ab initio Simulation Package)**: 독점 라이선스. 기업·국가연구소 표준.
- **Quantum ESPRESSO**: GPL 오픈소스. 학계 표준.
- **Gaussian, ORCA, Psi4**: 분자 양자화학용.
- **CP2K, ABINIT**: 결정·표면 시뮬레이션.
- **JAX-DFT**(Google DeepMind, 2024): 자동미분 친화 DFT 구현.
- **DM21**(DeepMind, 2021): 머신러닝 교환-상관 범함수. 정확도 향상.
ASE(Atomic Simulation Environment, Python)는 위 도구들을 **공통 인터페이스**로 묶는 표준 라이브러리다. 2026년에도 ASE 없이 재료과학을 한다는 건 상상하기 어렵다.
합성 경로 계획 — IBM RXN, AiZynthFinder, Synthia, Postera
약물·소재 후보 분자를 찾으면 다음 단계는 **합성 경로**다. 어떤 출발물질로 어떤 반응을 거쳐 만들 수 있는지를 AI가 예측한다.
- **IBM RXN for Chemistry**: 트랜스포머 기반 retrosynthesis. IBM Cloud SaaS.
- **AiZynthFinder**(AstraZeneca, 2020 오픈): 몬테카를로 트리 서치 + 신경망. MIT 라이선스.
- **Synthia(전 SciFinder Synthia)**: CAS의 상용 retrosynthesis.
- **Postera Manifold**: COVID-19 Moonshot 프로젝트에서 출발. 상용 SaaS.
- **Molecule.one**: 폴란드 스타트업. 합성 가능성 점수 + 경로 예측.
retrosynthesis 모델의 정확도는 2026년 기준 "전문 화학자 수준"에 근접한 것으로 평가된다. AiZynthFinder는 오픈소스로 공개되어 있어 학술 연구에 가장 자주 등장한다.
AiZynthFinder 사용 예시
from aizynthfinder.aizynthfinder import AiZynthFinder
filename = "config.yml"
finder = AiZynthFinder(configfile=filename)
finder.stock.select("zinc")
finder.expansion_policy.select("uspto")
finder.target_smiles = "Cn1cnc2c1c(=O)n(C)c(=O)n2C"
finder.tree_search()
finder.build_routes()
print(finder.routes[0].metadata)
자동화 합성 랩 — Strateos, Emerald Cloud Labs, OpenTrons
AI가 후보를 추천하고 합성 경로를 짜면, **실제로 합성해 보는 단계**가 남는다. 2026년 자동화 합성 랩은 다음 두 갈래다.
- **클라우드 랩**: 실험을 코드로 작성하면 원격 시설이 자동 실행. **Strateos**(전 Transcriptic), **Emerald Cloud Lab** 양강.
- **데스크톱 자동화**: 연구실에 설치하는 자동화 장비. **OpenTrons**(액체 핸들링 오픈하드웨어), **Chemspeed**(상용).
- **자율 합성 로봇**: AI 의사결정 + 로봇 팔. **Berkeley A-Lab**, **University of Liverpool's mobile robotic chemist**.
A-Lab은 GNoME 후보 41개를 17일 만에 자동 합성에 성공해 화제가 됐다(Nature 2023). 이 흐름은 "AI가 발견 → 자동 합성 → 데이터 다시 학습"의 자가 발전 루프를 완성하는 핵심이다.
배터리 + 에너지 재료 — 솔리드 스테이트와 분자 시뮬레이션
배터리는 재료과학 AI의 가장 큰 응용 분야다. 다음이 주목할 만하다.
- **고체전해질**: A123 Systems, QuantumScape, Solid Power. AI가 새 고체전해질 후보를 발굴.
- **Form Energy**: 철-공기 장기 저장. 재료 후보 스크리닝에 ML 적극 활용(iter96 에너지 글).
- **DeepMind 배터리 협업**: 2024년 LBNL과 결정 + 전해질 협력. GNoME 결과 활용.
- **Toyota Research Institute(TRI)**: 2017년부터 ML 가속 배터리 발견 프로그램. UC Berkeley + Stanford + MIT와 협력.
배터리는 "재료 + 셀 디자인 + 사이클 수명 + 안전성"을 모두 다뤄야 해서, MLIP만으로는 부족하고 **전기화학 + 열역학 + 기계공학 시뮬레이션**의 결합이 필요하다. Citrine, Materials Zone 같은 회사가 이 통합 시뮬레이션 영역을 노린다.
미국 재료 게놈 이니셔티브(MGI) + EU Battery 2030+
정부 단위 재료 AI 프로그램은 미국과 EU가 가장 잘 정리되어 있다.
- **US MGI 2.0**(2021 발표): NIST 주도. 데이터 표준화 + AI/ML 통합 + 인력 양성.
- **NIST JARVIS**, **MGI Hub**: MGI 산하 데이터·도구 인프라.
- **EU Battery 2030+**: 2020 발표, 2030년까지 배터리 R&D 가속 로드맵.
- **EU NOMAD Lab**: 다국적 DFT 데이터 통합.
- **EU AI4Industry**: 산업 AI 컨소시엄.
각 프로그램의 핵심은 **데이터 표준 + 오픈 도구 + 산학협력**이다. 미국이 데이터·도구를 만들고 기업이 응용하면, EU는 같은 도구를 공유하면서 산업 전환에 더 무게를 둔다.
한국 재료 AI — KIST, KIMS, POSTECH, 삼성, LG
한국 재료 AI 생태계는 다음 축으로 구성된다.
- **한국과학기술연구원(KIST) 인공지능연구단**: AI 재료 디스커버리 트랙. 배터리·촉매 응용.
- **한국재료연구원(KIMS)**: 합금, 자성, 세라믹 도메인. 한국 재료 게놈 이니셔티브(KMGI) 주도.
- **POSTECH 신소재공학과**: 재료 AI 트랙. Han Yong Kim 그룹 등.
- **KAIST 생명화학공학과 + 신소재공학과**: 분자/배터리 ML 연구.
- **삼성 SDI / LG에너지솔루션 / SK온**: 배터리 재료 AI. 자체 데이터 + Citrine·Schrödinger 협업.
- **삼성종합기술원**: 반도체·디스플레이 신소재 AI.
- **LG화학 미래기술센터**: 폴리머·바이오 화학 AI.
- **SK하이닉스 HBM 재료 AI 트랙**: HBM 인터커넥트·열계면 재료 최적화.
한국 정부도 2023년부터 "한국형 재료 게놈 이니셔티브" 예산을 본격 증액했다. 2026년 5월 기준 KMGI 산하 데이터 플랫폼(MaPS)이 베타 운영 중이다.
일본 재료 AI — NIMS, PFN Matlantis, AIST, Mitsubishi Chemical
일본은 재료 AI에서 정부 + 대기업 + 대학의 연계가 특히 촘촘하다.
- **NIMS(国立物質・材料研究機構)**: 일본 재료 연구의 본산. 1956년 설립. MI2I(Materials Integration by Network Initiative) 프로그램 주도.
- **AIST(産業技術総合研究所)**: AI4Materials 컨소시엄.
- **東京大学 + 京都大学 + 東北大学**: 재료 정보학(MI) 학과 정착.
- **Mitsubishi Chemical Holdings + Preferred Networks(PFN)**: 2021년 합작 **Matlantis** 발표. PFN의 PreFerredPotential 파운데이션 모델을 클라우드 SaaS로 제공.
- **Asahi Kasei, Showa Denko, Toray, Sumitomo Chemical**: 자체 ML 재료 그룹.
- **Toyota Research Institute(TRI, 미국 캘리포니아)**: 일본계 자본의 미국 AI 재료 거점.
Matlantis는 특히 주목할 만하다. 학술 도구가 아니라 **상용 SaaS**로 MLIP를 제공한 최초의 글로벌 서비스다. 화학·소재 회사가 API로 시뮬레이션을 요청하고 결과를 받는 모델이다.
화학정보학 라이브러리 — RDKit, DeepChem, PyG, e3nn
분자/결정을 다루는 파이썬 표준 라이브러리는 다음 4개다.
- **RDKit**: BSD 라이선스. 분자 SMILES/SDF 파싱, 지문(fingerprint), 시각화. 화학정보학의 정석.
- **DeepChem**: Vijay Pande(전 스탠퍼드) 그룹 출발. 화학 ML 워크플로 통합.
- **PyG(PyTorch Geometric)**: 그래프 신경망 일반 라이브러리. 분자/결정에 자주 사용.
- **e3nn**: 등변 신경망 라이브러리. MACE, NequIP, Allegro의 백엔드.
- **ASE(Atomic Simulation Environment)**: 위에서 다룬 시뮬레이션 코드 통합 표준.
- **Pymatgen**: Materials Project 공식 파이썬 라이브러리. 결정 구조 조작.
- **PySCF**: 양자화학 파이썬 구현. 분자 DFT/HF 계산.
RDKit 분자 지문 예시
from rdkit import Chem
from rdkit.Chem import AllChem
mol = Chem.MolFromSmiles("CC(=O)OC1=CC=CC=C1C(=O)O") # 아스피린
fp = AllChem.GetMorganFingerprintAsBitVect(mol, radius=2, nBits=2048)
print(f"fingerprint bits set: {sum(fp)}")
학회와 워크숍 — MRS, ACS, NeurIPS AI4Mat
재료 AI 연구가 발표되는 주요 무대는 다음과 같다.
- **MRS Spring/Fall Meeting**: Materials Research Society. 재료과학 전반.
- **ACS National Meeting**: American Chemical Society. 화학 + 재료 통합.
- **APS March Meeting**: American Physical Society. 응집물질물리 위주.
- **NeurIPS AI4Mat 워크숍**: 2022년부터 매년. ML 진영에서 본 재료과학.
- **ICML AI4Science**: 동일 분야 ICML 트랙.
- **AI for Science Workshop(ICLR, NeurIPS)**.
- **MGI Annual Meeting**, **Korean Materials Society 춘추계** 학회.
학회 트렌드는 분명하다. **순수 ML 학회(NeurIPS, ICML)에서 재료 트랙이 빠르게 성장**하면서, 전통 재료 학회(MRS, ACS)는 ML 세션을 본 트랙에 편입하는 흐름이다.
한계와 과제 — AI 재료과학이 아직 못 푸는 것
2026년 5월 기준 AI 재료과학은 여전히 다음 한계를 가진다.
- **합성 가능성과 안정성의 격차**: 220만 개 GNoME 후보 중 실제 합성된 것은 수십~수백 개 수준. "가상으로 안정"과 "실제로 합성 가능"은 같지 않다.
- **데이터 편향**: DFT 데이터가 단순 결정 위주. 비결정 재료(유리, 폴리머, 합금), 결함, 표면, 인터페이스는 데이터 부족.
- **유기 재료의 정확도**: 무기 결정에 비해 OLED, 폴리머, 약물 분자의 ML 예측 정확도는 아직 부족.
- **자성·강상관 시스템**: DFT 자체의 한계로 자성·고온 초전도·강상관 시스템은 신뢰도가 떨어진다.
- **블랙박스 우려**: 생성형 모델이 왜 그 구조를 추천했는지 설명력이 약하다.
- **재현성 위기**: 학습 데이터, 코드, 하이퍼파라미터가 모두 공개되어야 재현 가능. OSS화가 진행 중이지만 100%는 아니다.
이 한계들이 풀리는 속도는 곧 "재료과학 AlphaFold 모먼트"가 어디까지 갈지를 결정한다.
마치며 — 2026년 5월, "추측의 시대"가 끝나고 있다
이 글의 출발 질문은 단순했다. "재료과학에 AlphaFold 같은 게 가능한가." 2026년 5월의 답은 "이미 일어나고 있다"이다. GNoME 220만 후보, MatterGen 조건부 생성, Orb-v3 오픈 파운데이션, MACE/NequIP MLIP, Materials Project 인프라, A-Lab 자동 합성 로봇 — 이 모든 조각이 2-3년 사이에 한꺼번에 갖춰졌다.
남은 과제는 **이 도구들을 어떻게 산업 전환에 연결할 것인가**다. 학술 논문이 아니라 실제 배터리 셀, 실제 항암제, 실제 OLED 패널이 나와야 한다. 그래서 Citrine·Schrödinger·Matlantis 같은 **상용 다리(commercial bridge)**가 향후 5년의 핵심 변수다.
재료과학 종사자라면 지금이 가장 변동성이 높은 시기다. 동시에 가장 보상이 큰 시기이기도 하다. AI 도구를 두려워하지 말고, 자기 도메인 지식 위에 한 겹 올려 사용하는 사람이 가장 빠르게 결과를 낸다.
References
- DeepMind GNoME 논문: https://www.nature.com/articles/s41586-023-06735-9
- Microsoft MatterGen GitHub: https://github.com/microsoft/mattergen
- Microsoft MatterSim 발표: https://www.microsoft.com/en-us/research/blog/mattersim-a-deep-learning-atomistic-model-across-elements-temperatures-and-pressures/
- Orbital Materials Orb 시리즈 GitHub: https://github.com/orbital-materials/orb-models
- MACE GitHub(Cambridge ACEnet): https://github.com/ACEsuit/mace
- NequIP GitHub(Harvard MIT): https://github.com/mir-group/nequip
- Allegro GitHub: https://github.com/mir-group/allegro
- DeePMD-kit 공식 사이트: https://docs.deepmodeling.com/projects/deepmd/en/master/
- SchNetPack GitHub: https://github.com/atomistic-machine-learning/schnetpack
- M3GNet GitHub: https://github.com/materialsvirtuallab/m3gnet
- CHGNet GitHub: https://github.com/CederGroupHub/chgnet
- Materials Project 공식 사이트: https://materialsproject.org/
- OQMD 공식 사이트: https://oqmd.org/
- AFLOWlib 공식 사이트: https://aflowlib.org/
- NOMAD Repository: https://nomad-lab.eu/
- NIST JARVIS: https://jarvis.nist.gov/
- Citrine Informatics 공식 사이트: https://citrine.io/
- Schrödinger 공식 사이트: https://www.schrodinger.com/
- RoseTTAFold All-Atom 논문: https://www.science.org/doi/10.1126/science.adl2528
- Boltz-1 GitHub(MIT): https://github.com/jwohlwend/boltz
- Chai-1 발표: https://www.chaidiscovery.com/blog/introducing-chai-1
- ESM-3 발표(EvolutionaryScale): https://www.evolutionaryscale.ai/blog/esm3-release
- IBM RXN for Chemistry: https://rxn.app.accelerate.science/
- AiZynthFinder GitHub: https://github.com/MolecularAI/aizynthfinder
- Berkeley A-Lab 논문: https://www.nature.com/articles/s41586-023-06734-w
- Materials Genome Initiative: https://www.mgi.gov/
- NIMS MI2I: https://www.nims.go.jp/MII-I/en/
- Preferred Networks Matlantis: https://matlantis.com/
- RDKit 공식 문서: https://www.rdkit.org/docs/
- Pymatgen 공식 문서: https://pymatgen.org/
- e3nn 공식 문서: https://docs.e3nn.org/
현재 단락 (1/246)
2024년 노벨 화학상을 David Baker(단백질 설계)와 Demis Hassabis · John Jumper(AlphaFold)가 가져간 사건은 단순한 뉴스가 아니었다. **...