Slurm 워크로드 매니저를 완전 정복한다. 아키텍처(slurmctld/slurmd/slurmdbd), 핵심 개념(파티션/QoS/Fairshare), 필수 명령어(sbatch/srun/salloc), GPU 스케줄링(GRES/MIG/MPS), 다중 노드 분산 학습(PyTorch DDP/DeepSpeed/Horovod), 컨테이너 통합(Singularity/Enroot+Pyxis), 설정·모니터링·트러블슈팅까지 실전 관점에서 총정리한다.
Terraform의 init부터 apply, state 관리, 모듈, Workspace까지와 Ansible의 ad-hoc 명령, Playbook, Role, Vault, Galaxy까지 — IaC와 Configuration Management의 양대 도구인 Terraform과 Ansible의 모든 명령어를 실전 예제와 함께 체계적으로 정리한다.