Published on2026년 3월 19일[심층 강화학습] 10. Actor-Critic 방법: A2C와 하이퍼파라미터 튜닝reinforcement-learningdeep-learningaiactor-criticREINFORCE의 분산 문제를 해결하는 Actor-Critic 구조를 이해하고, A2C 알고리즘을 Pong에 적용하며, 학습률, 엔트로피 계수 등 주요 하이퍼파라미터의 영향을 분석합니다.