Dqn

Published on
2026년 3월 19일
[심층 강화학습] 06. Deep Q-Network: DQN의 원리와 구현
reinforcement-learning deep-learning ai dqn
테이블 기반 Q-러닝의 한계를 극복하는 DQN의 핵심 아이디어(경험 리플레이, 타겟 네트워크)를 이해하고, Pong 환경에서 구현합니다.
Published on
2026년 3월 19일
[심층 강화학습] 07. DQN 확장: Double DQN, Dueling DQN, Rainbow
reinforcement-learning deep-learning ai dqn
DQN의 성능을 향상시키는 6가지 핵심 확장 기법(N-step, Double DQN, Noisy Networks, Prioritized Replay, Dueling DQN, Categorical DQN)과 이들을 결합한 Rainbow를 구현합니다.
Published on
2026년 3월 17일
강화학습 완전 정복: DQN, PPO부터 RLHF, DPO까지 LLM 정렬까지
reinforcement-learning ppo dqn rlhf dpo llm-alignment 2026-03
MDP 기초부터 DQN, PPO, SAC, RLHF, DPO까지. LLM 정렬에 사용되는 강화학습 기법을 PyTorch Stable-Baselines3 코드와 함께 완전 정복합니다.
Published on
2026년 3월 1일
강화학습(Reinforcement Learning) 완벽 가이드: 이론부터 최신 알고리즘, 실전 구현까지
reinforcement-learning deep-learning dqn ppo rlhf a3c q-learning policy-gradient ai-papers alphago
강화학습의 핵심 이론인 MDP, Bellman 방정식부터 Q-Learning, DQN, Policy Gradient, A3C, PPO, SAC까지 주요 알고리즘을 수식으로 유도하고, RLHF, AlphaGo, 로보틱스 응용 사례와 PyTorch 구현 예제를 총정리한다.

[심층 강화학습] 06. Deep Q-Network: DQN의 원리와 구현