Tutorial 영상

https://youtu.be/p7tZ3Y8ZuLA?si=inJy10ARUJJZV9S2

목적

Policy Based Agent (정책 기반 에이전트)

지난번의 DQN은 대표적인 가치 기반 에이전트(Value Based Agent)인 반면, A2C는 정책 기반 에이전트(Policy Based Agent)임

정책 기반 에이전트는 정책을 통해 학습함

Actor-Critic