수업 내용을 정리한 것이므로, 작성자의 상태에 따라 잘못된 내용이 적힐 수 있습니다. 오류사항 있으면 지적부탁드립니다 헿 Model-based RL? Model-based Planning과는 다르다. 경험(experience)을 통해 Model을 직접 학습한다(즉 처음부터 Model을 알고 시작하지 않는다). Model의 Transition Probability를 하나하나 알아내는 것이 아니다. Model을 근사하는 것(approximation)이라고 볼 수 있다. 근사한 Model을 기반으로 가상 환경(environment)를 구축해볼 수 있다. 그 환경에서 Sampling을 수행하여, 이를 통해 얻은 정보를 가지고 Model-free RL을 수행한다. 실제 environment를 통한 RL 또한 병행..