머학원생(이 아니게된) 블로그

  • 홈
  • 태그
  • 미디어로그
  • 위치로그
  • 방명록

RL 1

Reinforcement Learning (9) - Planning과 Learning의 통합

수업 내용을 정리한 것이므로, 작성자의 상태에 따라 잘못된 내용이 적힐 수 있습니다. 오류사항 있으면 지적부탁드립니다 헿 Model-based RL? Model-based Planning과는 다르다. 경험(experience)을 통해 Model을 직접 학습한다(즉 처음부터 Model을 알고 시작하지 않는다). Model의 Transition Probability를 하나하나 알아내는 것이 아니다. Model을 근사하는 것(approximation)이라고 볼 수 있다. 근사한 Model을 기반으로 가상 환경(environment)를 구축해볼 수 있다. 그 환경에서 Sampling을 수행하여, 이를 통해 얻은 정보를 가지고 Model-free RL을 수행한다. 실제 environment를 통한 RL 또한 병행..

Major in CS/Reinforcement Learning(강화학습) 2019.12.05
이전
1
다음
더보기
프로필사진

머학원생(이 아니게된) 블로그

hwan4216@gmail.com https://github.com/hursung1

  • 분류 전체보기 (18)
    • 논문 정리 (1)
      • Continual Learning (0)
      • Spoken Language Understandi.. (1)
      • Natural Language Processing (0)
    • Major in CS (9)
      • Reinforcement Learning(강화학습.. (2)
      • Algorithms(알고리즘개론) (0)
      • Computer Network(컴퓨터네트워크개론) (0)
      • Database(데이터베이스개론) (0)
      • Programming Language(프로그래밍 .. (2)
      • Linear Algebra(선형대수) (2)
      • Computer Vision(컴퓨터비전) (2)
      • System Program(시스템프로그램) (1)
    • Coding (2)
      • Android (1)
      • Java (0)
      • Kotlin (1)
      • WEB Programming (0)
    • MUSIC (2)
      • Seo Tai Ji (2)
      • NELL (0)
    • ETC (4)
      • 구입기&개봉기 (1)
      • 사용기 (0)
      • 파일저장소 (1)
    • 비공개POSTS (0)

Tag

Reinforcement Learning, 난 알아요, 갤럭시탭s6, come back home, JOINT, 대충, 1996, 강화학습, RL, 서태지, 개봉기, 갤럭시탭, 서태지와 아이들, SLU,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바