본문 바로가기

melius

검색하기
melius
프로필사진 melius102

  • 분류 전체보기 (85)
    • HTML CSS (13)
    • JavaScript (11)
    • Web API (10)
    • Node.js (7)
    • library & framework (19)
    • Python (2)
    • Machine Learning (1)
    • et cetera (22)
Guestbook
Notice
Recent Posts
Recent Comments
Link
«   2025/08   »
일 월 화 수 목 금 토
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
Tags
more
Archives
Today
Total
관리 메뉴
  • 글쓰기
  • 방명록
  • RSS
  • 관리

목록Machine Learning (1)

melius

[RL] Summary 01

Ch.1 Introduction 1. 강화학습의 정의 강화학습(Reinforcement learning)이란 행위자(Agent)가 환경(Environment)과의 상호작용(Interaction)을 통해서, 환경의 상태(State)에 따른 최대 보상(Reward)을 받기 위한 행동방식(Policy)을 배우는 것이다. 이를 위해 행위자(Agent)는 환경의 상태(State)를 감지할수 있어야하고, 환경에 영향을 주는 행동(Action)를 할수 있어야 한다. 그리고 궁극적으로 행위자는 목표(원하는 환경의 상태)가 있어야 한다. 2. 강화학습의 특징 - 시행착오를 통한 검색(Trial-and-error search) - 지연된 보상(Delayed reward) 3. 강화학습의 구성요소 정책, 보상, 가치 그리고..

Machine Learning 2021. 4. 24. 21:39
Prev 1 Next

Blog is powered by kakao / Designed by Tistory

티스토리툴바