좌충우돌 강화 학습의 이론과 구현 (원고)

글쓴이 admin 날짜

제목이 “하루만에 배우는 강화학습”에서 “좌충우돌 강화 학습의 이론과 구현”으로 바뀌었습니다.

책을 쓰면서, 그리고 프로그램을 짜고, 돌리고, 시뮬레이션을 하면서 직접 경험했던 어려움(하지만 기존의 책에서는 언급되지 않았거나 짧게 언급만 했던 어려움)을 포함하면서 “좌충우돌 강화 학습의 이론과 구현“이라는 이름으로 수정하였습니다.

주된 강조점은 다음과 같습니다.

  • 알고리즘을 직관적으로 이해할 수 있다.
  • 새로운 알고리즘은 기존의 알고리즘의 어떤 문제점을 해결하고자 했는가? 그리고 그 과정에서 생겨난 단점은 무엇인가?

원고 살펴보기

온오프믹스(아래 링크)에서는 책의 내용을 좀 더 보완하여 Function approximation의 선형 모형까지 강의를 하고 있으니 참고하시기 바랍니다.

단숨에 배우는 강화학습


댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다