좌충우돌 강화 학습의 이론과 구현 (원고)

제목이 “하루만에 배우는 강화학습”에서 “좌충우돌 강화 학습의 이론과 구현”으로 바뀌었습니다. 책을 쓰면서, 그리고 프로그램을 짜고, 돌리고, 시뮬레이션을 하면서 직접 경험했던 어려움(하지만 기존의 책에서는 언급되지 않았거나 짧게 언급만 했던 어려움)을 포함하면서 “좌충우돌 강화 학습의 이론과 구현“이라는 이름으로 수정하였습니다. 주된 강조점은 다음과 같습니다. 알고리즘을 직관적으로 이해할 수 있다. 새로운 알고리즘은 기존의 알고리즘의 더보기…