Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |
Tags
- dynamic programming
- NLP
- hm3dsem
- RL
- AlexNet
- LSTM
- machine learning
- deep learning
- Reinforcement Learning
- YoLO
- 강화학습
- ubuntu
- 딥러닝
- hm3d
- opencv
- CNN
- MySQL
- DP
- BFS
- GIT
- C++
- UC Berkeley
- CS285
- r-cnn
- Python
- 머신러닝
- image processing
- dfs
- 그래프 이론
- 백준
Archives
- Today
- Total
목록2025/12/08 (1)
JINWOOJUNG
본 포스팅은 UC Berkeley 에서 진행된 CS285: Deep Reinforcement Learning, Decision Making and Control 강의자료 및 강의를 기반으로 공부한 내용을 정리하는 포스팅입니다.Introduction다음과 같은 Robot이 있다고 가정하자. RGB camera를 통해 객체들을 볼 수 있으며, 7 자유로들 가진 manipulator를 통해 객체들을 조작할 수 있다. 그리고 우리에게 주어진 Task는 특정 물체를 집어 통 밖으로 꺼낸다고 가정하자. 그러면 우리는 입력받은 이미지를 통해 우리의 방법론을 통해 물체를 집을 (x,y,z) 좌표를 만들어야 한다. 그렇다면 2가지 방법이 있을 것이다. 첫번째 방법은 Hard coding 하는 방법이다. 하지만, 수많은..
Reinforcement Learning
2025. 12. 8. 00:03