일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 골빈해커
- 케라스 정리
- 모두의 딥러닝
- 해리스 코너 검출
- matlab 영상처리
- c++공부
- 딥러닝 스터디
- TensorFlow
- pytorch
- 딥러닝 공부
- c언어 정리
- tensorflow 예제
- c언어
- Pytorch Lecture
- 파이토치
- C언어 공부
- MFC 프로그래밍
- 모두의 딥러닝 예제
- 영상처리
- 컴퓨터 비전
- 딥러닝
- c++
- 파이토치 김성훈 교수님 강의 정리
- 파이토치 강의 정리
- 팀프로젝트
- 김성훈 교수님 PyTorch
- pytorch zero to all
- object detection
- 미디언 필터링
- 가우시안 필터링
- Today
- Total
ComputerVision Jack
[골빈해커 Chapter12정리] 본문
[개념 정리]
DQN(Deep Q-network)
딥마인드에서 만든 신경망
게임 화면만 보고 게임을 학습하는 신경망.
강화학습 알고리즘으로 유명한 Q-러닝을 딥러닝으로 구현한 의미
강화학습 : 어떤 환경에서 인공지능 에이전트가 현재 상태를 판단하여 가장 이로운 행동을 하게 만드는 학습방법
학습 시 이로운 행동을 하면 보상을 주고, 해로운 행동을 하면 패널티를 줘서 학습이 진행될수록 이로운 행동의 반경을 넓혀간다.
Q-러닝 : 어떠한 상태에서 특정 행동을 했을 때의 가치를 나타내는 함수인 Q함수를 학습하는 알고리즘
Q함수를 신경망을 활용해 학습한것.
학습을 진행하면서 최적의 행동을 얻어내는 기본 신경망과 좋은 선택인지 비교하는 목표 신경망을 분리하는 방법 적용
http://gym.openai.com/envs/#classic_control
Gym: A toolkit for developing and comparing reinforcement learning algorithms
Open source interface to reinforcement learning tasks. The gym library provides an easy-to-use suite of reinforcement learning tasks. import gym env = gym.make("CartPole-v1") observation = env.reset() for _ in range(1000): env.render() action = env.action_
gym.openai.com
OpenAI 비영리 회사.
게임을 통해 강화 학습 알고리즘 개발 도구를 제공하고 있다.
게임을 학습 시킬 경우 CNN을 기본 모델로 신경망을 구현한다.
DQN으로 한프레임 값만 넘겨서 상태를 적용하여 학습을 시킨다.
'DeepLearning > 골빈해커 - Tensor Lib' 카테고리의 다른 글
[골빈해커 Chapter11정리] (0) | 2020.01.23 |
---|---|
[골빈해커 Chapter10정리] (0) | 2020.01.21 |
[골빈해커 Chapter9정리] (0) | 2020.01.20 |
[골빈해커 Chapter8 정리] (0) | 2020.01.19 |
[골빈해커 Chapter7정리] (0) | 2020.01.17 |