728x90
강화학습(Reinforcement Learning)?
- 인공지능의 방법론인 머신러닝(Machine Learning)의 한 종류
- 머신러닝은 크게 지도학습, 비지도학습, 강화학습으로 분류할 수 있다.
1. 지도학습(Supervised Learning)
- 데이터와 각 데이터의 레이블(lable)이 주어진 상태에서 새로운 데이터에 레이블을 매기는 방법을 학습 하는 것
- Ex) A 지역의 아파트의 가격은 a원이고, B 지역의 주택의 가격은 b원 이라는 정보를 모델에게 알려준 다음 이 정보를 토대로 C 지역의 아파트의 가격은 c원일 것이다. 라고 예측하는 방식 (회귀 방식)
2. 비지도학습(Unsupervised Learning)
- 레이블 없이 데이터만 주어진 상태에서 데이터를 분류하거나 밀도를 추정하는 방법을 학습 하는 것
- Ex) A 쇼핑몰의 고객을 유사한 몇 가지 군집으로 분류해서 상품을 추천하려고 한다면 모든 고객의 구매 데이터와 상품 조회 정보를 데이터로 사용하여 고객을 군집화하고 분류하는 방법을 학습 시키는 방식
3. 강화학습(Reinforcement Learning)
- 지도 학습, 비지도 학습과 달리 행동에 대한 보상만 주어짐
- 마르코프 결정 과정, 모델 기반 강화 학습, 모델 프리 강화 학습
728x90
'Programming > 머신러닝' 카테고리의 다른 글
[머신러닝] Warmup Learning Rate (WarmupLR) (0) | 2024.09.06 |
---|---|
[머신러닝] 활성화 함수의 종류 (0) | 2022.02.14 |
[머신러닝] 인공 신경망(ANN, Artificial Neural Network) (0) | 2022.02.11 |
[머신러닝] 강화학습의 분류 (0) | 2022.01.24 |