728x90
반응형
SMALL
추천시스템
Multi-Armed Bandit (MAB)
- 여러 개(Multi)의 레버(Arm)를 가진 여러 대의 슬롯머신(Bandits)이라는 뜻
- 어떤 슬롯머신이 어떤 수익률 가지는지 모를 때 탐색(Exploration)과 활용(Exploitation)을 적절히 사용하여 최적의 수익을 찾아내고자 하는 강화학습 알고리즘
- 알고리즘의 유래 : 과거 카지노에서 어떤 슬롯머신에 게임을 해야 최대한 많은 수익을 얻어낼 수 있을까? 하는 고민에서 출발
K-Armed Bandits 상황에서는,다른 복잡한 강화학습 문제와는 다르게 환경이 변화하지 않음
728x90
반응형
LIST
'AI, 머신러닝, 딥러닝, 데이터 분석' 카테고리의 다른 글
AI 화자 인식_DenseNet, ResNet, Ensemble (0) | 2023.10.30 |
---|---|
AI 강연 리뷰 (2) | 2023.10.30 |
GIT (0) | 2023.10.26 |
Docker (0) | 2023.10.23 |
Django restful (0) | 2023.10.18 |