AI Model study

728x90

Multi-Armed Bandit (MAB)

- 여러 개(Multi)의 레버(Arm)를 가진 여러 대의 슬롯머신(Bandits)이라는 뜻

- 어떤 슬롯머신이 어떤 수익률 가지는지 모를 때 탐색(Exploration)과 활용(Exploitation)을 적절히 사용하여 최적의 수익을 찾아내고자 하는 강화학습 알고리즘

- 알고리즘의 유래 : 과거 카지노에서 어떤 슬롯머신에 게임을 해야 최대한 많은 수익을 얻어낼 수 있을까? 하는 고민에서 출발

K-Armed Bandits 상황에서는,다른 복잡한 강화학습 문제와는 다르게 환경이 변화하지 않음

728x90

AI 화자 인식_DenseNet, ResNet, Ensemble (0)	2023.10.30
AI 강연 리뷰 (3)	2023.10.30
GIT (0)	2023.10.26
Docker (0)	2023.10.23
Django restful (0)	2023.10.18

에리히프롬