본문 바로가기
AI, 머신러닝, 딥러닝, 데이터 분석

AI Model study

by 포로리다 2023. 10. 27.
728x90
반응형
SMALL

추천시스템

Multi-Armed Bandit (MAB)

- 여러 개(Multi)의 레버(Arm)를 가진 여러 대의 슬롯머신(Bandits)이라는 뜻

- 어떤 슬롯머신이 어떤 수익률 가지는지 모를 때 탐색(Exploration)과 활용(Exploitation)을 적절히 사용하여 최적의 수익을 찾아내고자 하는 강화학습 알고리즘

- 알고리즘의 유래 : 과거 카지노에서 어떤 슬롯머신에 게임을 해야 최대한 많은 수익을 얻어낼 수 있을까? 하는 고민에서 출발

 

K-Armed Bandits 상황에서는,다른 복잡한 강화학습 문제와는 다르게 환경이 변화하지 않음

 

 

728x90
반응형
LIST

'AI, 머신러닝, 딥러닝, 데이터 분석' 카테고리의 다른 글

AI 화자 인식_DenseNet, ResNet, Ensemble  (0) 2023.10.30
AI 강연 리뷰  (2) 2023.10.30
GIT  (0) 2023.10.26
Docker  (0) 2023.10.23
Django restful  (0) 2023.10.18