Multi-Armed Bandit(MAB)

2023. 5. 2. 11:06

Multi-Armed Bandit algorithm은 굉장히 Profitable한 모델이며 이해하기가 쉽다.

카지노 게임장에서 가장 유리한 슬롯을 찾는것부터 시작됐으며, Arm은 슬롯에 잡아당기는 부분, Bandit(노상강도)는 슬롯, 그리고 여러개의 슬롯중 최적의 효율을 내는 것을 탐색하기 위해 Multi-Armed Bandit이 탄생했다.

문제: 탐험(Exploration)이 충분히 이루어지지 않음

동전의 확률은 50:50이다. 50%의 확률로 greedy알고리즘에서 가장 좋았던 슬롯머신을 선택하고, 50%확률로 동전 뒷면이 나오면 슬롯과 상관없이 랜덤하게 골라서 한다. 여기서, 입실론이 하이퍼파라메터이다.

기존에 greedy알고리즘과 비교하면, 빨간 박스가 추가되었다. 해당 슬롯머신이 최적의 슬롯머신이 될 수 있는 가능성이다.

Feature sore 구축 - Feast (1)	2023.05.09
Successive Halving Algorithm(SHA) 이해 (0)	2023.05.02
Sampling method (0)	2023.04.11
다이렉트 마케팅에 사용되는 Uplifting modeling (0)	2023.03.30
자동화 시스템 구축을 위한 AutoML (0)	2023.03.30

채린's datascience