챕터 1 정리

🤔 핵심 통찰

1993년 사람들은 "무작위가 어떻게 똑똑할 수 있나"라고 의심했어. 그런데 통계 법칙이 직관보다 강해. 충분한 샘플을 모으면 진짜 좋은 자리가 떠오름.

다만 시간이 한정된 실전에서는 "어디에 더 많은 샘플을 집중할 것인가"가 핵심 문제. 이게 다음 챕터의 출발점.

➡️ 다음 챕터에서는

UCB1 (Upper Confidence Bound). 한정된 시간에 N개 자리에 어떻게 샘플을 배분할지 결정하는 천재적 공식. 1985년 통계학에서 나왔고, 2006년 컴퓨터 바둑에 적용되어 폭발적 도약을 일으킴.

다중-슬롯머신 문제로 직관을 잡고, 한 줄 공식으로 답을 구함.