시즌 1 · 알파고편 / PART 3 · PART 3 · 무작위의 힘: MCTS / Ch 5 · 무작위 시뮬레이션의 한계

MCTS도 만능은 아니다

👋 이 챕터에서 본격적으로 따져볼 것

지난 챕터에서 MCTS가 minimax를 압도하는 걸 봤다. 그럼 MCTS만 잘 만들면 끝? 아니다. MCTS도 한계가 있고, 그 한계가 PART 4 신경망의 출발점.

MCTS가 7x7~9x9 바둑에서는 잘 동작했어. 2007년 MoGo가 9x9에서 프로 1단을 이김. 그런데 19x19은 다른 이야기:

📊 19x19 컴퓨터 바둑의 ELO 정체 (2010~2014)
  • 2007 MoGo (9x9 첫 도약): 4 stones 핸디캡으로 9x9 프로 1단 격파
  • 2010 MoGo (19x19): ELO ~2500, 아마추어 5단
  • 2013 Crazy Stone (19x19): ELO ~2700, 아마추어 7단
  • 2014 Zen (19x19): ELO ~2700, 아마추어 7단 (정체)
  • 사람 프로 9단: ELO ~3500

MCTS의 정교화로 7단까지는 갔지만, 거기서 정체. 4년 동안 발전 없음. 사람 프로와의 격차가 ELO 800 이상.

⚠️ MCTS의 본질적 한계 3가지
  1. 무작위 rollout의 품질 — 양쪽이 무작위로 끝까지 두는데, 19x19은 게임이 250수. 그 중 200수가 무작위면 노이즈가 너무 큼.
  2. 특정 함정 패턴에 약함 — 일부 모양에서 사람도 한 눈에 보는 정답을 MCTS가 못 봄. 통계로는 안 잡힘.
  3. 도메인 지식 부재 — "이 자리가 좋다"는 인간의 패턴 인식 능력을 통계만으로는 다 못 모방.

이 챕터에서 세 한계를 하나씩 분석하고, 마지막에 PART 4 신경망의 출발점을 짚는다.