시즌 1 · 알파고편 / PART 3 · PART 3 · 무작위의 힘: MCTS / Ch 1 · 몬테카를로 시뮬레이션 (rollout)

코드: 자리별 승률 측정 (Pure Monte Carlo)

드디어 의미 있는 결과 — 가운데 (1,1)이 70.7% 승률로 최고. 다른 모든 자리는 52~62%. 정확히 사람의 직관과 일치.

🎯 핵심 관찰
  • 가운데 (1,1) - 70.7% (가장 강한 수)
  • 코너들 (0,0), (0,2), (2,0), (2,2) - 60~62% (그 다음 강함)
  • 변들 (0,1), (1,0), (1,2), (2,1) - 52~56% (가장 약함)

이 순서가 틱택토 이론과 정확히 일치. 평가 함수 0개, 게임 규칙만 알고도, 무작위 시뮬레이션으로 좋은 수를 찾았다.

💡 알고리즘의 마법

우리는 "가운데가 좋다"를 어디에도 안 가르쳤어. 그저 게임 규칙(이기는 조건)과 무작위 추출만 사용. 그런데 정답이 통계적으로 나옴.

이게 Monte Carlo의 본질 — "공짜로 얻는 평가 함수". 게임 규칙만 있으면 어떤 게임에도 적용 가능.

그런데 — 이게 그렇게 좋은 거면 왜 PART 4에서 신경망 같은 더 복잡한 걸 추가하지? Pure Monte Carlo만 쓰면 되지 않나? 다음 페이지에서 한계를 본다.

PYTHON