챕터 5 정리
📌 챕터 5에서 만든 것
- TicTacToe 클래스 — 깔끔한 게임 상태 추상화
- minimax_ab 함수 — 알파-베타로 점수 + 최선의 수 동시 반환
- 완벽한 AI — 무패 보장 (지지 않고, 실수는 응징)
- AI vs AI는 항상 무승부 — 완벽 정보 게임의 본질
- 실수 응징 능력으로 AI 강함이 드러남
🎯 우리가 직접 증명한 것
"minimax + 알파-베타로 게임을 풀 수 있다"는 명제를 작은 게임에서 직접 확인했어. 코드가 동작하고, AI가 무패고, 시간도 합리적 (1초 미만).
그러면 같은 접근을 바둑에 적용하면 안 될까? 왜 안 되는지를 다음 챕터에서 직접 체험해.
⚠️ 한 가지 미묘한 점
틱택토는 게임 끝까지 갈 수 있어서 heuristic이 필요 없음. 모든 게임 결과 (+1/-1/0)를 정확히 알 수 있거든. 그래서 minimax가 완벽.
그런데 바둑은 게임 끝까지 못 봐. 중간에서 평가해야 함. 여기서부터 모든 게 어려워져.
➡️ 다음 챕터에서는
같은 minimax + 알파-베타 알고리즘을 7x7 바둑에 적용한다. 결과는 — 처참한 실패. 그 실패를 직접 보고 측정해. 이 실패가 PART 3 (MCTS)의 출발점이야.