시즌 1 · 알파고편 / PART 2 · PART 2 · 게임을 푸는 첫 방법: 탐색 / Ch 6 · 7x7 바둑에 minimax 시도, 실패 체험

실패의 의미 — 새 알고리즘이 필요하다

지난 두 페이지에서 우리는 직접 측정했어:

  • 7x7 바둑 평가 함수를 단순하게 짜면 모든 자리가 같은 점수 — 알고리즘이 정답 못 골라.
  • 알파-베타로도 1수에 깊이 4~5밖에 못 봄 — 사람보다 한참 얕음.

이게 1990년대~2005년 컴퓨터 바둑의 상태. 같은 minimax + 알파-베타 알고리즘으로 체스에서는 사람을 이기지만, 바둑에서는 아마추어 9급도 못 따라잡음.

⚠️ 왜 같은 알고리즘이 두 게임에서 그렇게 다른가

알고리즘의 문제가 아니야. 게임의 본질이 다르다:

  • 체스는 기물 가치가 명확 → 평가 함수가 가능
  • 체스는 분기 인자가 작음 (b=35) → 깊이로 들어갈 수 있음
  • 바둑은 평가가 어려움 + 분기가 큼 → 두 가지가 동시에 발목 잡음

이게 바둑이 "마지막 남은 큰 게임"으로 30년 동안 컴퓨터의 도전 과제였던 이유.

🤔 그러면 무엇이 필요한가

두 문제를 모두 풀어야 함:

  1. 모든 수를 다 안 본다 — 가능성 있는 수만 깊게. 이게 다음 PART의 핵심.
  2. 좋은 평가 — 사람이 못 만든다면 학습. 이게 PART 4의 핵심.

두 아이디어가 결합되어 알파고가 탄생.

2006년 MCTS가 첫 돌파. "모든 수를 다 안 본다"는 1번 문제를 해결. 비결: 무작위 시뮬레이션. 다음 PART에서 깊게 다룸.

이 챕터에서 직접 만든 7x7 minimax와 다음 PART에서 만들 7x7 MCTS를 직접 비교해볼 거. 같은 보드, 같은 시간 예산. 결과 차이는 — 충격.