실패의 의미 — 새 알고리즘이 필요하다
지난 두 페이지에서 우리는 직접 측정했어:
- 7x7 바둑 평가 함수를 단순하게 짜면 모든 자리가 같은 점수 — 알고리즘이 정답 못 골라.
- 알파-베타로도 1수에 깊이 4~5밖에 못 봄 — 사람보다 한참 얕음.
이게 1990년대~2005년 컴퓨터 바둑의 상태. 같은 minimax + 알파-베타 알고리즘으로 체스에서는 사람을 이기지만, 바둑에서는 아마추어 9급도 못 따라잡음.
⚠️ 왜 같은 알고리즘이 두 게임에서 그렇게 다른가
알고리즘의 문제가 아니야. 게임의 본질이 다르다:
- 체스는 기물 가치가 명확 → 평가 함수가 가능
- 체스는 분기 인자가 작음 (b=35) → 깊이로 들어갈 수 있음
- 바둑은 평가가 어려움 + 분기가 큼 → 두 가지가 동시에 발목 잡음
이게 바둑이 "마지막 남은 큰 게임"으로 30년 동안 컴퓨터의 도전 과제였던 이유.
🤔 그러면 무엇이 필요한가
두 문제를 모두 풀어야 함:
- 모든 수를 다 안 본다 — 가능성 있는 수만 깊게. 이게 다음 PART의 핵심.
- 좋은 평가 — 사람이 못 만든다면 학습. 이게 PART 4의 핵심.
두 아이디어가 결합되어 알파고가 탄생.
2006년 MCTS가 첫 돌파. "모든 수를 다 안 본다"는 1번 문제를 해결. 비결: 무작위 시뮬레이션. 다음 PART에서 깊게 다룸.
이 챕터에서 직접 만든 7x7 minimax와 다음 PART에서 만들 7x7 MCTS를 직접 비교해볼 거. 같은 보드, 같은 시간 예산. 결과 차이는 — 충격.