시즌 1 · 알파고편 / PART 2 · PART 2 · 게임을 푸는 첫 방법: 탐색 / Ch 6 · 7x7 바둑에 minimax 시도, 실패 체험

평가 함수의 첫 시도

두 가지 단순한 평가 함수를 시도해봤어:

  1. 돌 수 차이 — 흑 3, 백 3 → 0. 가장 단순. 위치는 전혀 안 봄.
  2. 영역 추정 (Manhattan 거리) — 빈 자리가 어느 돌에 더 가까운가. 약간 낫지만 여전히 부정확.
📊 보드 2의 결과 분석

두 번째 보드 — 흑이 중앙 화점을 잡고 백이 구석에 갇힌 상황. 평가 결과:

  • 평가 1 (돌 수): +0 — 양쪽 돌 수 같으니 동률. 위치 차이 전혀 못 잡음.
  • 평가 2 (영역): +27 — 흑이 중앙 잡았으니 영역이 훨씬 크다고 측정. 이 평가는 위치를 어느 정도 잡음.
⚠️ 그러나 영역 평가도 한계가 있음

위 보드는 명백히 흑이 우세한 상황이라 영역 평가가 잘 맞아. 그런데 실제 게임에서는:

  • 중반 — 누구 영역인지 모호한 경계 지역이 많음
  • 돌이 잡힐 수 있는 상황 — Manhattan 거리로 측정한 영역이 실제와 다름
  • "두텁다", "엷다", "맛이 있다" — 형세 평가는 수치화 어려움
  • 1수 차이로 살아있던 돌 그룹이 죽기도 함 → 평가 급변
📖 알파고 이전 시도된 평가 함수들
  • Bouzy의 9-3 영향 모델 (1995) — 각 돌이 9칸 거리까지 영향력 퍼짐, 3단계 감쇠
  • Gnu Go의 정밀 영역 분석 — 돌 그룹의 생사 추정 + 영역 계산
  • Brügmann의 패턴 매칭 (1993) — 3x3 / 5x5 모양별 점수표

이 정교한 시도들도 결국 사람 9급 수준이 한계. 평가의 한계가 알고리즘의 한계.

이제 분기 인자 문제도 같이 보자. 7x7 바둑은 어디가 다른가.

PYTHON