평가 함수의 첫 시도
두 가지 단순한 평가 함수를 시도해봤어:
- 돌 수 차이 — 흑 3, 백 3 → 0. 가장 단순. 위치는 전혀 안 봄.
- 영역 추정 (Manhattan 거리) — 빈 자리가 어느 돌에 더 가까운가. 약간 낫지만 여전히 부정확.
📊 보드 2의 결과 분석
두 번째 보드 — 흑이 중앙 화점을 잡고 백이 구석에 갇힌 상황. 평가 결과:
- 평가 1 (돌 수): +0 — 양쪽 돌 수 같으니 동률. 위치 차이 전혀 못 잡음.
- 평가 2 (영역): +27 — 흑이 중앙 잡았으니 영역이 훨씬 크다고 측정. 이 평가는 위치를 어느 정도 잡음.
⚠️ 그러나 영역 평가도 한계가 있음
위 보드는 명백히 흑이 우세한 상황이라 영역 평가가 잘 맞아. 그런데 실제 게임에서는:
- 중반 — 누구 영역인지 모호한 경계 지역이 많음
- 돌이 잡힐 수 있는 상황 — Manhattan 거리로 측정한 영역이 실제와 다름
- "두텁다", "엷다", "맛이 있다" — 형세 평가는 수치화 어려움
- 1수 차이로 살아있던 돌 그룹이 죽기도 함 → 평가 급변
📖 알파고 이전 시도된 평가 함수들
- Bouzy의 9-3 영향 모델 (1995) — 각 돌이 9칸 거리까지 영향력 퍼짐, 3단계 감쇠
- Gnu Go의 정밀 영역 분석 — 돌 그룹의 생사 추정 + 영역 계산
- Brügmann의 패턴 매칭 (1993) — 3x3 / 5x5 모양별 점수표
이 정교한 시도들도 결국 사람 9급 수준이 한계. 평가의 한계가 알고리즘의 한계.
이제 분기 인자 문제도 같이 보자. 7x7 바둑은 어디가 다른가.
PYTHON