평가 함수의 첫 시도

두 가지 단순한 평가 함수를 시도해봤어:

돌 수 차이 — 흑 3, 백 3 → 0. 가장 단순. 위치는 전혀 안 봄.
영역 추정 (Manhattan 거리) — 빈 자리가 어느 돌에 더 가까운가. 약간 낫지만 여전히 부정확.

📊 보드 2의 결과 분석

두 번째 보드 — 흑이 중앙 화점을 잡고 백이 구석에 갇힌 상황. 평가 결과:

평가 1 (돌 수): +0 — 양쪽 돌 수 같으니 동률. 위치 차이 전혀 못 잡음.
평가 2 (영역): +27 — 흑이 중앙 잡았으니 영역이 훨씬 크다고 측정. 이 평가는 위치를 어느 정도 잡음.

⚠️ 그러나 영역 평가도 한계가 있음

위 보드는 명백히 흑이 우세한 상황이라 영역 평가가 잘 맞아. 그런데 실제 게임에서는:

중반 — 누구 영역인지 모호한 경계 지역이 많음
돌이 잡힐 수 있는 상황 — Manhattan 거리로 측정한 영역이 실제와 다름
"두텁다", "엷다", "맛이 있다" — 형세 평가는 수치화 어려움
1수 차이로 살아있던 돌 그룹이 죽기도 함 → 평가 급변

📖 알파고 이전 시도된 평가 함수들

Bouzy의 9-3 영향 모델 (1995) — 각 돌이 9칸 거리까지 영향력 퍼짐, 3단계 감쇠
Gnu Go의 정밀 영역 분석 — 돌 그룹의 생사 추정 + 영역 계산
Brügmann의 패턴 매칭 (1993) — 3x3 / 5x5 모양별 점수표

이 정교한 시도들도 결국 사람 9급 수준이 한계. 평가의 한계가 알고리즘의 한계.

이제 분기 인자 문제도 같이 보자. 7x7 바둑은 어디가 다른가.

PYTHON

# 바둑 minimax의 첫 난관: 평가 함수.
# 게임 끝까지 못 가니까 중간 보드를 어떻게 점수화할까?
#
# 가장 단순한 시도들:

EMPTY, BLACK, WHITE = 0, 1, 2

def make_board(size=7):
    return [[EMPTY]*size for _ in range(size)]

def show(board):
    sym = {EMPTY:'.', BLACK:'X', WHITE:'O'}
    for row in board:
        print(' '.join(sym[v] for v in row))


# === 평가 함수 시도 1: 돌 수 차이 ===
def eval_stone_count(board):
    """단순히 X 돌 수 - O 돌 수"""
    black = sum(row.count(BLACK) for row in board)
    white = sum(row.count(WHITE) for row in board)
    return black - white


# === 평가 함수 시도 2: 영역 추정 (간단) ===
def eval_territory_simple(board):
    """빈 자리가 어느 색 돌에 더 가까운가 (Manhattan 거리)"""
    SIZE = len(board)
    black_territory = 0
    white_territory = 0
    for r in range(SIZE):
        for c in range(SIZE):
            if board[r][c] != EMPTY: continue
            # 가장 가까운 흑/백 돌 찾기
            min_b, min_w = 999, 999
            for r2 in range(SIZE):
                for c2 in range(SIZE):
                    if board[r2][c2] == BLACK:
                        min_b = min(min_b, abs(r-r2)+abs(c-c2))
                    elif board[r2][c2] == WHITE:
                        min_w = min(min_w, abs(r-r2)+abs(c-c2))
            if min_b < min_w: black_territory += 1
            elif min_w < min_b: white_territory += 1
            # 같으면 중립
    return black_territory - white_territory


# === 실험: 같은 보드 두 가지로 평가 ===
board = make_board(7)
# 흑이 좌상에, 백이 우하에 둠
board[1][1] = BLACK
board[1][2] = BLACK
board[2][1] = BLACK
board[5][5] = WHITE
board[5][4] = WHITE
board[4][5] = WHITE

print("=== 보드 ===")
show(board)
print()

print(f"평가 1 (돌 수 차): {eval_stone_count(board):+d}")
print(f"  → 흑 3, 백 3 → 0. 위치 정보를 전혀 못 봄.")
print()
print(f"평가 2 (영역 추정): {eval_territory_simple(board):+d}")
print(f"  → 양쪽이 거의 같은 크기 영역을 차지해서 차이 작음.")
print()

# 정상 게임 흐름이라면? 흑이 가운데 좋은 곳을 차지한 시나리오
board2 = make_board(7)
# 흑이 중앙 화점을, 백이 구석 점령
board2[3][3] = BLACK  # 중앙
board2[3][2] = BLACK
board2[2][3] = BLACK
board2[0][0] = WHITE
board2[0][1] = WHITE
board2[1][0] = WHITE

print("=== 보드 2 (흑 중앙 vs 백 구석) ===")
show(board2)
print()
print(f"평가 1 (돌 수): {eval_stone_count(board2):+d}")
print(f"평가 2 (영역): {eval_territory_simple(board2):+d}")
print(f"  → 사람 직관: 흑이 중앙 잡았으니 흑이 좋음. 평가는 못 잡아냄.")

출력

기대 출력:

=== 보드 ===
. . . . . . .
. X X . . . .
. X . . . . .
. . . . . . .
. . . . . O .
. . . . O O .
. . . . . . .

평가 1 (돌 수 차): +0
  → 흑 3, 백 3 → 0. 위치 정보를 전혀 못 봄.

평가 2 (영역 추정): +0
  → 양쪽이 거의 같은 크기 영역을 차지해서 차이 작음.

=== 보드 2 (흑 중앙 vs 백 구석) ===
O O . . . . .
O . . . . . .
. . . X . . .
. . X X . . .
. . . . . . .
. . . . . . .
. . . . . . .

평가 1 (돌 수): +0
평가 2 (영역): +27
  → 사람 직관: 흑이 중앙 잡았으니 흑이 좋음. 평가는 못 잡아냄.

← 이전 같은 알고리즘, 다른 게임 다음 → 분기 인자 직접 측정