바둑판은 왜 이미지인가
"바둑판을 이미지로 보자"라는 발상이 알파고의 핵심 통찰 중 하나. 왜 자연스러운가:
🎯 바둑판과 이미지의 공통점
- 2D 격자 구조: 19x19 픽셀과 19x19 교차점이 같은 모양
- 이웃 관계가 중요: 픽셀의 옆 픽셀 — 돌의 인접 돌
- 위치 무관 패턴: 고양이는 사진 어디든 — 사다리는 보드 어디든
- 계층적 의미: 픽셀 → 모서리 → 모양 → 객체 / 돌 → 모양 → 그룹 → 영역
이 네 가지 일치가 우연이 아니야 — 사람의 시각 처리와 바둑 직관이 비슷한 메커니즘.
📖 바둑판의 "채널" 표현
이미지의 RGB 3채널처럼 바둑판도 여러 채널로 표현:
- 채널 1: 현재 차례 돌 있는 자리 (1/0)
- 채널 2: 상대 돌 있는 자리 (1/0)
- 채널 3: 빈 자리 (1/0)
- 채널 4: 활로 1인 그룹의 돌 (1/0)
- 채널 5: 활로 2인 그룹
- ...
- 알파고는 48 채널 사용
각 채널이 "이 자리의 한 가지 속성"을 표현. CNN의 첫 층이 채널들을 조합해서 더 추상적 특징 만들음.
💡 왜 RGB가 아니라 48 채널?
이미지의 RGB는 픽셀 자체의 색. 바둑판은 색이 중요하지 않고 "이 자리가 어떤 상태인가"가 중요.
흑/백/빈만 3채널로도 시작은 가능. 그런데 "활로", "잡힐 위기" 등 게임 의미를 채널로 더하면 학습이 더 빨라짐. 도메인 지식을 채널 설계에 녹임.
AlphaGo Zero는 더 단순하게 17 채널만 사용 (역사 8수 + 현재 차례). 도메인 지식을 줄이고 학습에 더 의존.
📊 출력의 두 가지 형태
같은 CNN 구조에서 두 가지 다른 출력:
- Policy Network: 19x19=361 자리에 대한 확률 분포. "다음에 어디 둘 것 같은가" — 다음 챕터 주제.
- Value Network: 단 하나의 숫자. -1~+1 또는 0~1. "이 보드가 흑한테 얼마나 좋은가" — 그 다음 챕터 주제.
두 신경망이 합쳐져 알파고의 핵심.