시즌 1 · 알파고편 / PART 4 · PART 4 · 신경망 등장: 직관을 학습한다 / Ch 2 · CNN: 바둑판은 이미지다

바둑판은 왜 이미지인가

"바둑판을 이미지로 보자"라는 발상이 알파고의 핵심 통찰 중 하나. 왜 자연스러운가:

🎯 바둑판과 이미지의 공통점
  • 2D 격자 구조: 19x19 픽셀과 19x19 교차점이 같은 모양
  • 이웃 관계가 중요: 픽셀의 옆 픽셀 — 돌의 인접 돌
  • 위치 무관 패턴: 고양이는 사진 어디든 — 사다리는 보드 어디든
  • 계층적 의미: 픽셀 → 모서리 → 모양 → 객체 / 돌 → 모양 → 그룹 → 영역

이 네 가지 일치가 우연이 아니야 — 사람의 시각 처리와 바둑 직관이 비슷한 메커니즘.

📖 바둑판의 "채널" 표현

이미지의 RGB 3채널처럼 바둑판도 여러 채널로 표현:

  • 채널 1: 현재 차례 돌 있는 자리 (1/0)
  • 채널 2: 상대 돌 있는 자리 (1/0)
  • 채널 3: 빈 자리 (1/0)
  • 채널 4: 활로 1인 그룹의 돌 (1/0)
  • 채널 5: 활로 2인 그룹
  • ...
  • 알파고는 48 채널 사용

각 채널이 "이 자리의 한 가지 속성"을 표현. CNN의 첫 층이 채널들을 조합해서 더 추상적 특징 만들음.

💡 왜 RGB가 아니라 48 채널?

이미지의 RGB는 픽셀 자체의 색. 바둑판은 색이 중요하지 않고 "이 자리가 어떤 상태인가"가 중요.

흑/백/빈만 3채널로도 시작은 가능. 그런데 "활로", "잡힐 위기" 등 게임 의미를 채널로 더하면 학습이 더 빨라짐. 도메인 지식을 채널 설계에 녹임.

AlphaGo Zero는 더 단순하게 17 채널만 사용 (역사 8수 + 현재 차례). 도메인 지식을 줄이고 학습에 더 의존.

📊 출력의 두 가지 형태

같은 CNN 구조에서 두 가지 다른 출력:

  1. Policy Network: 19x19=361 자리에 대한 확률 분포. "다음에 어디 둘 것 같은가" — 다음 챕터 주제.
  2. Value Network: 단 하나의 숫자. -1~+1 또는 0~1. "이 보드가 흑한테 얼마나 좋은가" — 그 다음 챕터 주제.

두 신경망이 합쳐져 알파고의 핵심.