시즌 1 · 알파고편 / PART 4 · PART 4 · 신경망 등장: 직관을 학습한다 / Ch 2 · CNN: 바둑판은 이미지다

챕터 2 정리

📌 챕터 2에서 배운 것

  • MLP의 한계: 19x19 → 25만 가중치, 공간 구조 무시
  • 합성곱(Convolution) — 작은 필터를 슬라이딩하며 적용
  • 가중치 공유 — 같은 필터가 모든 위치에 → 효율 + 위치 무관 학습
  • 필터 = 패턴 감지기, 학습으로 자동 발견
  • CNN 구조: Conv + ReLU + Pooling + Dense
  • 계층적 특징 학습 — 저수준 → 고수준 추상화
  • 바둑판은 자연스럽게 이미지 — 2D, 이웃 중요, 위치 무관 패턴
  • 알파고 입력: 19x19x48 채널, 13층 CNN, 192 필터
🏆 우리가 이해한 것

"바둑판 = 이미지" 라는 한 줄 통찰이 30년의 컴퓨터 바둑 정체를 뚫음. 1980~2014 누구도 명확히 보지 못한 시각. 2014 Maddison et al의 CNN policy 논문이 그 시작.

➡️ 다음 챕터에서는

Policy Network. "다음 수 어디 둘까"를 학습하는 신경망. 입력 = 보드, 출력 = 361 자리 확률 분포.

이게 MCTS의 ② Expand 단계에서 "유망한 자식 우선"을 알려주는 부품. 알파고의 직관.