챕터 2 정리

📌 챕터 2에서 배운 것

MLP의 한계: 19x19 → 25만 가중치, 공간 구조 무시
합성곱(Convolution) — 작은 필터를 슬라이딩하며 적용
가중치 공유 — 같은 필터가 모든 위치에 → 효율 + 위치 무관 학습
필터 = 패턴 감지기, 학습으로 자동 발견
CNN 구조: Conv + ReLU + Pooling + Dense
계층적 특징 학습 — 저수준 → 고수준 추상화
바둑판은 자연스럽게 이미지 — 2D, 이웃 중요, 위치 무관 패턴
알파고 입력: 19x19x48 채널, 13층 CNN, 192 필터

🏆 우리가 이해한 것

"바둑판 = 이미지" 라는 한 줄 통찰이 30년의 컴퓨터 바둑 정체를 뚫음. 1980~2014 누구도 명확히 보지 못한 시각. 2014 Maddison et al의 CNN policy 논문이 그 시작.

➡️ 다음 챕터에서는

Policy Network. "다음 수 어디 둘까"를 학습하는 신경망. 입력 = 보드, 출력 = 361 자리 확률 분포.

이게 MCTS의 ② Expand 단계에서 "유망한 자식 우선"을 알려주는 부품. 알파고의 직관.

← 이전 바둑판은 왜 이미지인가 다음 → Policy Network — 사람의 직관 학습