시즌 1 · 알파고편 / PART 4 · PART 4 · 신경망 등장: 직관을 학습한다 / Ch 5 · 작은 CNN 만들기 (7x7)

코드: 완성된 7x7 CNN Policy Network

완성된 7x7 CNN! 2,913 가중치로 49 자리 확률 출력.

🎯 결과 분석

빈 보드에서 모든 자리 0.0204 ≈ 1/49 — 완전 균등. 왜?

  • 입력이 균등 (모든 자리가 빈자리, 채널 2가 1)
  • 가중치 무작위라 위치 특화 신호 없음
  • 합성곱이라 모든 위치에 같은 가중치 적용 → 같은 출력

이게 정상. 빈 보드에서 차이가 나려면 학습이 필요.

💡 가중치 수 비교
모델 가중치 수 크기 비교
우리 7x7 CNN2,913기준
19x19 MLP (가상)~250,00085배
알파고 13층 CNN~3,500,0001,200배
알파고 Zero 40 잔차~21,000,0007,200배

모델이 클수록 더 복잡한 패턴 학습. 우리 7x7은 작아도 핵심 알고리즘은 동일.

📖 빈 보드에서 학습된 모델이 출력하는 것

충분히 학습된 모델이라면 빈 보드에 다음 같은 분포:

  • 중앙 화점 (3,3) ≈ 0.15 (가장 강함)
  • 3-3 자리들 → 0.08~0.12
  • 변 가운데 → 0.03
  • 1선/2선 가장자리 → 0.001

학습이 곧 "균등에서 의미 있는 분포로의 전환". 다음 챕터에서 직접.

PYTHON