시즌 1 · 알파고편 / PART 5 · PART 5 · AlphaGo (2016) / Ch 1 · SL Policy Network

48 채널 입력 — 도메인 지식의 인코딩

알파고 입력의 48 채널을 자세히 봐보자. 각 채널이 19x19 격자에 0/1 (또는 작은 정수).

📖 알파고 48 채널 명세 (논문 Extended Data Table 2)
채널 개수 의미
Stone color3내 돌 / 상대 돌 / 빈 자리
Ones1전체 1 (위치 정보)
Turns since last move8최근 1, 2, ..., 8수 이전
Liberties8활로 1, 2, ..., 8+
Capture size8잡을 수 있는 돌 수
Self-atari size8스스로 단수에 빠지는 돌 수
Liberties after move8두면 활로가 몇 개
Ladder capture1사다리로 잡힘
Ladder escape1사다리에서 탈출
Sensibleness1반칙 + 자기 영역에 두는 등 비합리적 수 아님
Zeros1전체 0 (대조용)
합계48
💡 도메인 지식이 인코딩됨

주의 깊게 보면 — 알파고 입력에는 이미 바둑 지식이 들어있어:

  • Liberties: 활로 계산 = 단수 인지
  • Capture size: 잡을 수 있는 돌 인지
  • Ladder: 사다리 모양 인지 — 미리 계산
  • Sensibleness: 반칙수 + 자기 눈 메우기 같은 비합리

이건 "신경망이 모든 걸 학습"하지 않아도 되게 해줌. 도메인 지식을 미리 채널로 제공 → 학습이 빨라짐.

AlphaGo Zero(2017)는 이 채널들을 모두 제거하고 단순 (흑/백 + 마지막 8수 = 17채널)로 줄임. "도메인 지식 없이" 학습. 대신 학습 시간이 더 김.

📊 우리 7x7 미니 알파고는?

Ch 6에서 만들 7x7 미니 알파고는 단순화:

  • 채널 3개: 흑 / 백 / 빈자리
  • 여분 채널 없음 — 깔끔한 코드 우선
  • 대신 학습 데이터 적게도 학습 가능

알파고 48 채널 = "역사적 실제", 우리 3 채널 = "교육 목적".