48 채널 입력 — 도메인 지식의 인코딩
알파고 입력의 48 채널을 자세히 봐보자. 각 채널이 19x19 격자에 0/1 (또는 작은 정수).
📖 알파고 48 채널 명세 (논문 Extended Data Table 2)
| 채널 | 개수 | 의미 |
|---|---|---|
| Stone color | 3 | 내 돌 / 상대 돌 / 빈 자리 |
| Ones | 1 | 전체 1 (위치 정보) |
| Turns since last move | 8 | 최근 1, 2, ..., 8수 이전 |
| Liberties | 8 | 활로 1, 2, ..., 8+ |
| Capture size | 8 | 잡을 수 있는 돌 수 |
| Self-atari size | 8 | 스스로 단수에 빠지는 돌 수 |
| Liberties after move | 8 | 두면 활로가 몇 개 |
| Ladder capture | 1 | 사다리로 잡힘 |
| Ladder escape | 1 | 사다리에서 탈출 |
| Sensibleness | 1 | 반칙 + 자기 영역에 두는 등 비합리적 수 아님 |
| Zeros | 1 | 전체 0 (대조용) |
| 합계 | 48 |
💡 도메인 지식이 인코딩됨
주의 깊게 보면 — 알파고 입력에는 이미 바둑 지식이 들어있어:
- Liberties: 활로 계산 = 단수 인지
- Capture size: 잡을 수 있는 돌 인지
- Ladder: 사다리 모양 인지 — 미리 계산
- Sensibleness: 반칙수 + 자기 눈 메우기 같은 비합리
이건 "신경망이 모든 걸 학습"하지 않아도 되게 해줌. 도메인 지식을 미리 채널로 제공 → 학습이 빨라짐.
AlphaGo Zero(2017)는 이 채널들을 모두 제거하고 단순 (흑/백 + 마지막 8수 = 17채널)로 줄임. "도메인 지식 없이" 학습. 대신 학습 시간이 더 김.
📊 우리 7x7 미니 알파고는?
Ch 6에서 만들 7x7 미니 알파고는 단순화:
- 채널 3개: 흑 / 백 / 빈자리
- 여분 채널 없음 — 깔끔한 코드 우선
- 대신 학습 데이터 적게도 학습 가능
알파고 48 채널 = "역사적 실제", 우리 3 채널 = "교육 목적".