MCTS의 게임 독립성

MCTS 알고리즘은 게임 독립적. 인터페이스만 만족하면 어떤 게임이든 동작.

📖 PART 5 우리 미니 알파고 코드 재검토

PART 5 Ch 6 §2의 코드를 보면:

def mcts_alphago(board, net, n_iter=500):
    # Select(PUCT) → Expand → Evaluate → Backup
    ...
    return root, best_move

이 함수가 board.possible_moves(), board.play(), board.is_terminal(), board.winner_value() 만 호출. board가 다른 게임이어도 동작.

🎯 PUCT의 보편성

PUCT 공식 다시:

PUCT = Q(s,a) + c·P(s,a)·√N/(1+n)

공식 자체는 같음. 단지 게임에 따라 c 조정.

💡 학습 알고리즘의 보편성

차이는 단지:

📖 AlphaZero 논문의 코드 일관성

논문에 명시: "체스, 쇼기, 바둑 학습에 사용된 코드는 거의 동일. 단지 게임 인터페이스만 교체."

구체적:

이게 진짜 일반화. "알고리즘이 게임에 의존하지 않음".