CHAPTER 12 실전 ⏱ 약 14분

📓 Colab 노트북 사용법 (생물쟁이 첫걸음)

셀, ▶ 버튼, 런타임 — 처음 보는 인터페이스가 안 무섭게

📋이전 챕터에서 뭐 했죠?

제11장 — ColabFold가 뭔데?

ColabFold가 뭔지, Robetta와 어떻게 다른지 봤어요. Sokrypton 그룹이 만든 오픈소스 노트북이고, MMseqs2 덕분에 빠르며, 알파폴드/로제타폴드/ESMFold 등 여러 모델을 다 지원합니다. 본인이 직접 Colab에서 실행해야 한다는 게 핵심.

🎯 이 챕터에서 배울 것

  • Colab 노트북이 어떻게 생겼는지 — 화면 한 번 봐두기
  • "셀(cell)"이 뭐고 어떻게 실행하는지
  • "런타임(runtime)"이 뭐고 어떻게 GPU를 켜는지
  • 코드를 한 줄도 쓰지 않고 노트북을 사용하는 법

다음 챕터에서 ColabFold를 진짜로 돌리기 전에, 이번 챕터에서는 "Colab이 뭐고 어떻게 사용하는지"만 짚고 갑니다. 프로그래밍 경험 없는 생물 전공자도 안 헤매도록 하나하나 떠먹여드릴게요.

Colab을 처음 열어보기

지금 새 탭에서 colab.research.google.com를 한 번 열어보세요. 구글 계정으로 로그인하면 됩니다.

로그인 후 "새 노트북"을 클릭하면 빈 노트북이 만들어져요. 다음과 같이 생겼습니다.

📒 Untitled.ipynb    파일 / 수정 / 보기 / 삽입 / 런타임 / 도구 / 도움말
[ ▶ ] Code cell
print("안녕!")
▼ 실행 결과
안녕!
[ ▶ ] Code cell
x = 2 + 3
print(x)
▼ 실행 결과
5
[ + 코드 ]   [ + 텍스트 ]
Colab 노트북의 기본 모습 — 셀이 차례대로 쌓인 구조

핵심 개념 1. 셀 (Cell)

셀 (Cell) Colab 노트북에서 코드(또는 설명 텍스트)를 담는 기본 단위. 한 셀에는 1줄~수십 줄의 코드가 들어가고, 각 셀은 독립적으로 실행할 수 있다.

종이 노트북에 단락마다 글을 쓰는 거랑 비슷해요. 각 단락(=셀)이 코드 묶음을 갖고 있고, 실행하면 그 단락 코드만 돌아갑니다.

셀 실행하는 법

셀을 실행하려면 두 가지 중 하나를 하면 됩니다.

  • 셀 왼쪽의 ▶ 버튼을 클릭
  • 키보드 Shift + Enter

실행이 시작되면 ▶ 버튼이 회전하는 동그라미(⌛)로 바뀌어요. 끝나면 다시 ▶로 돌아오고, 셀 왼쪽에 작은 숫자가 표시됩니다. 이 숫자는 "몇 번째로 실행됐는지"를 나타내요. 즉 [1], [2], [3]… 같이.

💡
중요한 규칙: 셀은 위에서 아래로 순서대로 실행해야 합니다. 노트북 중간 셀부터 실행하면 그 위에서 정의한 변수가 없어서 오류가 납니다. ColabFold 같은 미리 만들어진 노트북은 그냥 위에서 아래로 차근차근 ▶ 누르면 됩니다.

핵심 개념 2. 출력 (Output)

셀을 실행하면 결과가 그 셀 바로 아래에 표시됩니다. 이게 출력(output)이에요.

  • 코드가 만든 print(...) 메시지
  • 표/그래프/그림
  • 오류 메시지 (빨간색)
  • 긴 로그 (스크롤 가능)

ColabFold를 돌리면 셀마다 출력이 좀 길게 나오기도 해요. "MSA 검색 중...", "모델 1 추론 중...", "완료!" 같은 진행 상황이 줄줄이 찍힙니다. 무서워하지 마세요. 그냥 진행 상황 보여주는 거예요.

핵심 개념 3. 변수는 셀 사이에 공유됨

한 셀에서 변수를 만들면 다음 셀에서 그 변수를 그대로 쓸 수 있어요.

[1] ▶
sequence = "MQIFVKTLTGK..."
이 셀은 출력이 없어요 — 그냥 변수만 만드는 셀
[2] ▶
print(len(sequence))
▼ 76     // 첫 셀에서 만든 sequence를 두번째 셀에서 사용
셀 [1]에서 만든 변수를 셀 [2]에서 그대로 사용 가능

ColabFold는 이걸 활용해서 만들어졌어요. 첫 셀에서 시퀀스를 변수에 넣고, 두번째 셀에서 그 시퀀스로 MSA 검색하고, 세번째 셀에서 그 MSA로 구조 예측… 이런 식으로 흘러갑니다.

핵심 개념 4. 런타임 (Runtime)

이게 ColabFold에서 가장 중요한 개념이에요. 런타임 = 구글이 빌려주는 가상 컴퓨터입니다.

런타임 (Runtime) Colab 노트북이 실제로 실행되는 클라우드 가상 컴퓨터. 처음에 노트북을 열면 자동으로 CPU만 있는 런타임이 연결됩니다. ColabFold를 돌리려면 GPU가 달린 런타임으로 변경해야 합니다.

GPU 런타임 켜는 법 (정말 중요!)

노트북 상단 메뉴에서 "런타임""런타임 유형 변경"을 클릭합니다.

▼ 런타임 메뉴 → 런타임 유형 변경
노트북 설정
런타임 유형:
○ Python 3
하드웨어 가속기:
○ CPU    ⦿ T4 GPU ✓   ○ TPU
저장
런타임 유형 변경 다이얼로그 — T4 GPU 선택 후 저장
  1. "하드웨어 가속기" 옵션을 "T4 GPU"로 변경 (또는 그냥 "GPU"라고 표시될 수도 있음)
  2. "저장" 버튼 클릭
  3. (처음이라면 런타임이 다시 시작될 수 있음 — 정상)
⚠️
이 단계를 빼먹으면 ColabFold가 매우 느리거나 실패합니다. CPU 런타임으로는 GPU가 없어서 모델 추론이 안 됩니다. 꼭 먼저 GPU 켜고 시작하세요.

런타임 연결 상태 확인

노트북 오른쪽 상단을 보면 작은 상태 표시가 있습니다.

  • "연결 중..." — 런타임 시작 중 (몇 초 ~ 1분)
  • "연결됨" 또는 "✓ T4" — 정상 작동 중, 셀 실행 가능
  • "연결 끊김" — 90분 이상 안 쓰면 자동 끊김. 다시 연결 클릭.

실제 ColabFold 노트북 흐름 (미리보기)

다음 챕터에서 직접 따라할 ColabFold 노트북은 보통 이런 구조예요:

📓 ColabFold-RoseTTAFold.ipynb
[ Cell 1: 환경 설치 ]
▶ 누르면 1~3분 — 라이브러리 자동 설치
[ Cell 2: 시퀀스 입력 ]
사용자가 시퀀스 붙여넣기 + ▶
[ Cell 3: MSA 검색 ]
▶ 누르면 2~5분 — MMseqs2 서버에서 받아옴
[ Cell 4: 구조 예측 ]
▶ 누르면 5~30분 — RoseTTAFold 실행
[ Cell 5: 결과 시각화 ]
▶ 누르면 즉시 — 3D 뷰어 + pLDDT 그래프
[ Cell 6: 결과 다운로드 ]
▶ 누르면 즉시 — ZIP 파일 다운로드
ColabFold 노트북의 일반적인 흐름 — 셀 하나하나 ▶ 누르면서 진행

보다시피 어렵지 않아요. 위에서 아래로 ▶ 버튼 6번 정도 누르면 끝입니다. 코드는 한 줄도 안 쓰셔도 돼요.

알아두면 좋은 자잘한 팁들

💡 실전 팁

  • 셀이 너무 오래 걸리면 좌측 ▶가 빨간 ⏹로 보일 거예요. 그거 누르면 중단됩니다.
  • 오류가 나면 빨간 글씨가 잔뜩 떠요. 마지막 줄 (보통 "Error: …")만 읽으면 됩니다.
  • 저장은 자동으로 됩니다. 변경 사항은 본인 구글 드라이브에 자동 저장돼요.
  • 런타임이 끊겼다고 변수가 다 사라지는 건 아닙니다 — 다시 연결하고 위에서부터 ▶ 다시 누르면 OK.
  • Form input 셀 — ColabFold 노트북은 셀에 텍스트 입력란을 미리 만들어둬요. 거기 시퀀스를 붙여넣으면 코드가 자동으로 받아갑니다.

한 번 직접 체험해보기 (선택)

다음 챕터로 가기 전에, 빈 Colab 노트북에서 1분 실습 해보면 좋아요:

  1. colab.research.google.com에서 "새 노트북" 만들기
  2. 첫 셀에 print("안녕") 입력 후 ▶ 누르기 → "안녕"이 출력되면 성공
  3. 두번째 셀 만들고 x = 10 * 7, 세번째 셀에 print(x) → 70이 출력되면 변수 공유 이해 완료
  4. 런타임 → 런타임 유형 변경 → T4 GPU 선택 → 저장
  5. 오른쪽 상단에 "T4" 표시가 뜨면 준비 완료

이 정도면 ColabFold를 충분히 다룰 수 있습니다. 다음 챕터에서 본격적으로 단백질 구조 예측을 돌릴 거예요.

한 번 체크하고 가요

체크 1/3 Q1.

Colab 노트북에서 한 셀을 실행하려면?

체크 2/3 Q2.

Colab에서 "런타임(runtime)"이란 무엇일까요?

체크 3/3 Q3.

한 셀에서 만든 변수(예: x=5)는 다음 셀에서 어떻게 될까요?

다음 챕터로 가기 전에

준비 완료! 이제 진짜로 ColabFold를 돌립니다

다음 챕터에서는 실제 ColabFold 노트북을 열어서 시퀀스를 넣고, GPU로 RoseTTAFold를 돌리고, 결과를 받는 것까지 셀 하나하나 STEP-BY-STEP으로 따라가봅니다. 처음으로 본인 손으로 단백질 3D 구조를 빠르게 만들어볼 시간이에요.