CHAPTER 09 실전 준비 ⏱ 약 8분

🎒 돌리기 전에 — 준비물 체크

구글 계정, 시퀀스, 마음의 준비

📋이전 챕터에서 뭐 했죠?

제8장 — 로제타폴드 안에서 무슨 일이 벌어지나

로제타폴드 안에서 무슨 일이 벌어지는지 — 1D(시퀀스+MSA) / 2D(거리 행렬) / 3D(좌표) 세 트랙이 서로 회의하면서 점점 정확해진다는 걸 봤어요. 출력은 PDB 파일 + 잔기별 pLDDT 신뢰도.

이제부터 진짜 실전입니다. 두 가지 길이 있어요:

  1. Robetta 웹서버 — 시퀀스만 붙여넣으면 메일로 결과 보내줌. 가장 쉬움. (다음 챕터에서 다룸)
  2. ColabFold — 구글 Colab 노트북에서 직접 실행. 빠름, 컨트롤 가능. (다음 다음 차수에서 다룸)

어느 쪽이든 시작 전 잠깐 체크할 게 몇 가지 있어요. 1분 정도면 끝나니까 같이 챙기고 갑시다.

준비물 1. 구글 계정 (Robetta는 없어도 OK, ColabFold는 필요)

📧
Robetta: 구글 계정 없어도 됨. 이메일 주소만 있으면 결과를 받을 수 있어요.
ColabFold: 구글 계정 필수. Colab 노트북이 구글 계정에 연결되거든요.

구글 계정이 없으시면 지금 하나 만드세요. 1분이면 됩니다. accounts.google.com/signup 가시면 돼요. 계정만 있으면 무료 Colab GPU를 빌려 쓸 수 있습니다.

준비물 2. 연습용 단백질 시퀀스 — 작은 거로 시작

첫 실습은 이미 구조가 알려진 작은 단백질로 시작하는 게 정말 좋아요. 두 가지 이유에서:

  • 작다 → 빠르다: 단백질 길이가 200 정도면 ColabFold 무료 GPU로 10~30분이면 결과가 나옵니다.
  • 알려진 답이 있다 → 검증 가능: 예측 결과를 PDB의 실제 구조와 비교해서 "맞췄나?" 확인할 수 있어요.

추천 첫 실습 단백질 BEST 3

⭐ 가장 추천 Ubiquitin (유비퀴틴)
길이: 76 잔기 · 매우 작음 · 거의 모든 진핵세포에 존재
  • UniProt ID: P0CG48 (사람)
  • PDB ID: 1UBQ (X선으로 풀린 정답이 PDB에 있음)
  • 예상 실행 시간: 5분 (ColabFold), 1~2시간 (Robetta)
🧠 의미 있음 Myoglobin (미오글로빈)
길이: 154 잔기 · 1958년 인류가 처음 본 단백질 (2장 참고)
  • UniProt ID: P02144 (사람)
  • PDB ID: 1MBN
  • 예상 실행 시간: 10~15분 (ColabFold), 2~5시간 (Robetta)
💊 의약 관련 Insulin (인슐린)
길이: A 사슬 21 + B 사슬 30 (총 51) · 가장 작은 인기 단백질
  • UniProt ID: P01308 (사람)
  • PDB ID: 1ZNI
  • 참고: 2-chain이라 멀티머 예측 필요 — 첫 실습엔 다소 복잡할 수 있음
🎯
딱 하나만 고른다면 Ubiquitin이에요. 76 잔기로 가장 작고, ColabFold 5분, Robetta 1~2시간이면 결과 옴. pLDDT 점수도 매우 높게 나옵니다 (대부분 90+). "잘 작동하는구나"라는 감을 잡기에 최적입니다.

준비물 3. 시퀀스 다운로드 — UniProt에서 받는 법

시퀀스를 얻으려면 uniprot.org 가서:

  1. 검색창에 UniProt ID 입력 (예: P0CG48)
  2. 해당 단백질 페이지에서 "Download""FASTA (canonical)" 클릭
  3. 다운로드된 .fasta 파일을 메모장으로 열기
  4. 안에 들어있는 >로 시작하는 헤더 + 시퀀스를 통째로 복사해서 ColabFold/Robetta에 붙여넣기

또는 그냥 시퀀스 텍스트만 복사해서 붙여넣어도 돼요. 헤더는 메모일 뿐 컴퓨터는 시퀀스만 봅니다.

💡
참고용 — Ubiquitin (P0CG48) 시퀀스:
>sp|P0CG48|UBC_HUMAN Polyubiquitin-C OS=Homo sapiens
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGG

바로 위 박스 내용을 복사해서 다음 챕터에서 Robetta에 붙여넣으면 됩니다.

준비물 4. 마음의 준비 — 결과 기다리기

실험과 비교하면 한순간이지만, 그래도 컴퓨터가 계산하는 데 시간이 좀 걸립니다.

방법 대기 시간 번거로움
Robetta 웹서버 몇 시간 ~ 며칠 (큐 상황에 따라) 매우 적음 — 시퀀스만 붙여넣고 메일 기다림
ColabFold 10분 ~ 1시간 (단백질 크기에 따라) 조금 — Colab 노트북 셀 실행 클릭 몇 번
Robetta는 큐가 길 수 있어요. 트래픽 많은 시간(미국 낮 시간)엔 며칠 걸릴 수도 있습니다. 급하면 ColabFold가 빨라요. 단, 처음이라면 Robetta를 먼저 돌려놓고 (메일이 알아서 옴) 그 사이에 ColabFold 챕터도 같이 진행하는 게 효율적.

그리고 한 가지 — GPU 다시 확인

0장에서도 말씀드렸지만 다시 한 번:

💚 본인 컴퓨터에 GPU가 필요한가?

아니요. 전혀 필요 없어요.

  • Robetta는 Baker Lab 서버에서 돌고, 본인 컴은 그냥 시퀀스 입력 + 메일 받기만 함
  • ColabFold는 구글이 빌려주는 클라우드 GPU에서 돌고, 본인 브라우저는 결과만 받음

스마트폰으로도 (불편하지만) 가능합니다. 즉, 지금 이 페이지를 보고 있는 그 기계면 충분해요.

실전 준비 체크리스트

최종 체크 ✅

  • ☐ 구글 계정 있음 (ColabFold용 — 또는 다음 챕터까지는 Robetta만 쓰면 OK)
  • ☐ 이메일 주소 있음 (Robetta 결과 받기용)
  • ☐ 연습할 단백질 시퀀스 정함 (Ubiquitin 추천)
  • ☐ 결과 받기까지 몇 시간 기다릴 마음의 준비
  • ☐ 브라우저 켜둠 (이거)

다 체크됐으면, 다음 챕터에서 진짜로 첫 예측을 돌리러 갑니다. Robetta 웹서버로요.

한 번 체크하고 가요

체크 1/3 Q1.

ColabFold를 사용하려면 무엇이 필요한가요?

체크 2/3 Q2.

첫 실습에 적합한 단백질은 어떤 것일까요?

체크 3/3 Q3.

본인 컴퓨터에 GPU가 없는데, 단백질 구조 예측을 할 수 있을까요?

다음 챕터로 가기 전에

자, 진짜 첫 예측 돌리러 갑니다 — Robetta 웹서버

다음 챕터에서는 Baker Lab의 Robetta 웹서버에 직접 가서, 위에서 준비한 Ubiquitin 시퀀스를 붙여넣고 첫 단백질 구조 예측을 돌립니다. 코드 한 줄 안 짭니다. 클릭 몇 번이면 끝나요.