CB‑Dock2: improved protein–ligand blind docking by integrating cavity detection, docking and homologous template fitting
- 6일 전
- 3분 분량
1.논문 제목: CB‑Dock2: improved protein–ligand blind docking by integrating cavity detection, docking and homologous template fitting
2.저자명:Yang Liu, Xiaocong Yang, Jianhong Gan, Shuang Chen, Zhi‑Xiong Xiao, Yang Cao
3.Publish: 2022 Jul 5
4.DOI: 10.1093/nar/gkac394
5.Abstract: Protein-ligand blind docking is a powerful method for exploring the binding sites of receptors and the corresponding binding poses of ligands. It has seen wide applications in pharmaceutical and biological researches. Previously, we proposed a blind docking server, CB-Dock, which has been under heavy use (over 200 submissions per day) by researchers worldwide since 2019. Here, we substantially improved the docking method by combining CB-Dock with our template-based docking engine to enhance the accuracy in binding site identification and binding pose prediction. In the benchmark tests, it yielded the success rate of ∼85% for binding pose prediction (RMSD < 2.0 Å), which outperformed original CB-Dock and most popular blind docking tools. This updated docking server, named CB-Dock2, reconfigured the input and output web interfaces, together with a highly automatic docking pipeline, making it a particularly efficient and easy-to-use tool for the bioinformatics and cheminformatics communities. The web server is freely available at https://cadd.labshare.cn/cb-dock2/
6.한글 초록 요약본: Protein‑ligand blind docking은 수용체의 결합 부위와 해당 리간드의 결합 자세를 탐색하는 강력한 방법임. 이 방법은 제약 및 생물학 연구에서 폭넓게 사용되고 있음. 저자들은 2019년부터 전 세계 연구자들이 하루 200건 이상 사용할 정도로 널리 이용되어 온 blind docking 서버 CB‑Dock을 개발했음. 이번 연구에서는 CB‑Dock에 템플릿 기반 도킹 엔진을 결합하여 결합 부위 식별과 결합 자세 예측의 정확도를 크게 향상시켰음. 벤치마크 테스트에서 이 업데이트 버전은 결합 자세 예측에서 약 85%의 성공률(RMSD < 2.0 Å)을 보여 기존 CB‑Dock과 다른 인기 blind docking 도구보다 뛰어났음. 입력 및 출력 웹 인터페이스를 재구성하고 자동화된 도킹 파이프라인을 구축하여 bioinformatics와 cheminformatics 커뮤니티가 쉽게 사용할 수 있는 효율적인 도구로 만들었음. 이 웹 서버는 https://cadd.labshare.cn/cb-dock2/ 에서 무료로 이용할 수 있음.
7.한글 논문 요약본
7-1 Introduction
-논문은 단백질과 소분자 리간드 간 상호작용을 예측하는 데 있어 핵심 도구인 protein–ligand blind docking에 초점을 맞춤. 단백질의 결합 부위와 리간드의 자세를 동시에 예측하는 이 기법은 생물학적 프로세스 연구와 신약 개발에 필수적임. 최근 AlphaFold2와 RoseTTAFold 같은 구조 예측 도구의 발전으로 거대한 단백질 구조 데이터가 생성되면서 blind docking의 필요성이 더욱 증가하였음.
- CB‑Dock는 빠른 처리 속도(평균 1분), 높은 예측 정확도, 직관적인 웹 인터페이스, 예측된 cavity의 중심과 크기 정보를 제공하는 탐색 기능 등 여러 장점을 가지고 있어 연구자들이 결합 부위를 쉽게 탐색할 수 있게 하였음.
7-2 CB‑DOCK2: OVERVIEW AND NEW FEATURES
7-2-1. Computational pipeline
- CB‑Dock2는 데이터 입력, 데이터 처리, cavity 탐지 및 docking, 결과 시각화의 네 단계로 구성된 자동화된 blind docking 파이프라인을 제공함. 사용자는 PDB 형식의 단백질과 MOL2/SDF/PDB 형식의 리간드를 업로드할 수 있으며, JSME 플러그인을 이용해 브라우저에서 직접 리간드를 그릴 수 있음.
- 서버는 업로드된 리간드에 수소와 부분 전하를 추가하고 RDKit을 통해 3D 구조를 생성하며, 단백질에 누락된 사이드체인과 수소를 보충하고 공결정화된 물과 다른 이종 분자를 제거함. 이후 template matching을 수행하여 준비된 complex 데이터베이스에서 유사한 단백질–리간드 구조를 검색하고, 이를 기반으로 구조 기반 blind docking과 template 기반 blind docking의 두 가지 병렬 파이프라인을 실행함. 결과는 동일한 결합 부위를 병합한 뒤 최고 점수의 결합 자세를 유지하는 방식으로 통합됨.
- 결과 페이지에서는 NGL Viewer를 사용한 3D 및 2D 시각화를 제공하며, 결합 부위, template 구조, docking score, cavity 부피 등 다양한 정보를 보여줘 사용자가 자세를 조정하고 비교할 수 있음.
7-2-2. Template‑based blind docking
- CB‑Dock2는 구조 기반 cavity 탐지와 docking 모듈을 그대로 유지하면서 새롭게 개발한 FitDock 알고리즘을 도입해 template 기반 molecular docking 기능을 추가함. 이 모듈은 protein–ligand 데이터베이스에서 유사한 복합 구조에서 도킹 모드를 추출하여 쿼리 단백질과 리간드에 적용함; 유사한 리간드는 유사한 결합 방식을 가진다는 가정을 이용함.
- FitDock는 template 구조가 존재하는 경우 기존 방법보다 40–60% 높은 성공률과 한 차원 빠른 속도를 보였으며, CB‑Dock2의 전체 benchmark에서는 binding pose 예측에서 85.9%의 성공률을 달성해 원래 CB‑Dock이나 다른 blind docking 서버보다 최소 16% 높은 성능을 보였음.
- template 데이터베이스는 BioLip 2021.09.15 버전을 사용하며, 이온·펩타이드·DNA/RNA와 아티팩트 리간드를 제외한 214 506개의 protein–ligand 복합 구조를 포함함. 유사한 리간드는 FP2 지문을 이용하여 유사도를 평가하고, 여러 template가 발견되면 50% 이상 동일한 결합 잔기를 공유하는 경우 cavity를 병합하며 그렇지 않으면 독립적으로 docking을 수행함.
7-2-3. Reconfiguration of input/output interfaces
- 업데이트 된 웹 인터페이스는 사용자가 cavity detection만 독립적으로 수행할 수 있는 기능을 제공하여 3D 뷰어에서 예측된 결합 부위를 선택하고 구조 기반과 template 기반 docking을 각각 실행할 수 있음. 결합 부위의 잔기는 시퀀스 패널에서 강조 표시되어 binding site 식별을 도움.
- 또한 입력 인터페이스에 JSME 기반 분자 편집기를 추가해 SMILES 입력과 2D 구조 그리기를 지원하고, 업로드한 리간드를 편집·미리보기할 수 있게 되어있음.
- 결과 페이지는 CA‑SP 거리 기준으로 상호작용 잔기 목록을 제공하고, 구조 기반과 template 기반 docking 결과를 나란히 비교할 수 있으며, cavity 수 조정과 사용자 지정 complex 구조 업로드 등 추가 매개변수 설정을 지원해 유연성을 높였음.
7-2-4. Other optimization
기존 CB‑Dock의 cavity detection 알고리즘은 2000개 이상의 잔기를 가진 거대 단백질에서 시간이 오래 걸리는 문제가 있었음. CB‑Dock2는 protein‑surface curvature 계산을 최적화하여 처리 속도를 4–5배 향상시켰고, 2500개 잔기 단백질을 50초 안에 처리할 수 있게 했음.
7-3. Conclusions and Future Perspectives
- CB‑Dock2는 원래 버전의 기능을 계승하면서 template 기반 blind docking 모듈을 통합해 사용자가 기존 protein–ligand 구조 정보를 참고하여 잠재적 결합 부위와 자세를 얻을 수 있게 하였음. 새롭게 설계된 사용자 인터페이스는 다양한 데이터 입력과 편리한 결과 시각화를 지원하며, JSME 분자 편집기와 template 업로드 기능 덕분에 cavity 탐지 이상의 약물 디자인과 최적화에 활용될 수 있음.
- 저자들은 현재 버전이 비대칭 단위와 생물학적 어셈블리를 구분하지 못하여 인공적인 cavity가 생성될 수 있고, 누락된 잔기 보정, 단백질 최적화, 수용체 유연성을 처리하지 못하는 한계가 있다고 밝힘. 향후에는 docking 엔진 개선과 사용자 피드백을 통해 이러한 한계를 해결하여 CB‑Dock2를 더욱 강력하고 보편적인 도구로 발전시킬 계획임.
8.대표 Figure





댓글