728 字
4 分钟
使用 LocalColabFold 本地部署 AlphaFold 2

为什么要本地部署 AlphaFold?#

  • 数据隐私:药企和科研机构的序列数据高度敏感,必须通过“物理隔离”保护,避免上传至云端。
  • 高通量需求: 突破 Google Colab 或官方服务器的配额限制(一天 30 个 jobs),实现 7x24 小时批量预测。
  • 自定义参数: 允许调整多序列比对(MSA)深度、模板使用等参数,适配特定科研目标。

.png

本地部署的方法#

核心方案:LocalColabFold github.com/YoshitakaMo/localcolabfold

LocalColabFold 是 AlphaFold2 的一个经过优化的本地版本,它将原本复杂的部署过程简化为“一键脚本”,并支持轻量化运行。 为什么它能“轻量化”?

  • 云端 MSA 搜索(可选):AlphaFold 最占空间的是几 TB 的基因序列数据库。LocalColabFold 默认可以调用 ColabFold 的公共服务器进行序列比对(MSA),你本地不需要下载那 2.5 TB 的数据。

  • MMseqs2 优化:如果你选择本地搜索,它使用比原版更快的 MMseqs2 算法,内存占用更低,速度提升数十倍。

  • 显存优化:支持在消费级显卡(如 RTX 3060/4060 8GB/12GB)上运行中短序列。

步骤如下(假设在 Windows 环境下部署):

  1. 安装 Windows Subsystem for Linux
Terminal window
wsl.exe --install ubuntu
  1. 启动 WSL 后更换国内镜像
Terminal window
echo '# 默认注释了源码镜像以提高 apt update 速度,如有需要可自行取消注释
deb https://mirror.sjtu.edu.cn/ubuntu/ noble main restricted universe multiverse
# deb-src https://mirror.sjtu.edu.cn/ubuntu/ noble main restricted universe multiverse
deb https://mirror.sjtu.edu.cn/ubuntu/ noble-updates main restricted universe multiverse
# deb-src https://mirror.sjtu.edu.cn/ubuntu/ noble-updates main restricted universe multiverse
deb https://mirror.sjtu.edu.cn/ubuntu/ noble-backports main restricted universe multiverse
# deb-src https://mirror.sjtu.edu.cn/ubuntu/ noble-backports main restricted universe multiverse
# 以下安全更新软件源包含了官方源与镜像站配置,如有需要可自行修改注释切换
# deb https://mirror.sjtu.edu.cn/ubuntu/ noble-security main restricted universe multiverse
# # deb-src https://mirror.sjtu.edu.cn/ubuntu/ noble-security main restricted universe multiverse
deb http://security.ubuntu.com/ubuntu/ noble-security main restricted universe multiverse
# deb-src http://security.ubuntu.com/ubuntu/ noble-security main restricted universe multiverse
# 预发布软件源,不建议启用
# deb https://mirror.sjtu.edu.cn/ubuntu/ noble-proposed main restricted universe multiverse
# # deb-src https://mirror.sjtu.edu.cn/ubuntu/ noble-proposed main restricted universe multiverse
' | sudo tee /etc/apt/sources.list #更换 SJTU 软件源镜像
  1. 安装 CUDA 等前置软件
Terminal window
sudo apt install -y curl wget git cuda-toolkit
nvcc --version # 检查 CUDA 是否安装成功
  1. 使用安装脚本安装 LocalColabFold
Terminal window
wget https://raw.githubusercontent.com/YoshitakaMo/localcolabfold/main/install_colabbatch_linux.sh
bash install_colabbatch_linux.sh

编辑 ~/.bashrc

Terminal window
export PATH="~/colabfold-conda/bin:$PATH" # 设置环境变量
# 设置 TensorFlow 环境变量,以防超显存
export TF_FORCE_UNIFIED_MEMORY="1"
export XLA_PYTHON_CLIENT_MEM_FRACTION="4.0"
export XLA_PYTHON_CLIENT_ALLOCATOR="platform"
export TF_FORCE_GPU_ALLOW_GROWTH="true"

这样 LocalColabFold 就安装完成了。

使用方法#

Terminal window
colabfold_batch input outputdir/ # input 和 outputdir 分别是存放输入和输出的目录(input 也可以是文件)
# 输入文件支持 fasta,csv,a3m 格式

其他的运行 Flag 参见项目文档 README

.png

得到的蛋白质结构使用 PyMOL 可视化: .png

还有没有其他部署方式?#

除了使用 LocalColabFold,也可以直接使用 Docker 部署 ColabFold。 可以参考链接:https://github.com/sokrypton/ColabFold/wiki/Running-ColabFold-in-Docker

Docker 部署更为便捷,但是由于国内网络环境限制,Docker 无法从官网 Pull 镜像,故不采纳。

使用 LocalColabFold 本地部署 AlphaFold 2
https://www.cristime.top/posts/localcolabfold/
作者
Cristimezzz
发布于
2025-12-18
许可协议
CC BY-NC-SA 4.0