02-24 vLLM vLLM Windows 上从源码完整构建 vLLM wheel 的详细教程 本文档为在 Windows 10/11 上从零构建 vLLM with Flash Attention 2 的完整指南:明确列出 VS2022、CUDA/cuDNN/cuDSS/cuSPARSELt、Miniconda 等前置条件;在 VS2022 Developer PowerShell 为 vLLM 创建并验证 PyTorch nightly 环境;需手动三处修改:将 Linux rm 替换为 os.remove 以防 Windows 错误,补丁 PyTorch 头文件以匹配源码签名,更新 CMakeLists 中 TORCH_SUPPORTED_VERSION_CUDA 至与 torch 版本一致。提供完整 PowerShell 构建脚本 build_wheel.ps1(短路径防空格、可 Ctrl+C 中断),并给出安装与常见问题排查(CUDA/PyTorch 版本、MSVC 环境、路径配置、编译卡住的应对)。执行后在 dist 目录生成 vllm-*.whl 并可直接 pip 安装。 275 1 0