FastDeploy ：基于飞桨的大语言模型与视觉语言模型推理部署工具包

English | 简体中文

安装指导 | 快速入门 | 支持模型列表

FastDeploy ：基于飞桨的大语言模型与视觉语言模型推理部署工具包

关于

FastDeploy 是基于飞桨（PaddlePaddle）的大语言模型（LLM）与视觉语言模型（VLM）推理部署工具包，提供开箱即用的生产级部署方案，核心技术特性包括：

🚀 负载均衡式PD分解：工业级解决方案，支持上下文缓存与动态实例角色切换，在保障SLO达标和吞吐量的同时优化资源利用率
🔄 统一KV缓存传输：轻量级高性能传输库，支持智能NVLink/RDMA选择
🤝 OpenAI API服务与vLLM兼容：单命令部署，兼容vLLM接口
🧮 全量化格式支持：W8A16、W8A8、W4A16、W4A8、W2A16、FP8等
⏩ 高级加速技术：推测解码、多令牌预测（MTP）及分块预填充
🖥️ 多硬件支持：NVIDIA GPU、昆仑芯XPU、海光DCU、昇腾NPU、天数智芯GPU、燧原GCU、沐曦GPU、英特尔Gaudi等

要求

操作系统: Linux
Python: 3.10 ~ 3.12

安装

FastDeploy 支持在英伟达（NVIDIA）GPU、昆仑芯（Kunlunxin）XPU、天数（Iluvatar）GPU、燧原（Enflame）GCU、海光（Hygon）DCU 以及其他硬件上进行推理部署。详细安装说明如下：

注意: 我们正在积极拓展硬件支持范围。目前，包括昇腾（Ascend）NPU 等其他硬件平台正在开发测试中。敬请关注更新！

入门指南

通过我们的文档了解如何使用 FastDeploy：

支持模型列表

通过我们的文档了解如何下载模型，如何支持torch格式等：

模型支持列表

进阶用法

致谢

FastDeploy 依据 Apache-2.0 开源许可证. 进行授权。在开发过程中，我们参考并借鉴了 vLLM 的部分代码，以保持接口兼容性，在此表示衷心感谢。

Name		Name	Last commit message	Last commit date
Latest commit History 3,733 Commits
.github		.github
benchmarks		benchmarks
custom_ops		custom_ops
dockerfiles		dockerfiles
docs		docs
fastdeploy		fastdeploy
scripts		scripts
tests		tests
tools		tools
.clang-format		.clang-format
.flake8		.flake8
.gitignore		.gitignore
.gitmodules		.gitmodules
.pre-commit-config.yaml		.pre-commit-config.yaml
LICENSE		LICENSE
README.md		README.md
README_CN.md		README_CN.md
README_EN.md		README_EN.md
build.sh		build.sh
mkdocs.yml		mkdocs.yml
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
requirements_dcu.txt		requirements_dcu.txt
requirements_iluvatar.txt		requirements_iluvatar.txt
requirements_metaxgpu.txt		requirements_metaxgpu.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

FastDeploy ：基于飞桨的大语言模型与视觉语言模型推理部署工具包

最新活动

关于

要求

安装

入门指南

支持模型列表

进阶用法

致谢

About

Uh oh!

Releases 14

Packages

Uh oh!

Contributors 185

Languages

License

PaddlePaddle/FastDeploy

Folders and files

Latest commit

History

Repository files navigation

FastDeploy ：基于飞桨的大语言模型与视觉语言模型推理部署工具包

最新活动

关于

要求

安装

入门指南

支持模型列表

进阶用法

致谢

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 14

Packages 0

Uh oh!

Contributors 185

Languages

Packages