GitHub - xie-lab-ml/piecewise-sparse-attention: Piecewise Sparse Attention Is Wiser for Efficient Diffusion Transformers

PISA: Piecewise Sparse Attention Is Wiser for Efficient Diffusion Transformers

🔥 News

[2026/02] Paper is released.

💡 TL;DR

We propose a training-free Piecewise Sparse Attention (PISA) that covers the full attention span with sub-quadratic complexity.

Unlike the standard keep-or-drop paradigm that directly drop the non-critical blocks, PISA introduces a novel exact-or-approximate strategy: it maintains exact computation for critical blocks while efficiently approximating the remainder through block-wise Taylor expansion.

⏰ Plans

Release triton kernel
Release flux.1-dev inference demo
Release wan/hyvideo inference script

🔧 Installation

Requirements:

torch >= 2.7.1
triton >= 3.5.1

Install:

git clone https://github.com/hp-l33/piecewise-sparse-attention.git
cd piecewise-sparse-attention
pip install -e .

Note: Our kernels are currently primarily optimized for the NVIDIA Hopper architecture (e.g., H100, H800).

🎮 Quick Start

Text-to-Image Generation

from diffusers import AutoPipelineForText2Image
+ from piecewise_attn import piecewise_sparse_attention
+ from piecewise_attn.models import FluxAttnProcessor, set_processor

pipeline = AutoPipelineForText2Image.from_pretrained(
    "black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16,
).to("cuda")

+ pipeline = set_processor(pipeline, piecewise_sparse_attention, density=0.15)

prompt = "A portrait of a human growing colorful flowers from her hair. Hyperrealistic oil painting. Intricate details."
image = pipe(
    prompt,
    height=1024,
    width=1024,
    guidance_scale=3.5,
    num_inference_steps=50,
    max_sequence_length=512,
).images[0]

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
assets		assets
piecewise_attn		piecewise_attn
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
flux_inference.ipynb		flux_inference.ipynb
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

PISA: Piecewise Sparse Attention Is Wiser for Efficient Diffusion Transformers

🔥 News

💡 TL;DR

⏰ Plans

🔧 Installation

🎮 Quick Start

Text-to-Image Generation

About

Uh oh!

Releases

Packages

Languages

License

xie-lab-ml/piecewise-sparse-attention

Folders and files

Latest commit

History

Repository files navigation

PISA: Piecewise Sparse Attention Is Wiser for Efficient Diffusion Transformers

🔥 News

💡 TL;DR

⏰ Plans

🔧 Installation

🎮 Quick Start

Text-to-Image Generation

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages