From 2defe98df838fc7b41ff506819e33b1b73a31eb3 Mon Sep 17 00:00:00 2001
From: Ettore Di Giacinto <mudler@users.noreply.github.com>
Date: Fri, 21 Nov 2025 18:06:46 +0100
Subject: [PATCH] fix(vllm): Update flash-attn to specific wheel URL

Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>
---
 backend/python/vllm/requirements-cublas12-after.txt | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/backend/python/vllm/requirements-cublas12-after.txt b/backend/python/vllm/requirements-cublas12-after.txt
index 7bfe8efeb..9251ba608 100644
--- a/backend/python/vllm/requirements-cublas12-after.txt
+++ b/backend/python/vllm/requirements-cublas12-after.txt
@@ -1 +1 @@
-flash-attn
\ No newline at end of file
+https://github.com/Dao-AILab/flash-attention/releases/download/v2.8.3/flash_attn-2.8.3+cu12torch2.7cxx11abiTRUE-cp310-cp310-linux_x86_64.whl