init fp8

2025-06-26 18:15:54 +00:00 · 2025-02-24 21:12:36 +08:00
parent bcb90f2afd
commit dae0690055
2 changed files with 4 additions and 0 deletions
--- a/csrc/flash_fwd_mla_fp8_sm90.cu
+++ b/csrc/flash_fwd_mla_fp8_sm90.cu
@@ -0,0 +1,3 @@
 #include "flash_fwd_mla_kernel.h"
 template void run_mha_fwd_splitkv_mla<cutlass::float_e4m3_t, 576>(Flash_fwd_mla_params &params, cudaStream_t stream);
--- a/setup.py
+++ b/setup.py
@@ -37,6 +37,7 @@ ext_modules.append(
        sources=[
            "csrc/flash_api.cpp",
            "csrc/flash_fwd_mla_bf16_sm90.cu",
            "csrc/flash_fwd_mla_fp8_sm90.cu",
        ],
        extra_compile_args={
            "cxx": cxx_args,
		`@@ -0,0 +1,3 @@`
							`#include "flash_fwd_mla_kernel.h"`

							`template void run_mha_fwd_splitkv_mla<cutlass::float_e4m3_t, 576>(Flash_fwd_mla_params &params, cudaStream_t stream);`