Update inference.py

2025-06-26 18:25:56 +00:00 · 2024-12-30 14:48:51 +08:00 · 2024-12-30 14:48:51 +08:00 · 66ec91081c
commit 66ec91081c
parent 9789f97283
1 changed files with 4 additions and 4 deletions
--- a/inference.py
+++ b/inference.py
@ -127,10 +127,10 @@ def main(args):

    with torch.no_grad():

-        inputs_embeds = None
-        past_key_values = None
-
-        if args.chunk_size > 0:
+        if args.chunk_size == -1:
+            inputs_embeds = vl_gpt.prepare_inputs_embeds(**prepare_inputs)
+            past_key_values = None
+        else:
            # incremental_prefilling when using 40G GPU for vl2-small
            inputs_embeds, past_key_values = vl_gpt.incremental_prefilling(
                input_ids=prepare_inputs.input_ids,