fix request param handling

2025-06-26 18:15:58 +00:00 · 2024-05-29 09:49:16 -04:00 · 2024-05-29 09:49:16 -04:00 · 420ecff7ce
commit 420ecff7ce
parent 3c8ce1a03b
1 changed files with 22 additions and 10 deletions
--- a/pipelines/examples/anthropic_manifold_pipeline.py
+++ b/pipelines/examples/anthropic_manifold_pipeline.py
@ -71,14 +71,20 @@ class Pipeline:
    def stream_response(
        self, model_id: str, messages: List[dict], body: dict
    ) -> Generator:
+        max_tokens = body.get("max_tokens") if body.get("max_tokens") is not None else 4096
+        temperature = body.get("temperature") if body.get("temperature") is not None else 0.8
+        top_k = body.get("top_k") if body.get("top_k") is not None else 40
+        top_p = body.get("top_p") if body.get("top_p") is not None else 0.9
+        stop_sequences = body.get("stop") if body.get("stop") is not None else []
+
        stream = self.client.messages.create(
            model=model_id,
            messages=messages,
-            max_tokens=body.get("max_tokens", 4096),
-            temperature=body.get("temperature", 0.8),
-            top_k=body.get("top_k", 40),
-            top_p=body.get("top_p", 0.9),
-            stop_sequences=body.get("stop", []),
+            max_tokens=max_tokens,
+            temperature=temperature,
+            top_k=top_k,
+            top_p=top_p,
+            stop_sequences=stop_sequences,
            stream=True,
        )

@ -89,13 +95,19 @@ class Pipeline:
                yield chunk.delta.text

    def get_completion(self, model_id: str, messages: List[dict], body: dict) -> str:
+        max_tokens = body.get("max_tokens") if body.get("max_tokens") is not None else 4096
+        temperature = body.get("temperature") if body.get("temperature") is not None else 0.8
+        top_k = body.get("top_k") if body.get("top_k") is not None else 40
+        top_p = body.get("top_p") if body.get("top_p") is not None else 0.9
+        stop_sequences = body.get("stop") if body.get("stop") is not None else []
+
        response = self.client.messages.create(
            model=model_id,
            messages=messages,
-            max_tokens=body.get("max_tokens", 4096),
-            temperature=body.get("temperature", 0.8),
-            top_k=body.get("top_k", 40),
-            top_p=body.get("top_p", 0.9),
-            stop_sequences=body.get("stop", []),
+            max_tokens=max_tokens,
+            temperature=temperature,
+            top_k=top_k,
+            top_p=top_p,
+            stop_sequences=stop_sequences,
        )
        return response.content[0].text