Merge pull request #5829 from jannikstdl/query-embedding-perf-fix

fix: performance issues on large collections
2025-03-26 07:27:40 +00:00 · 2024-10-04 10:01:17 +02:00 · 2024-10-04 10:01:17 +02:00 · 0876c9b5ef
commit 0876c9b5ef
parent ebc7da6f82 6bff5a4d09
1 changed files with 6 additions and 5 deletions
--- a/backend/open_webui/apps/retrieval/utils.py
+++ b/backend/open_webui/apps/retrieval/utils.py
@ -65,14 +65,13 @@ class VectorSearchRetriever(BaseRetriever):
 def query_doc(
    collection_name: str,
-    query: str,
+    query_embedding: list[float],
    embedding_function,
    k: int,
 ):
    try:
        result = VECTOR_DB_CLIENT.search(
            collection_name=collection_name,
-            vectors=[embedding_function(query)],
+            vectors=[query_embedding],
            limit=k,
        )
@ -182,15 +181,17 @@ def query_collection(
    embedding_function,
    k: int,
 ) -> dict:
    results = []
    query_embedding = embedding_function(query)
    for collection_name in collection_names:
        if collection_name:
            try:
                result = query_doc(
                    collection_name=collection_name,
                    query=query,
                    k=k,
-                    embedding_function=embedding_function,
+                    query_embedding=query_embedding,
                )
                results.append(result.model_dump())
            except Exception as e: