Merge pull request #13731 from tth37/fix_duplicate_web_search_urls

fix: Duplicate web search urls
2025-06-26 18:26:48 +00:00 · 2025-05-09 16:43:11 +04:00 · 2025-05-09 16:43:11 +04:00 · 8acc1ab425
commit 8acc1ab425
parent 616e9e2760 c95a65a4bd
1 changed files with 5 additions and 4 deletions
--- a/backend/open_webui/routers/retrieval.py
+++ b/backend/open_webui/routers/retrieval.py
@ -1590,6 +1590,11 @@ async def process_web_search(

    try:
        urls = [result.link for result in web_results]
+
+        # Remove duplicates
+        urls = list(dict.fromkeys(urls))
+        log.debug(f"urls: {urls}")
+
        loader = get_web_loader(
            urls,
            verify_ssl=request.app.state.config.ENABLE_WEB_LOADER_SSL_VERIFICATION,
@ -1601,10 +1606,6 @@ async def process_web_search(
            doc.metadata.get("source") for doc in docs if doc.metadata.get("source")
        ]  # only keep URLs

-        # Remove duplicates
-        urls = list(dict.fromkeys(urls))
-        log.debug(f"urls: {urls}")
-
        if request.app.state.config.BYPASS_WEB_SEARCH_EMBEDDING_AND_RETRIEVAL:
            return {
                "status": True,