From b473ad574fee48fd56a903e58614a4c7865ec7c4 Mon Sep 17 00:00:00 2001
From: Ased Mammad <mammad.ased@gmail.com>
Date: Fri, 23 Feb 2024 14:27:31 +0330
Subject: [PATCH] fix: RAG scan unsupported mimetype

This fixes an issue with RAG that stops loading documents as soon
as it reaches a file with unsupported mimetype.
---
 backend/apps/rag/main.py | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/backend/apps/rag/main.py b/backend/apps/rag/main.py
index 4176d5670..83c10233e 100644
--- a/backend/apps/rag/main.py
+++ b/backend/apps/rag/main.py
@@ -423,7 +423,7 @@ def get_loader(filename: str, file_content_type: str, file_path: str):
         "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet",
     ] or file_ext in ["xls", "xlsx"]:
         loader = UnstructuredExcelLoader(file_path)
-    elif file_ext in known_source_ext or file_content_type.find("text/") >= 0:
+    elif file_ext in known_source_ext or (file_content_type and file_content_type.find("text/") >= 0):
         loader = TextLoader(file_path)
     else:
         loader = TextLoader(file_path)
@@ -486,8 +486,8 @@ def store_doc(
 
 @app.get("/scan")
 def scan_docs_dir(user=Depends(get_admin_user)):
-    try:
-        for path in Path(DOCS_DIR).rglob("./**/*"):
+    for path in Path(DOCS_DIR).rglob("./**/*"):
+        try:
             if path.is_file() and not path.name.startswith("."):
                 tags = extract_folders_after_data_docs(path)
                 filename = path.name
@@ -535,8 +535,8 @@ def scan_docs_dir(user=Depends(get_admin_user)):
                             ),
                         )
 
-    except Exception as e:
-        print(e)
+        except Exception as e:
+            print(e)
 
     return True