open-webui/backend/utils/misc.py

import hashlib
import re
import time
import uuid
from datetime import timedelta
from pathlib import Path
from typing import Callable, Optional

from utils.task import prompt_template


def get_last_user_message_item(messages: list[dict]) -> Optional[dict]:
    for message in reversed(messages):
        if message["role"] == "user":
            return message
    return None


def get_content_from_message(message: dict) -> Optional[str]:
    if isinstance(message["content"], list):
        for item in message["content"]:
            if item["type"] == "text":
                return item["text"]
    else:
        return message["content"]
    return None


def get_last_user_message(messages: list[dict]) -> Optional[str]:
    message = get_last_user_message_item(messages)
    if message is None:
        return None

    return get_content_from_message(message)


def get_last_assistant_message(messages: list[dict]) -> Optional[str]:
    for message in reversed(messages):
        if message["role"] == "assistant":
            return get_content_from_message(message)
    return None


def get_system_message(messages: list[dict]) -> Optional[dict]:
    for message in messages:
        if message["role"] == "system":
            return message
    return None


def remove_system_message(messages: list[dict]) -> list[dict]:
    return [message for message in messages if message["role"] != "system"]


def pop_system_message(messages: list[dict]) -> tuple[Optional[dict], list[dict]]:
    return get_system_message(messages), remove_system_message(messages)


def prepend_to_first_user_message_content(
    content: str, messages: list[dict]
) -> list[dict]:
    for message in messages:
        if message["role"] == "user":
            if isinstance(message["content"], list):
                for item in message["content"]:
                    if item["type"] == "text":
                        item["text"] = f"{content}\n{item['text']}"
            else:
                message["content"] = f"{content}\n{message['content']}"
            break
    return messages


def add_or_update_system_message(content: str, messages: list[dict]):
    """
    Adds a new system message at the beginning of the messages list
    or updates the existing system message at the beginning.

    :param msg: The message to be added or appended.
    :param messages: The list of message dictionaries.
    :return: The updated list of message dictionaries.
    """

    if messages and messages[0].get("role") == "system":
        messages[0]["content"] = f"{content}\n{messages[0]['content']}"
    else:
        # Insert at the beginning
        messages.insert(0, {"role": "system", "content": content})

    return messages


def openai_chat_message_template(model: str):
    return {
        "id": f"{model}-{str(uuid.uuid4())}",
        "created": int(time.time()),
        "model": model,
        "choices": [{"index": 0, "logprobs": None, "finish_reason": None}],
    }


def openai_chat_chunk_message_template(model: str, message: str) -> dict:
    template = openai_chat_message_template(model)
    template["object"] = "chat.completion.chunk"
    template["choices"][0]["delta"] = {"content": message}
    return template


def openai_chat_completion_message_template(model: str, message: str) -> dict:
    template = openai_chat_message_template(model)
    template["object"] = "chat.completion"
    template["choices"][0]["message"] = {"content": message, "role": "assistant"}
    template["choices"][0]["finish_reason"] = "stop"
    return template


# inplace function: form_data is modified
def apply_model_system_prompt_to_body(params: dict, form_data: dict, user) -> dict:
    system = params.get("system", None)
    if not system:
        return form_data

    if user:
        template_params = {
            "user_name": user.name,
            "user_location": user.info.get("location") if user.info else None,
        }
    else:
        template_params = {}
    system = prompt_template(system, **template_params)
    form_data["messages"] = add_or_update_system_message(
        system, form_data.get("messages", [])
    )
    return form_data


# inplace function: form_data is modified
def apply_model_params_to_body(
    params: dict, form_data: dict, mappings: dict[str, Callable]
) -> dict:
    if not params:
        return form_data

    for key, cast_func in mappings.items():
        if (value := params.get(key)) is not None:
            form_data[key] = cast_func(value)

    return form_data


# inplace function: form_data is modified
def apply_model_params_to_body_openai(params: dict, form_data: dict) -> dict:
    mappings = {
        "temperature": float,
        "top_p": int,
        "max_tokens": int,
        "frequency_penalty": int,
        "seed": lambda x: x,
        "stop": lambda x: [bytes(s, "utf-8").decode("unicode_escape") for s in x],
    }
    return apply_model_params_to_body(params, form_data, mappings)


def apply_model_params_to_body_ollama(params: dict, form_data: dict) -> dict:
    opts = [
        "temperature",
        "top_p",
        "seed",
        "mirostat",
        "mirostat_eta",
        "mirostat_tau",
        "num_ctx",
        "num_batch",
        "num_keep",
        "repeat_last_n",
        "tfs_z",
        "top_k",
        "min_p",
        "use_mmap",
        "use_mlock",
        "num_thread",
        "num_gpu",
    ]
    mappings = {i: lambda x: x for i in opts}
    form_data = apply_model_params_to_body(params, form_data, mappings)

    name_differences = {
        "max_tokens": "num_predict",
        "frequency_penalty": "repeat_penalty",
    }

    for key, value in name_differences.items():
        if (param := params.get(key, None)) is not None:
            form_data[value] = param

    return form_data


def get_gravatar_url(email):
    # Trim leading and trailing whitespace from
    # an email address and force all characters
    # to lower case
    address = str(email).strip().lower()

    # Create a SHA256 hash of the final string
    hash_object = hashlib.sha256(address.encode())
    hash_hex = hash_object.hexdigest()

    # Grab the actual image URL
    return f"https://www.gravatar.com/avatar/{hash_hex}?d=mp"


def calculate_sha256(file):
    sha256 = hashlib.sha256()
    # Read the file in chunks to efficiently handle large files
    for chunk in iter(lambda: file.read(8192), b""):
        sha256.update(chunk)
    return sha256.hexdigest()


def calculate_sha256_string(string):
    # Create a new SHA-256 hash object
    sha256_hash = hashlib.sha256()
    # Update the hash object with the bytes of the input string
    sha256_hash.update(string.encode("utf-8"))
    # Get the hexadecimal representation of the hash
    hashed_string = sha256_hash.hexdigest()
    return hashed_string


def validate_email_format(email: str) -> bool:
    if email.endswith("@localhost"):
        return True

    return bool(re.match(r"[^@]+@[^@]+\.[^@]+", email))


def sanitize_filename(file_name):
    # Convert to lowercase
    lower_case_file_name = file_name.lower()

    # Remove special characters using regular expression
    sanitized_file_name = re.sub(r"[^\w\s]", "", lower_case_file_name)

    # Replace spaces with dashes
    final_file_name = re.sub(r"\s+", "-", sanitized_file_name)

    return final_file_name


def extract_folders_after_data_docs(path):
    # Convert the path to a Path object if it's not already
    path = Path(path)

    # Extract parts of the path
    parts = path.parts

    # Find the index of '/data/docs' in the path
    try:
        index_data_docs = parts.index("data") + 1
        index_docs = parts.index("docs", index_data_docs) + 1
    except ValueError:
        return []

    # Exclude the filename and accumulate folder names
    tags = []

    folders = parts[index_docs:-1]
    for idx, _ in enumerate(folders):
        tags.append("/".join(folders[: idx + 1]))

    return tags


def parse_duration(duration: str) -> Optional[timedelta]:
    if duration == "-1" or duration == "0":
        return None

    # Regular expression to find number and unit pairs
    pattern = r"(-?\d+(\.\d+)?)(ms|s|m|h|d|w)"
    matches = re.findall(pattern, duration)

    if not matches:
        raise ValueError("Invalid duration string")

    total_duration = timedelta()

    for number, _, unit in matches:
        number = float(number)
        if unit == "ms":
            total_duration += timedelta(milliseconds=number)
        elif unit == "s":
            total_duration += timedelta(seconds=number)
        elif unit == "m":
            total_duration += timedelta(minutes=number)
        elif unit == "h":
            total_duration += timedelta(hours=number)
        elif unit == "d":
            total_duration += timedelta(days=number)
        elif unit == "w":
            total_duration += timedelta(weeks=number)

    return total_duration


def parse_ollama_modelfile(model_text):
    parameters_meta = {
        "mirostat": int,
        "mirostat_eta": float,
        "mirostat_tau": float,
        "num_ctx": int,
        "repeat_last_n": int,
        "repeat_penalty": float,
        "temperature": float,
        "seed": int,
        "tfs_z": float,
        "num_predict": int,
        "top_k": int,
        "top_p": float,
        "num_keep": int,
        "typical_p": float,
        "presence_penalty": float,
        "frequency_penalty": float,
        "penalize_newline": bool,
        "numa": bool,
        "num_batch": int,
        "num_gpu": int,
        "main_gpu": int,
        "low_vram": bool,
        "f16_kv": bool,
        "vocab_only": bool,
        "use_mmap": bool,
        "use_mlock": bool,
        "num_thread": int,
    }

    data = {"base_model_id": None, "params": {}}

    # Parse base model
    base_model_match = re.search(
        r"^FROM\s+(\w+)", model_text, re.MULTILINE | re.IGNORECASE
    )
    if base_model_match:
        data["base_model_id"] = base_model_match.group(1)

    # Parse template
    template_match = re.search(
        r'TEMPLATE\s+"""(.+?)"""', model_text, re.DOTALL | re.IGNORECASE
    )
    if template_match:
        data["params"] = {"template": template_match.group(1).strip()}

    # Parse stops
    stops = re.findall(r'PARAMETER stop "(.*?)"', model_text, re.IGNORECASE)
    if stops:
        data["params"]["stop"] = stops

    # Parse other parameters from the provided list
    for param, param_type in parameters_meta.items():
        param_match = re.search(rf"PARAMETER {param} (.+)", model_text, re.IGNORECASE)
        if param_match:
            value = param_match.group(1)

            try:
                if param_type is int:
                    value = int(value)
                elif param_type is float:
                    value = float(value)
                elif param_type is bool:
                    value = value.lower() == "true"
            except Exception as e:
                print(e)
                continue

            data["params"][param] = value

    # Parse adapter
    adapter_match = re.search(r"ADAPTER (.+)", model_text, re.IGNORECASE)
    if adapter_match:
        data["params"]["adapter"] = adapter_match.group(1)

    # Parse system description
    system_desc_match = re.search(
        r'SYSTEM\s+"""(.+?)"""', model_text, re.DOTALL | re.IGNORECASE
    )
    system_desc_match_single = re.search(
        r"SYSTEM\s+([^\n]+)", model_text, re.IGNORECASE
    )

    if system_desc_match:
        data["params"]["system"] = system_desc_match.group(1).strip()
    elif system_desc_match_single:
        data["params"]["system"] = system_desc_match_single.group(1).strip()

    # Parse messages
    messages = []
    message_matches = re.findall(r"MESSAGE (\w+) (.+)", model_text, re.IGNORECASE)
    for role, content in message_matches:
        messages.append({"role": role, "content": content})

    if messages:
        data["params"]["messages"] = messages

    return data
feat: basic RBAC support 2023-11-19 05:41:43 +00:00			`import hashlib`
feat/fix: email format validation 2024-01-03 00:22:48 +00:00			`import re`
feat: pipe function 2024-06-20 11:38:59 +00:00			`import time`
sort and fix backend imports 2024-08-27 22:10:27 +00:00			`import uuid`
			`from datetime import timedelta`
			`from pathlib import Path`
			`from typing import Callable, Optional`
refac: rag 2024-06-09 10:01:25 +00:00
refac: apps/openai/main.py and utils 2024-08-03 13:24:26 +00:00			`from utils.task import prompt_template`

refac: rag 2024-06-09 10:01:25 +00:00
remove List imports 2024-08-14 12:46:31 +00:00			`def get_last_user_message_item(messages: list[dict]) -> Optional[dict]:`
refac: rag 2024-06-09 10:01:25 +00:00			`for message in reversed(messages):`
			`if message["role"] == "user":`
enh: get_last_user_message_item 2024-07-02 07:37:21 +00:00			`return message`
			`return None`


refac: rename whole_message_template, silence lsp 2024-07-31 20:58:40 +00:00			`def get_content_from_message(message: dict) -> Optional[str]:`
			`if isinstance(message["content"], list):`
			`for item in message["content"]:`
			`if item["type"] == "text":`
			`return item["text"]`
			`else:`
enh: get_last_user_message_item 2024-07-02 07:37:21 +00:00			`return message["content"]`
refac: rag 2024-06-09 10:01:25 +00:00			`return None`


remove List imports 2024-08-14 12:46:31 +00:00			`def get_last_user_message(messages: list[dict]) -> Optional[str]:`
refac: rename whole_message_template, silence lsp 2024-07-31 20:58:40 +00:00			`message = get_last_user_message_item(messages)`
			`if message is None:`
			`return None`

			`return get_content_from_message(message)`


remove List imports 2024-08-14 12:46:31 +00:00			`def get_last_assistant_message(messages: list[dict]) -> Optional[str]:`
refac: rag 2024-06-09 10:01:25 +00:00			`for message in reversed(messages):`
			`if message["role"] == "assistant":`
refac: rename whole_message_template, silence lsp 2024-07-31 20:58:40 +00:00			`return get_content_from_message(message)`
refac: rag 2024-06-09 10:01:25 +00:00			`return None`


remove List imports 2024-08-14 12:46:31 +00:00			`def get_system_message(messages: list[dict]) -> Optional[dict]:`
enh: __messages__ support for tools 2024-06-17 20:28:29 +00:00			`for message in messages:`
			`if message["role"] == "system":`
			`return message`
			`return None`


remove List imports 2024-08-14 12:46:31 +00:00			`def remove_system_message(messages: list[dict]) -> list[dict]:`
enh: __messages__ support for tools 2024-06-17 20:28:29 +00:00			`return [message for message in messages if message["role"] != "system"]`


replace Tuple with tuple 2024-08-14 12:58:37 +00:00			`def pop_system_message(messages: list[dict]) -> tuple[Optional[dict], list[dict]]:`
enh: __messages__ support for tools 2024-06-17 20:28:29 +00:00			`return get_system_message(messages), remove_system_message(messages)`


fix: ollama rag issue workaround 2024-07-26 11:22:13 +00:00			`def prepend_to_first_user_message_content(`
remove List imports 2024-08-14 12:46:31 +00:00			`content: str, messages: list[dict]`
			`) -> list[dict]:`
fix: ollama rag issue workaround 2024-07-26 11:22:13 +00:00			`for message in messages:`
			`if message["role"] == "user":`
			`if isinstance(message["content"], list):`
			`for item in message["content"]:`
			`if item["type"] == "text":`
			`item["text"] = f"{content}\n{item['text']}"`
			`else:`
			`message["content"] = f"{content}\n{message['content']}"`
			`break`
			`return messages`


remove List imports 2024-08-14 12:46:31 +00:00			`def add_or_update_system_message(content: str, messages: list[dict]):`
refac: rag 2024-06-09 10:01:25 +00:00			`"""`
			`Adds a new system message at the beginning of the messages list`
			`or updates the existing system message at the beginning.`

			`:param msg: The message to be added or appended.`
			`:param messages: The list of message dictionaries.`
			`:return: The updated list of message dictionaries.`
			`"""`

			`if messages and messages[0].get("role") == "system":`
fix: stop system prompt being duplicated 2024-08-26 20:25:57 +00:00			`messages[0]["content"] = f"{content}\n{messages[0]['content']}"`
refac: rag 2024-06-09 10:01:25 +00:00			`else:`
			`# Insert at the beginning`
			`messages.insert(0, {"role": "system", "content": content})`

			`return messages`
feat: basic RBAC support 2023-11-19 05:41:43 +00:00
feat: pipe function 2024-06-20 11:38:59 +00:00
refac: rename message_template 2024-07-31 21:01:22 +00:00			`def openai_chat_message_template(model: str):`
feat: pipe function 2024-06-20 11:38:59 +00:00			`return {`
			`"id": f"{model}-{str(uuid.uuid4())}",`
			`"created": int(time.time()),`
			`"model": model,`
refac: reuse stream_message_template 2024-07-31 14:26:26 +00:00			`"choices": [{"index": 0, "logprobs": None, "finish_reason": None}],`
feat: pipe function 2024-06-20 11:38:59 +00:00			`}`

refac: reuse stream_message_template 2024-07-31 14:26:26 +00:00
fix: non streaming functions 2024-08-04 11:10:02 +00:00			`def openai_chat_chunk_message_template(model: str, message: str) -> dict:`
refac: rename message_template 2024-07-31 21:01:22 +00:00			`template = openai_chat_message_template(model)`
refac: reuse stream_message_template 2024-07-31 14:26:26 +00:00			`template["object"] = "chat.completion.chunk"`
			`template["choices"][0]["delta"] = {"content": message}`
			`return template`


fix: non streaming functions 2024-08-04 11:10:02 +00:00			`def openai_chat_completion_message_template(model: str, message: str) -> dict:`
refac: rename message_template 2024-07-31 21:01:22 +00:00			`template = openai_chat_message_template(model)`
refac: reuse stream_message_template 2024-07-31 14:26:26 +00:00			`template["object"] = "chat.completion"`
			`template["choices"][0]["message"] = {"content": message, "role": "assistant"}`
			`template["choices"][0]["finish_reason"] = "stop"`
fix: non streaming functions 2024-08-04 11:10:02 +00:00			`return template`
refac: reuse stream_message_template 2024-07-31 14:26:26 +00:00
feat: basic RBAC support 2023-11-19 05:41:43 +00:00
refac: apps/openai/main.py and utils 2024-08-03 13:24:26 +00:00			`# inplace function: form_data is modified`
			`def apply_model_system_prompt_to_body(params: dict, form_data: dict, user) -> dict:`
			`system = params.get("system", None)`
			`if not system:`
			`return form_data`

			`if user:`
			`template_params = {`
			`"user_name": user.name,`
			`"user_location": user.info.get("location") if user.info else None,`
			`}`
			`else:`
			`template_params = {}`
			`system = prompt_template(system, **template_params)`
			`form_data["messages"] = add_or_update_system_message(`
			`system, form_data.get("messages", [])`
			`)`
			`return form_data`


			`# inplace function: form_data is modified`
refac: re-use utils.misc 2024-08-06 10:31:45 +00:00			`def apply_model_params_to_body(`
			`params: dict, form_data: dict, mappings: dict[str, Callable]`
			`) -> dict:`
refac: apps/openai/main.py and utils 2024-08-03 13:24:26 +00:00			`if not params:`
			`return form_data`

			`for key, cast_func in mappings.items():`
			`if (value := params.get(key)) is not None:`
			`form_data[key] = cast_func(value)`

			`return form_data`


refac: re-use utils.misc 2024-08-06 10:31:45 +00:00			`# inplace function: form_data is modified`
			`def apply_model_params_to_body_openai(params: dict, form_data: dict) -> dict:`
fix: name differences 2024-08-08 10:01:00 +00:00			`mappings = {`
			`"temperature": float,`
			`"top_p": int,`
			`"max_tokens": int,`
			`"frequency_penalty": int,`
			`"seed": lambda x: x,`
			`"stop": lambda x: [bytes(s, "utf-8").decode("unicode_escape") for s in x],`
			`}`
			`return apply_model_params_to_body(params, form_data, mappings)`
refac: re-use utils.misc 2024-08-06 10:31:45 +00:00

			`def apply_model_params_to_body_ollama(params: dict, form_data: dict) -> dict:`
			`opts = [`
fix: name differences 2024-08-08 10:01:00 +00:00			`"temperature",`
			`"top_p",`
			`"seed",`
refac: re-use utils.misc 2024-08-06 10:31:45 +00:00			`"mirostat",`
			`"mirostat_eta",`
			`"mirostat_tau",`
			`"num_ctx",`
			`"num_batch",`
			`"num_keep",`
			`"repeat_last_n",`
			`"tfs_z",`
			`"top_k",`
			`"min_p",`
			`"use_mmap",`
			`"use_mlock",`
			`"num_thread",`
refac 2024-08-13 10:21:17 +00:00			`"num_gpu",`
refac: re-use utils.misc 2024-08-06 10:31:45 +00:00			`]`
			`mappings = {i: lambda x: x for i in opts}`
fix: repeat_penalty 2024-08-08 09:52:09 +00:00			`form_data = apply_model_params_to_body(params, form_data, mappings)`

fix: name differences 2024-08-08 10:01:00 +00:00			`name_differences = {`
			`"max_tokens": "num_predict",`
			`"frequency_penalty": "repeat_penalty",`
			`}`

			`for key, value in name_differences.items():`
			`if (param := params.get(key, None)) is not None:`
			`form_data[value] = param`

fix: repeat_penalty 2024-08-08 09:52:09 +00:00			`return form_data`
refac: re-use utils.misc 2024-08-06 10:31:45 +00:00

feat: basic RBAC support 2023-11-19 05:41:43 +00:00			`def get_gravatar_url(email):`
			`# Trim leading and trailing whitespace from`
			`# an email address and force all characters`
			`# to lower case`
			`address = str(email).strip().lower()`

			`# Create a SHA256 hash of the final string`
			`hash_object = hashlib.sha256(address.encode())`
			`hash_hex = hash_object.hexdigest()`

			`# Grab the actual image URL`
feat: gravatar default image updated 2023-11-19 08:46:27 +00:00			`return f"https://www.gravatar.com/avatar/{hash_hex}?d=mp"`
feat: gguf upload 2023-12-23 23:38:52 +00:00

			`def calculate_sha256(file):`
			`sha256 = hashlib.sha256()`
			`# Read the file in chunks to efficiently handle large files`
			`for chunk in iter(lambda: file.read(8192), b""):`
			`sha256.update(chunk)`
			`return sha256.hexdigest()`
feat/fix: email format validation 2024-01-03 00:22:48 +00:00

feat: web rag support 2024-01-27 06:17:28 +00:00			`def calculate_sha256_string(string):`
			`# Create a new SHA-256 hash object`
			`sha256_hash = hashlib.sha256()`
			`# Update the hash object with the bytes of the input string`
			`sha256_hash.update(string.encode("utf-8"))`
			`# Get the hexadecimal representation of the hash`
			`hashed_string = sha256_hash.hexdigest()`
			`return hashed_string`


feat/fix: email format validation 2024-01-03 00:22:48 +00:00			`def validate_email_format(email: str) -> bool:`
feat: support webui_auth false #929 2024-05-08 15:40:18 +00:00			`if email.endswith("@localhost"):`
			`return True`

			`return bool(re.match(r"[^@]+@[^@]+\.[^@]+", email))`
feat: rag folder scan support 2024-02-18 05:06:08 +00:00

			`def sanitize_filename(file_name):`
			`# Convert to lowercase`
			`lower_case_file_name = file_name.lower()`

			`# Remove special characters using regular expression`
			`sanitized_file_name = re.sub(r"[^\w\s]", "", lower_case_file_name)`

			`# Replace spaces with dashes`
			`final_file_name = re.sub(r"\s+", "-", sanitized_file_name)`

			`return final_file_name`


			`def extract_folders_after_data_docs(path):`
			`# Convert the path to a Path object if it's not already`
			`path = Path(path)`

			`# Extract parts of the path`
			`parts = path.parts`

			`# Find the index of '/data/docs' in the path`
			`try:`
			`index_data_docs = parts.index("data") + 1`
			`index_docs = parts.index("docs", index_data_docs) + 1`
			`except ValueError:`
			`return []`

			`# Exclude the filename and accumulate folder names`
			`tags = []`

			`folders = parts[index_docs:-1]`
refac: rename whole_message_template, silence lsp 2024-07-31 20:58:40 +00:00			`for idx, _ in enumerate(folders):`
feat: rag folder scan support 2024-02-18 05:06:08 +00:00			`tags.append("/".join(folders[: idx + 1]))`

			`return tags`
feat: jwt utils 2024-02-20 04:44:00 +00:00

			`def parse_duration(duration: str) -> Optional[timedelta]:`
			`if duration == "-1" or duration == "0":`
			`return None`

			`# Regular expression to find number and unit pairs`
			`pattern = r"(-?\d+(\.\d+)?)(ms\|s\|m\|h\|d\|w)"`
			`matches = re.findall(pattern, duration)`

			`if not matches:`
			`raise ValueError("Invalid duration string")`

			`total_duration = timedelta()`

			`for number, _, unit in matches:`
			`number = float(number)`
			`if unit == "ms":`
			`total_duration += timedelta(milliseconds=number)`
			`elif unit == "s":`
			`total_duration += timedelta(seconds=number)`
			`elif unit == "m":`
			`total_duration += timedelta(minutes=number)`
			`elif unit == "h":`
			`total_duration += timedelta(hours=number)`
			`elif unit == "d":`
			`total_duration += timedelta(days=number)`
			`elif unit == "w":`
			`total_duration += timedelta(weeks=number)`

			`return total_duration`
refac: better migration script 2024-05-25 02:26:27 +00:00

			`def parse_ollama_modelfile(model_text):`
			`parameters_meta = {`
			`"mirostat": int,`
			`"mirostat_eta": float,`
			`"mirostat_tau": float,`
			`"num_ctx": int,`
			`"repeat_last_n": int,`
			`"repeat_penalty": float,`
			`"temperature": float,`
			`"seed": int,`
			`"tfs_z": float,`
			`"num_predict": int,`
			`"top_k": int,`
			`"top_p": float,`
refac: modelfiles migration 2024-06-03 19:48:17 +00:00			`"num_keep": int,`
			`"typical_p": float,`
			`"presence_penalty": float,`
			`"frequency_penalty": float,`
			`"penalize_newline": bool,`
			`"numa": bool,`
			`"num_batch": int,`
			`"num_gpu": int,`
			`"main_gpu": int,`
			`"low_vram": bool,`
			`"f16_kv": bool,`
			`"vocab_only": bool,`
			`"use_mmap": bool,`
			`"use_mlock": bool,`
			`"num_thread": int,`
refac: better migration script 2024-05-25 02:26:27 +00:00			`}`

			`data = {"base_model_id": None, "params": {}}`

			`# Parse base model`
			`base_model_match = re.search(`
			`r"^FROM\s+(\w+)", model_text, re.MULTILINE \| re.IGNORECASE`
			`)`
			`if base_model_match:`
			`data["base_model_id"] = base_model_match.group(1)`

			`# Parse template`
			`template_match = re.search(`
			`r'TEMPLATE\s+"""(.+?)"""', model_text, re.DOTALL \| re.IGNORECASE`
			`)`
			`if template_match:`
			`data["params"] = {"template": template_match.group(1).strip()}`

			`# Parse stops`
			`stops = re.findall(r'PARAMETER stop "(.*?)"', model_text, re.IGNORECASE)`
			`if stops:`
			`data["params"]["stop"] = stops`

			`# Parse other parameters from the provided list`
			`for param, param_type in parameters_meta.items():`
			`param_match = re.search(rf"PARAMETER {param} (.+)", model_text, re.IGNORECASE)`
			`if param_match:`
			`value = param_match.group(1)`
refac: modelfiles migration 2024-06-03 19:48:17 +00:00
			`try:`
refac: rename whole_message_template, silence lsp 2024-07-31 20:58:40 +00:00			`if param_type is int:`
refac: modelfiles migration 2024-06-03 19:48:17 +00:00			`value = int(value)`
refac: rename whole_message_template, silence lsp 2024-07-31 20:58:40 +00:00			`elif param_type is float:`
refac: modelfiles migration 2024-06-03 19:48:17 +00:00			`value = float(value)`
refac: rename whole_message_template, silence lsp 2024-07-31 20:58:40 +00:00			`elif param_type is bool:`
refac: modelfiles migration 2024-06-03 19:48:17 +00:00			`value = value.lower() == "true"`
			`except Exception as e:`
			`print(e)`
			`continue`

refac: better migration script 2024-05-25 02:26:27 +00:00			`data["params"][param] = value`

			`# Parse adapter`
			`adapter_match = re.search(r"ADAPTER (.+)", model_text, re.IGNORECASE)`
			`if adapter_match:`
			`data["params"]["adapter"] = adapter_match.group(1)`

			`# Parse system description`
			`system_desc_match = re.search(`
			`r'SYSTEM\s+"""(.+?)"""', model_text, re.DOTALL \| re.IGNORECASE`
			`)`
refac: migration 2024-06-08 20:45:33 +00:00			`system_desc_match_single = re.search(`
			`r"SYSTEM\s+([^\n]+)", model_text, re.IGNORECASE`
			`)`

refac: better migration script 2024-05-25 02:26:27 +00:00			`if system_desc_match:`
			`data["params"]["system"] = system_desc_match.group(1).strip()`
refac: migration 2024-06-08 20:45:33 +00:00			`elif system_desc_match_single:`
			`data["params"]["system"] = system_desc_match_single.group(1).strip()`
refac: better migration script 2024-05-25 02:26:27 +00:00
			`# Parse messages`
			`messages = []`
			`message_matches = re.findall(r"MESSAGE (\w+) (.+)", model_text, re.IGNORECASE)`
			`for role, content in message_matches:`
			`messages.append({"role": role, "content": content})`

			`if messages:`
			`data["params"]["messages"] = messages`

			`return data`