APAW/scripts/opencompass-setup.sh

#!/usr/bin/env bash
set -euo pipefail

# OpenCompass dataset setup script
# Downloads required datasets on first run

DATA_DIR="/data"
ZIP_URL="https://github.com/InternLM/opencompass/releases/download/0.2.2/OpenCompassData-core-20240207.zip"
ZIP_FILE="${DATA_DIR}/OpenCompassData-core-20240207.zip"
MARKER="${DATA_DIR}/.datasets_ready"

if [[ -f "$MARKER" ]]; then
    echo "Datasets already present (${MARKER} exists). Skipping download."
    exit 0
fi

echo "Downloading OpenCompass core datasets ..."
mkdir -p "$DATA_DIR"

if command -v wget >/dev/null 2>&1; then
    wget -q --show-progress -O "$ZIP_FILE" "$ZIP_URL" || {
        echo "Error: Failed to download datasets from ${ZIP_URL}" >&2
        exit 1
    }
else
    echo "Error: wget not found. Cannot download datasets." >&2
    exit 1
fi

echo "Extracting datasets ..."
unzip -q "$ZIP_FILE" -d "$DATA_DIR" || {
    echo "Error: Failed to extract ${ZIP_FILE}" >&2
    exit 1
}

touch "$MARKER"
echo "Datasets ready in ${DATA_DIR}."