跳转至

OhMyCaptcha

本地模型 (SGLang)

shenhao-stu/ohmycaptcha

本地模型部署¶

OhMyCaptcha 支持使用 SGLang、vLLM 或任何 OpenAI 兼容推理服务在本地部署图像识别和分类模型。

本指南以 Qwen3.5-2B + SGLang 为例。

架构：本地模型 vs 云端模型¶

OhMyCaptcha 使用两种模型后端：

后端	角色	环境变量	默认值
本地模型	图像识别与分类（高吞吐，自托管）	`LOCAL_BASE_URL`, `LOCAL_API_KEY`, `LOCAL_MODEL`	`http://localhost:30000/v1`, `EMPTY`, `Qwen/Qwen3.5-2B`
云端模型	音频转录与复杂推理（强大远程 API）	`CLOUD_BASE_URL`, `CLOUD_API_KEY`, `CLOUD_MODEL`	外部端点, 你的密钥, `gpt-5.4`

前置要求¶

Python 3.10+
NVIDIA GPU + CUDA（推荐 8GB+ 显存用于 Qwen3.5-2B）

第一步：安装 SGLang¶

pip install "sglang[all]>=0.4.6.post1"

第二步：启动模型服务¶

从 ModelScope 下载（国内推荐）¶

export SGLANG_USE_MODELSCOPE=true
python -m sglang.launch_server \
  --model-path Qwen/Qwen3.5-2B \
  --host 0.0.0.0 \
  --port 30000

从 Hugging Face 下载¶

python -m sglang.launch_server \
  --model-path Qwen/Qwen3.5-2B \
  --host 0.0.0.0 \
  --port 30000

多 GPU 部署¶

python -m sglang.launch_server \
  --model-path Qwen/Qwen3.5-2B \
  --host 0.0.0.0 \
  --port 30000 \
  --tensor-parallel-size 2

启动后，服务在 http://localhost:30000/v1 提供 OpenAI 兼容 API。

第三步：验证模型服务¶

curl http://localhost:30000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "Qwen/Qwen3.5-2B",
    "messages": [{"role": "user", "content": "Hello"}],
    "max_tokens": 32
  }'

第四步：配置 OhMyCaptcha¶

# 本地模型（SGLang 自托管）
export LOCAL_BASE_URL="http://localhost:30000/v1"
export LOCAL_API_KEY="EMPTY"
export LOCAL_MODEL="Qwen/Qwen3.5-2B"

# 云端模型（远程 API，用于音频转录等）
export CLOUD_BASE_URL="https://your-api-endpoint/v1"
export CLOUD_API_KEY="sk-your-key"
export CLOUD_MODEL="gpt-5.4"

# 其他配置
export CLIENT_KEY="your-client-key"
export BROWSER_HEADLESS=true

第五步：启动 OhMyCaptcha¶

python main.py

向后兼容¶

旧版环境变量（CAPTCHA_BASE_URL、CAPTCHA_API_KEY、CAPTCHA_MODEL、CAPTCHA_MULTIMODAL_MODEL）仍然支持。新的 LOCAL_* 和 CLOUD_* 变量优先生效。

推荐模型¶

模型	大小	用途	显存
`Qwen/Qwen3.5-2B`	2B	图像识别与分类	~5 GB
`Qwen/Qwen3.5-7B`	7B	更高精度分类	~15 GB
`Qwen/Qwen3.5-2B-FP8`	2B（量化）	低显存需求	~3 GB