Provider 配置

自定义 OpenAI 兼容 Provider

只要遵循 Responses 形状,自架 Ollama / vLLM / 公司网关都能接。

兼容性原则

Kition 把所有 "OpenAI-compatible" 端点统一走 responses wire。只要你的服务能正确响应 POST {baseURL}/responses(或老接口 /chat/completions — Kition 会自动 fallback),就能挂上。

常见的兼容服务:Ollama、LM Studio、LiteLLM、vLLM、OpenRouter、Together、Groq、Fireworks、DeepSeek、Moonshot、Zhipu、Qwen/Dashscope、Doubao、Baichuan、Yi,以及大部分企业自建网关。

通用模板

所有自定义 Provider 都填这五个字段。baseURL 必须包含 /v1 路径(少数服务例外,见各节)。

{
  "name": "internal-llm",
  "baseURL": "https://llm.internal/v1",
  "apiKey": "...",
  "wire": "responses",
  "defaultModel": "internal-foundation-q1"
}

本地 / 自架

  • Ollamahttp://localhost:11434/v1,apiKey 填任意非空字符串(如 ollama
  • LM Studiohttp://localhost:1234/v1,apiKey 同上
  • vLLMhttp://your-host:8000/v1,按 --api-key 启动参数填
  • LiteLLM proxy — 公司侧统一网关,apiKey 走团队配置
  • 注意:本地服务默认 HTTP,Kition 不强制 HTTPS — 但跨网段请用反代加 TLS

路由器与聚合器

  • OpenRouterhttps://openrouter.ai/api/v1,模型字段写 anthropic/claude-opus-4-7 这种 vendor/model 形式
  • Togetherhttps://api.together.xyz/v1,开源模型为主
  • Groqhttps://api.groq.com/openai/v1,超低延迟 LPU 推理
  • Fireworkshttps://api.fireworks.ai/inference/v1,模型字段写 accounts/fireworks/models/...

自定义 headers

部分企业网关需要额外 header(如 Azure 的 api-key、Bedrock 网关的 x-aws-region)。Provider 配置里可以加 headers 对象,Kition 会原样转发。

{
  "name": "azure-gateway",
  "baseURL": "https://internal.openai.azure.com/openai/v1",
  "apiKey": "stored-in-keychain",
  "wire": "responses",
  "defaultModel": "gpt-5.1",
  "headers": {
    "api-key": "from-azure-portal",
    "x-tenant-id": "kition-prod"
  }
}

验证连通性

配置好之后点 Provider 卡片右上角 Test — Kition 会发一条 1-token 的请求并打印往返时延。如果失败,下面的 cURL 模板可以在终端复刻请求排查。

curl $BASE_URL/responses \
  -H "Authorization: Bearer $KEY" \
  -H "Content-Type: application/json" \
  -d '{"model":"'"$MODEL"'","input":"ping","max_output_tokens":4}'

常见错误

  • 404 Not Found — baseURL 漏了 /v1 或服务监听的不是这个路径
  • 401 / 403 — apiKey 与服务端配置不一致,本地服务记得 restart
  • Connection refused — 服务没起或被防火墙拦
  • SSL handshake failed — 自签证书,本机需要导入 CA 或用 HTTP
  • 响应有内容但 streaming 不动 — 端点没开 SSE,检查反代是否 buffer 了响应
  • 模型字段服务端不认 — 用 /v1/models 端点拉真实列表

相关文档

下载 Kition

本地优先的 AI 工作空间。Markdown 文档、结构化数据表、AI Agent,全部跑在你自己的电脑上。