Ollama、vLLM、OpenAI、Responses、Anthropic 接口协议

半兽人 发表于: 2026-04-07   最后更新时间: 2026-05-20 12:08:05  
{{totalSubscript}} 订阅, 195 游览

一、核心接口差异(只看路径 + 用途)

能力 Ollama 原生 OpenAI Chat OpenAI Responses Anthropic
聊天 /api/chat /v1/chat/completions /v1/responses /v1/messages
文本生成 /api/generate /v1/completions /v1/responses
Embedding /api/embeddings /v1/embeddings /v1/embeddings
模型列表 /api/tags /v1/models /v1/models /v1/models
拉模型 /api/pull
删模型 /api/delete
Agent/Tools 有限支持 原生支持 原生支持
多模态 有限 有限 原生支持 原生支持
健康检查 / 无标准 无标准 无标准

二、请求结构差异(本质区别)

维度 Ollama OpenAI Chat OpenAI Responses Anthropic
对话字段 messages messages input messages
system写法 放messages里 放messages里 instructions 独立 system 字段
单轮生成 prompt prompt input 不支持
最大token num_predict max_tokens max_output_tokens max_tokens
流式 stream: true stream: true stream: true stream: true
内容结构 string string typed content typed content
tools 基础 后加支持 原生设计 原生设计
reasoning 有限

三、Header差异(识别关键)

协议 必须Header
Ollama
OpenAI Chat Authorization: Bearer xxx
OpenAI Responses Authorization: Bearer xxx
Anthropic x-api-key + anthropic-version

四、返回结构差异(关键点)

协议 返回字段
Ollama message.content
OpenAI Chat choices[0].message.content
OpenAI Responses output[0].content[0].text
Anthropic content[0].text

五、路径识别(最直接结论)

/api/*                    → Ollama 原生

/v1/chat/completions     → OpenAI ChatCompletions

/v1/responses            → OpenAI Responses API

/v1/messages             → Anthropic Messages

/api/tags                → Ollama 独有(模型管理)

/v1/models               → OpenAI / Responses / Anthropic

六、协议设计核心区别(真正本质)

协议 设计目标
Ollama 本地模型运行与管理
OpenAI Chat 通用聊天标准
OpenAI Responses Agent / Tools / Reasoning / 多模态统一协议
Anthropic Claude 专用 Messages 协议

七、最关键区别(压缩版)

结论
管理模型 只有 Ollama 有 /api/tags /api/pull
行业兼容性 OpenAI Chat 最普及
新一代能力 Responses 最强
system机制 Anthropic 独立字段
Agent能力 Responses / Anthropic 更强
单轮prompt Ollama / OpenAI 支持
多模态结构 Responses / Anthropic typed block
协议识别 直接看路径即可

八、典型结构示例

Ollama

POST /api/chat

{
  "model": "qwen3",
  "messages": [
    {
      "role": "user",
      "content": "你好"
    }
  ]
}

OpenAI Chat

POST /v1/chat/completions

{
  "model": "gpt-4.1",
  "messages": [
    {
      "role": "user",
      "content": "你好"
    }
  ]
}

OpenAI Responses

POST /v1/responses

{
  "model": "gpt-5",
  "input": [
    {
      "role": "user",
      "content": [
        {
          "type": "input_text",
          "text": "你好"
        }
      ]
    }
  ]
}

Anthropic

POST /v1/messages

{
  "model": "claude-sonnet-4",
  "system": "你是AI助手",
  "messages": [
    {
      "role": "user",
      "content": "你好"
    }
  ],
  "max_tokens": 1024
}

一句话总结

Ollama      = 本地模型运行与管理
OpenAI Chat = 行业最通用聊天协议
Responses   = OpenAI 新一代 Agent / Reasoning 协议
Anthropic   = Claude 专用 Messages 协议
更新于 2026-05-20
在线,2小时前登录

查看Ollama更多相关的文章或提一个关于Ollama的问题,也可以与我们一起分享文章