一、核心接口差异（只看路径 + 用途）

能力	Ollama 原生	OpenAI Chat	OpenAI Responses	Anthropic
聊天	`/api/chat`	`/v1/chat/completions`	`/v1/responses`	`/v1/messages`
文本生成	`/api/generate`	`/v1/completions`	`/v1/responses`	无
Embedding	`/api/embeddings`	`/v1/embeddings`	`/v1/embeddings`	无
模型列表	`/api/tags`	`/v1/models`	`/v1/models`	`/v1/models`
拉模型	`/api/pull`	无	无	无
删模型	`/api/delete`	无	无	无
Agent/Tools	弱	有限支持	原生支持	原生支持
多模态	有限	有限	原生支持	原生支持
健康检查	`/`	无标准	无标准	无标准

二、请求结构差异（本质区别）

维度	Ollama	OpenAI Chat	OpenAI Responses	Anthropic
对话字段	`messages`	`messages`	`input`	`messages`
system写法	放messages里	放messages里	`instructions`	独立 `system` 字段
单轮生成	`prompt`	`prompt`	`input`	不支持
最大token	`num_predict`	`max_tokens`	`max_output_tokens`	`max_tokens`
流式	`stream: true`	`stream: true`	`stream: true`	`stream: true`
内容结构	string	string	typed content	typed content
tools	基础	后加支持	原生设计	原生设计
reasoning	无	有限	强	强

三、Header差异（识别关键）

协议	必须Header
Ollama	无
OpenAI Chat	`Authorization: Bearer xxx`
OpenAI Responses	`Authorization: Bearer xxx`
Anthropic	`x-api-key` + `anthropic-version`

四、返回结构差异（关键点）

协议	返回字段
Ollama	`message.content`
OpenAI Chat	`choices[0].message.content`
OpenAI Responses	`output[0].content[0].text`
Anthropic	`content[0].text`

五、路径识别（最直接结论）

/api/*                    → Ollama 原生

/v1/chat/completions     → OpenAI ChatCompletions

/v1/responses            → OpenAI Responses API

/v1/messages             → Anthropic Messages

/api/tags                → Ollama 独有（模型管理）

/v1/models               → OpenAI / Responses / Anthropic

六、协议设计核心区别（真正本质）

协议	设计目标
Ollama	本地模型运行与管理
OpenAI Chat	通用聊天标准
OpenAI Responses	Agent / Tools / Reasoning / 多模态统一协议
Anthropic	Claude 专用 Messages 协议

七、最关键区别（压缩版）

点	结论
管理模型	只有 Ollama 有 `/api/tags /api/pull`
行业兼容性	OpenAI Chat 最普及
新一代能力	Responses 最强
system机制	Anthropic 独立字段
Agent能力	Responses / Anthropic 更强
单轮prompt	Ollama / OpenAI 支持
多模态结构	Responses / Anthropic typed block
协议识别	直接看路径即可

八、典型结构示例

Ollama

POST /api/chat

{
  "model": "qwen3",
  "messages": [
    {
      "role": "user",
      "content": "你好"
    }
  ]
}

OpenAI Chat

POST /v1/chat/completions

{
  "model": "gpt-4.1",
  "messages": [
    {
      "role": "user",
      "content": "你好"
    }
  ]
}

OpenAI Responses

POST /v1/responses

{
  "model": "gpt-5",
  "input": [
    {
      "role": "user",
      "content": [
        {
          "type": "input_text",
          "text": "你好"
        }
      ]
    }
  ]
}

Anthropic

POST /v1/messages

{
  "model": "claude-sonnet-4",
  "system": "你是AI助手",
  "messages": [
    {
      "role": "user",
      "content": "你好"
    }
  ],
  "max_tokens": 1024
}

一句话总结

Ollama      = 本地模型运行与管理
OpenAI Chat = 行业最通用聊天协议
Responses   = OpenAI 新一代 Agent / Reasoning 协议
Anthropic   = Claude 专用 Messages 协议

Ollama、vLLM、OpenAI、Responses、Anthropic 接口协议

一、核心接口差异（只看路径 + 用途）

二、请求结构差异（本质区别）

三、Header差异（识别关键）

四、返回结构差异（关键点）

五、路径识别（最直接结论）

六、协议设计核心区别（真正本质）

七、最关键区别（压缩版）

八、典型结构示例

Ollama

OpenAI Chat

OpenAI Responses

Anthropic

一句话总结

昵称