DeepSeek R1与V3 API的model参数设置完全指南

AI实用指南编辑团队

背景：为什么model参数的设置如此关键

红烁AI 培训，红烁 AI 中转站为您整理：DeepSeek目前对外开放了两条主力模型线：以深度推理见长的 DeepSeek-R1 系列，以及定位通用对话与代码生成的 DeepSeek-V3 系列。两者共用同一套兼容 OpenAI 格式的 API 接口，这意味着切换模型时，你只需要修改请求体中的 model 字段——但如果填错，轻则返回 404 报错，重则静默地调用了错误模型，产生不符合预期的输出和额外费用。

因此，在动手写代码之前，先搞清楚两个模型的官方参数名称和适用边界，是每位开发者的必修课。

核心内容：R1与V3的model参数对照

官方参数名称一览

DeepSeek API 的 model 字段需要填写官方指定的模型标识符，大小写敏感，不能随意简写。以下是当前（2025年）主要可用的参数值：

deepseek-reasoner — 对应 DeepSeek-R1，官方推理模型，支持思维链（Chain-of-Thought）输出
deepseek-chat — 对应 DeepSeek-V3，官方通用对话模型，适合日常问答、代码、写作任务

注意：早期文档中曾出现 deepseek-r1 或 deepseek-v3 的写法，但官方 API 目前以 deepseek-reasoner 和 deepseek-chat 为准。建议始终以 DeepSeek 官方文档为准，避免使用非官方渠道的参数名。

调用示例对比

以下示例使用 Python + openai SDK（DeepSeek API 完全兼容 OpenAI 接口格式）：

调用 DeepSeek-V3（deepseek-chat）：

from openai import OpenAI

client = OpenAI(
    api_key="your_deepseek_api_key",
    base_url="https://api.deepseek.com"
)

response = client.chat.completions.create(
    model="deepseek-chat",   # V3 模型参数
    messages=[
        {"role": "user", "content": "用Python写一个快速排序算法"}
    ],
    temperature=1.0,
    max_tokens=2048
)
print(response.choices[0].message.content)

调用 DeepSeek-R1（deepseek-reasoner）：

from openai import OpenAI

client = OpenAI(
    api_key="your_deepseek_api_key",
    base_url="https://api.deepseek.com"
)

response = client.chat.completions.create(
    model="deepseek-reasoner",   # R1 模型参数
    messages=[
        {"role": "user", "content": "证明根号2是无理数"}
    ],
    max_tokens=8192   # R1 推理过程较长，建议设置更大的 token 上限
)

# R1 特有：读取思维链内容
reasoning = response.choices[0].message.reasoning_content
answer = response.choices[0].message.content
print("推理过程：", reasoning)
print("最终答案：", answer)

两段代码的核心差异只有一行：model 参数的值。但 R1 的响应体多了一个 reasoning_content 字段，用于返回模型的思维链过程，这是 V3 所没有的。

关键参数差异汇总

model 值：V3 用 deepseek-chat，R1 用 deepseek-reasoner
temperature 支持：V3 支持自定义 temperature（推荐 0~1.3）；R1 官方建议不设置或固定为 1，因为推理过程由模型自主控制
响应字段：R1 返回额外的 reasoning_content，V3 只有标准的 content
上下文窗口：两者均支持最大 64K tokens 上下文，但 R1 的推理 token 会额外计费
System Prompt：R1 对 system 消息的遵循度弱于 V3，复杂指令建议放入 user 消息
计费方式：R1 的 reasoning token（思维链部分）单独计费，成本高于 V3

实际应用：如何选择R1还是V3

优先选择 DeepSeek-V3（deepseek-chat）的场景

日常对话、客服机器人、内容生成
代码补全、代码解释、文档生成
需要快速响应、低延迟的实时应用
对成本敏感、调用量大的批处理任务
需要严格遵循 System Prompt 的角色扮演或格式化输出

优先选择 DeepSeek-R1（deepseek-reasoner）的场景

数学证明、竞赛题、逻辑推理题
复杂代码调试（需要逐步分析错误原因）
多步骤规划任务（如项目拆解、策略制定）
需要展示推理过程、提升答案可信度的场景
科研辅助、论文分析等需要严谨推导的工作

混合调用策略

在实际产品中，一种常见的最优策略是：先用 V3 做意图分类，判断用户问题是否属于”复杂推理类”，若是则转发给 R1 处理，否则直接由 V3 回答。这样既控制了成本，又保证了复杂问题的回答质量。

常见问题 FAQ

Q1：填写 model 参数时报错 “Invalid model”，怎么办？

首先检查拼写是否正确，deepseek-chat 和 deepseek-reasoner 均为全小写加连字符格式。其次确认 base_url 已设置为 https://api.deepseek.com，而非 OpenAI 的默认地址。如果使用第三方中转 API，需确认该服务商是否支持对应的模型标识符。

Q2：R1 的响应速度比 V3 慢很多，正常吗？

完全正常。R1 在生成最终答案之前会先完成内部推理（reasoning），这个过程可能消耗数百到数千个 token，因此首 token 延迟（TTFT）和总响应时间都明显长于 V3。如果你的应用对延迟敏感，V3 是更合适的选择。

Q3：能不能在调用 R1 时关闭思维链，只要最终答案？

目前 DeepSeek API 不支持关闭 R1 的推理过程，reasoning token 会照常生成和计费。如果你只需要最终答案，直接读取 content 字段忽略 reasoning_content 即可，但费用仍会包含推理部分。若成本是主要顾虑，建议直接使用 V3。

Q4：V3 和 R1 的 API Key 是同一个吗？

是的。DeepSeek 平台使用统一的 API Key，通过 model 参数区分调用哪个模型，无需为不同模型申请不同的密钥。

Q5：第三方平台（如 OpenRouter、硅基流动）的 model 参数写法一样吗？

不一定。第三方平台通常会在模型名前加上前缀，例如 OpenRouter 上的写法可能是 deepseek/deepseek-chat 或 deepseek/deepseek-r1。具体参数名以各平台文档为准，不能直接套用 DeepSeek 官方的参数值。

总结

DeepSeek R1 和 V3 的 API 调用方式高度相似，核心区别就在 model 参数这一个字段：通用任务用 deepseek-chat，复杂推理用 deepseek-reasoner。在此基础上，R1 还需要注意 temperature 设置、reasoning_content 字段的读取，以及更高的 token 消耗。理解这些差异，能帮你在正确的场景选对模型，在保证效果的同时有效控制 API 调用成本。

想了解更多AI工具和技巧？欢迎访问红烁AI 培训，红烁 AI 中转站，获取最新AI资讯和实用教程。