DeepSeek本地部署入门教程：零基础10分钟跑起来

AI实用指南编辑团队

为什么要在本地部署 DeepSeek？

红烁AI 培训，红烁 AI 中转站为您整理：DeepSeek 凭借媲美 GPT-4 的推理能力和完全开源的策略，迅速成为国内外开发者最关注的大模型之一。但很多人不知道的是，你完全不需要依赖官方 API 或云服务——只要一台普通的消费级电脑，就能把 DeepSeek 跑在本地。

本地部署的核心优势有三点：

数据隐私：所有对话数据留在本机，不经过任何第三方服务器，适合处理敏感信息。
零使用成本：模型下载后永久免费，没有 Token 计费，随用随开。
离线可用：断网环境同样可以正常推理，不受 API 限流影响。

本篇 DeepSeek 本地部署入门教程将以目前最主流的 Ollama 方案为主线，兼顾 Windows、macOS 和 Linux 三大平台，带你从零完成部署。

硬件配置要求

在开始之前，先确认你的机器是否满足基本要求。DeepSeek 提供了多个参数规模的版本，可以根据硬件灵活选择。

方法一：使用 Ollama 一键部署（推荐）

Ollama 是目前最简单的本地大模型运行工具，支持一条命令完成模型下载和启动，是 DeepSeek 本地部署入门教程中最推荐的方式。

第一步：安装 Ollama

访问 ollama.com 官网，根据你的操作系统下载对应安装包：

macOS：下载 .dmg 文件，拖入应用程序文件夹即可。
Windows：下载 .exe 安装程序，一路下一步完成安装。
Linux：在终端执行以下命令一键安装：

curl -fsSL https://ollama.com/install.sh | sh

安装完成后，在终端输入 ollama --version，看到版本号输出即表示安装成功。

第二步：拉取 DeepSeek 模型

打开终端，执行以下命令下载并启动 DeepSeek-R1 7B 模型：

ollama run deepseek-r1:7b

Ollama 会自动从官方仓库下载模型文件（约 4.7GB），下载完成后直接进入交互对话界面。如果你想下载其他规格，只需替换标签：

ollama run deepseek-r1:1.5b — 轻量版，适合低配机器
ollama run deepseek-r1:14b — 进阶版，效果更强
ollama run deepseek-r1:70b — 旗舰版，需要高端硬件

第三步：验证运行效果

模型加载完成后，终端会出现 >>> 提示符，直接输入问题即可对话。例如输入”用 Python 写一个快速排序”，几秒内就能看到完整的代码输出，说明本地部署已成功。

方法二：搭配 Open WebUI 获得可视化界面

纯命令行交互对很多用户不够友好。通过 Open WebUI，你可以获得一个类似 ChatGPT 的网页界面，支持多轮对话、历史记录和模型切换。

使用 Docker 一键启动 Open WebUI

确保本机已安装 Docker，然后执行：

docker run -d -p 3000:8080 \
  --add-host=host.docker.internal:host-gateway \
  -v open-webui:/app/backend/data \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:main

启动后打开浏览器访问 http://localhost:3000，注册一个本地账号，在模型选择下拉框中选择已下载的 DeepSeek 模型，即可开始使用图形化界面进行对话。

进阶：通过 API 集成到自己的应用

Ollama 在本地默认开放 http://localhost:11434 的 REST API，接口格式与 OpenAI 兼容，可以直接替换 API 地址接入现有项目。

curl http://localhost:11434/api/chat -d '{
  "model": "deepseek-r1:7b",
  "messages": [
    { "role": "user", "content": "解释一下什么是向量数据库" }
  ]
}'

这意味着你可以用 Python 的 openai 库、LangChain 或任何支持 OpenAI 格式的框架，直接调用本地 DeepSeek，构建私有化的 AI 应用。

常见问题 FAQ

Q1：下载速度太慢怎么办？

Ollama 默认从境外服务器拉取模型，国内网络可能较慢。可以考虑以下方案：使用镜像站手动下载 GGUF 格式模型文件后通过 ollama create 导入，或者在网络条件好的时段挂后台下载，Ollama 支持断点续传。

Q2：运行时提示内存不足怎么解决？

优先切换到更小的模型版本，例如从 7B 降到 1.5B。也可以在 Ollama 启动参数中设置 OLLAMA_NUM_GPU=0 强制使用 CPU 推理，降低显存占用，但速度会相应变慢。

Q3：Windows 上 GPU 没有被调用？

确认已安装最新版 NVIDIA 驱动（版本 ≥ 525）以及 CUDA Toolkit。安装完成后重启 Ollama 服务，可通过 ollama ps 命令查看当前模型是否在 GPU 上运行。

Q4：如何更新已下载的模型？

执行 ollama pull deepseek-r1:7b 即可拉取最新版本，Ollama 会自动对比差异，只下载变更部分，不需要重新下载完整模型。

Q5：本地部署的 DeepSeek 和官网版本效果一样吗？

本地运行的是量化压缩版本（通常为 Q4 或 Q8 精度），在推理效果上与全精度版本有轻微差距，但对于日常编程辅助、文本生成等任务，实际体验差异几乎可以忽略不计。

总结

通过本篇 DeepSeek 本地部署入门教程，你已经掌握了从环境安装、模型下载到 WebUI 搭建的完整流程。整个过程最快只需 10 分钟，核心工具只有 Ollama 一个，门槛远比想象中低。

建议入门用户从 7B 模型 + Ollama 命令行 开始，熟悉基本操作后再叠加 Open WebUI 或 API 集成。随着硬件升级，随时可以切换到更大参数的版本获得更强的推理能力。本地 AI 的时代已经到来，现在正是上手的最好时机。

想了解更多AI工具和技巧？欢迎访问红烁AI 培训，红烁 AI 中转站，获取最新AI资讯和实用教程。

DeepSeek本地部署入门教程：零基础10分钟跑起来

为什么要在本地部署 DeepSeek？

硬件配置要求

推荐配置对照表

方法一：使用 Ollama 一键部署（推荐）

第一步：安装 Ollama

第二步：拉取 DeepSeek 模型

第三步：验证运行效果

方法二：搭配 Open WebUI 获得可视化界面

使用 Docker 一键启动 Open WebUI

进阶：通过 API 集成到自己的应用

常见问题 FAQ

Q1：下载速度太慢怎么办？

Q2：运行时提示内存不足怎么解决？

Q3：Windows 上 GPU 没有被调用？

Q4：如何更新已下载的模型？

Q5：本地部署的 DeepSeek 和官网版本效果一样吗？

总结

🚀 想把AI真正用起来？

为什么要在本地部署 DeepSeek？

硬件配置要求

推荐配置对照表

方法一：使用 Ollama 一键部署（推荐）

第一步：安装 Ollama

第二步：拉取 DeepSeek 模型

第三步：验证运行效果

方法二：搭配 Open WebUI 获得可视化界面

使用 Docker 一键启动 Open WebUI

进阶：通过 API 集成到自己的应用

常见问题 FAQ

Q1：下载速度太慢怎么办？

Q2：运行时提示内存不足怎么解决？

Q3：Windows 上 GPU 没有被调用？

Q4：如何更新已下载的模型？

Q5：本地部署的 DeepSeek 和官网版本效果一样吗？

总结

🚀 想把AI真正用起来？

📖 相关文章