DeepSeek本地部署新手入门指南：零基础也能跑起来的完整教程

AI实用指南编辑团队

为什么要在本地部署 DeepSeek？

红烁AI 培训，红烁 AI 中转站为您整理：DeepSeek 是由深度求索公司推出的开源大语言模型系列，凭借媲美 GPT-4 的推理能力和完全开放的权重，迅速成为全球开发者和 AI 爱好者的热门选择。与直接调用在线 API 相比，本地部署 DeepSeek 有三个核心优势：

数据隐私：所有对话数据留在本机，不经过任何第三方服务器，适合处理敏感信息。
零使用成本：一次部署，无限调用，不产生 Token 费用。
离线可用：断网环境下依然可以正常使用，适合内网办公场景。

本篇 DeepSeek 本地部署新手入门指南将以目前最主流的 Ollama 方案为主线，带你从零完成整个部署流程。

硬件要求：你的电脑能跑哪个版本？

本地部署大模型对硬件有一定要求，核心瓶颈是显存（VRAM）或内存（RAM）。DeepSeek 提供了从 1.5B 到 671B 不同参数规模的模型，可以根据自己的设备灵活选择。

DeepSeek 本地部署核心步骤（Ollama 方案）

Ollama 是目前最简单的本地大模型管理工具，支持 macOS、Linux 和 Windows，一条命令即可拉取并运行模型。

第一步：安装 Ollama

访问 ollama.com 官网，根据你的操作系统下载对应安装包。

macOS / Linux：在终端执行 curl -fsSL https://ollama.com/install.sh | sh，等待安装完成。
Windows：下载 .exe 安装包，双击安装，安装后 Ollama 会在后台以服务形式运行。

安装完成后，在终端输入 ollama --version，看到版本号即表示安装成功。

第二步：拉取 DeepSeek 模型

打开终端，执行以下命令拉取模型。以 7B 版本为例：

标准版：ollama pull deepseek-r1:7b
更小的入门版：ollama pull deepseek-r1:1.5b
更强的进阶版：ollama pull deepseek-r1:14b

模型文件会下载到本地（7B 约 4.7GB），下载速度取决于你的网络环境。国内用户如遇下载缓慢，可配置镜像源或使用代理。

第三步：启动并对话

下载完成后，直接在终端运行：

ollama run deepseek-r1:7b

稍等片刻，出现 >>> 提示符后，即可直接输入问题与模型对话。至此，DeepSeek 本地部署的核心流程已经完成。

第四步（可选）：安装可视化界面 Open WebUI

命令行交互对普通用户不够友好。推荐安装 Open WebUI，获得类似 ChatGPT 的网页聊天界面。

确保已安装 Docker，然后执行：
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui ghcr.io/open-webui/open-webui:main
启动后访问 http://localhost:3000，注册账号，在模型选择处选择已下载的 DeepSeek 模型即可。

实际应用场景

完成本地部署后，DeepSeek 可以胜任多种实际工作场景：

代码辅助：在本地 IDE 中通过 Continue 插件接入，实现代码补全、Bug 修复、代码解释。
文档处理：结合 RAG（检索增强生成）框架，让模型读取本地 PDF、Word 文档并回答问题。
私人知识库：搭建企业内部问答系统，所有数据不出内网。
写作与翻译：日常文案撰写、多语言翻译，响应速度比在线服务更稳定。

常见问题 FAQ

Q1：下载模型时速度很慢怎么办？

国内访问 Ollama 官方源速度不稳定。可以设置环境变量 OLLAMA_HOST 指向国内镜像，或通过代理工具加速下载。部分云服务商（如阿里云、腾讯云）也提供了 Ollama 镜像加速服务。

Q2：运行时提示内存不足怎么处理？

优先选择更小的量化版本，例如将 deepseek-r1:7b 换成 deepseek-r1:7b-q4_0（更激进的量化，内存占用更低）。同时关闭其他占用内存的程序，确保系统有足够的可用内存。

Q3：Windows 上 GPU 没有被调用，全靠 CPU 运行很慢？

确认已安装最新版 NVIDIA 驱动，并且 Ollama 版本在 0.1.16 以上。可在终端运行 ollama run deepseek-r1:7b 后，通过任务管理器查看 GPU 使用率来确认是否已启用 GPU 加速。AMD 显卡用户需确认 ROCm 驱动已正确安装。

Q4：如何通过 API 调用本地 DeepSeek？

Ollama 默认在 http://localhost:11434 提供兼容 OpenAI 格式的 REST API。你可以直接用 curl 或任何支持 OpenAI SDK 的代码库调用，只需将 base_url 指向本地地址，api_key 填写任意字符串即可。

Q5：DeepSeek 本地版和在线版效果一样吗？

取决于你运行的模型规模。7B 量化版的效果与在线满血版（671B）有明显差距，适合日常轻量任务。如果追求接近在线版的效果，需要运行 32B 或更大的版本，对硬件要求也相应提高。

总结

DeepSeek 本地部署的门槛远比想象中低。借助 Ollama，整个流程只需三步：安装工具、拉取模型、启动运行。对于新手来说，从 7B 量化版入手是最稳妥的选择，在普通消费级硬件上就能获得可用的 AI 能力，同时完整保留数据隐私。

随着硬件成本持续下降和模型量化技术的进步，在本地运行高质量大模型正在变得越来越普及。现在入手 DeepSeek 本地部署，不仅是学习 AI 技术的好机会，也是为未来的个人 AI 工作流打下基础。

想了解更多AI工具和技巧？欢迎访问红烁AI 培训，红烁 AI 中转站，获取最新AI资讯和实用教程。

DeepSeek本地部署新手入门指南：零基础也能跑起来的完整教程

为什么要在本地部署 DeepSeek？

硬件要求：你的电脑能跑哪个版本？

推荐配置对照表

DeepSeek 本地部署核心步骤（Ollama 方案）

第一步：安装 Ollama

第二步：拉取 DeepSeek 模型

第三步：启动并对话

第四步（可选）：安装可视化界面 Open WebUI

实际应用场景

常见问题 FAQ

Q1：下载模型时速度很慢怎么办？

Q2：运行时提示内存不足怎么处理？

Q3：Windows 上 GPU 没有被调用，全靠 CPU 运行很慢？

Q4：如何通过 API 调用本地 DeepSeek？

Q5：DeepSeek 本地版和在线版效果一样吗？

总结

🚀 想把AI真正用起来？

为什么要在本地部署 DeepSeek？

硬件要求：你的电脑能跑哪个版本？

推荐配置对照表

DeepSeek 本地部署核心步骤（Ollama 方案）

第一步：安装 Ollama

第二步：拉取 DeepSeek 模型

第三步：启动并对话

第四步（可选）：安装可视化界面 Open WebUI

实际应用场景

常见问题 FAQ

Q1：下载模型时速度很慢怎么办？

Q2：运行时提示内存不足怎么处理？

Q3：Windows 上 GPU 没有被调用，全靠 CPU 运行很慢？

Q4：如何通过 API 调用本地 DeepSeek？

Q5：DeepSeek 本地版和在线版效果一样吗？

总结

🚀 想把AI真正用起来？

📖 相关文章