Linux系统本地部署DeepSeek入门教程：从零开始完整指南

AI实用指南编辑团队

为什么要在Linux本地部署DeepSeek？

红烁AI 培训，红烁 AI 中转站为您整理：DeepSeek凭借媲美GPT-4的推理能力和完全开源的特性，迅速成为国内外开发者最关注的大语言模型之一。相比直接调用云端API，在Linux系统本地部署DeepSeek有几个核心优势：

数据隐私：所有对话数据留在本机，不经过任何第三方服务器，适合处理敏感业务数据。
零调用成本：本地运行无需按Token付费，高频使用场景下成本优势明显。
离线可用：断网环境同样可以正常使用，适合内网隔离的企业环境。
可定制化：可以对模型进行微调、集成到自有系统，灵活度远超API调用。

Linux系统因其稳定性和对GPU驱动的良好支持，是本地部署大模型的首选平台。下面我们从零开始，一步步完成整个部署流程。

部署前的环境准备

硬件要求

本地运行大模型对硬件有一定要求，建议在开始前确认你的机器满足以下配置：

内存（RAM）：最低8GB，推荐16GB以上。运行7B参数模型至少需要8GB，运行14B或更大模型建议32GB。
显卡（GPU）：非必须，但强烈推荐。NVIDIA显卡配合CUDA可将推理速度提升10倍以上。4GB显存可运行量化版7B模型，8GB显存体验更流畅。
存储空间：7B量化模型约4-5GB，14B模型约8-10GB，请预留足够磁盘空间。
CPU：无GPU时依赖CPU推理，建议8核以上，速度会较慢但可用。

系统环境确认

本教程适用于Ubuntu 20.04/22.04、Debian 11/12、CentOS 8+等主流Linux发行版。执行以下命令确认系统基本信息：

# 查看系统版本
cat /etc/os-release

# 查看内存情况
free -h

# 查看GPU信息（NVIDIA显卡）
nvidia-smi

如果你有NVIDIA显卡，还需要确保已安装对应版本的CUDA驱动。可以通过nvidia-smi命令查看当前驱动版本。

使用Ollama部署DeepSeek（推荐方式）

目前在Linux本地部署DeepSeek最简便的方式是使用Ollama。Ollama是一个专为本地运行大语言模型设计的工具，封装了模型下载、量化和推理服务，极大降低了部署门槛。

第一步：安装Ollama

打开终端，执行官方一键安装脚本：

curl -fsSL https://ollama.com/install.sh | sh

安装完成后，Ollama会自动注册为系统服务。验证安装是否成功：

ollama --version

如果输出版本号，说明安装成功。Ollama服务默认监听本地11434端口。

第二步：下载DeepSeek模型

Ollama支持直接拉取DeepSeek系列模型。根据你的硬件配置选择合适的版本：

# 7B参数量化版（推荐入门，约4.7GB）
ollama pull deepseek-r1:7b

# 14B参数版（效果更好，约8.1GB）
ollama pull deepseek-r1:14b

# 1.5B超轻量版（低配机器可用）
ollama pull deepseek-r1:1.5b

下载速度取决于网络环境，国内用户如遇下载缓慢，可以配置镜像源或使用代理。下载完成后模型文件默认存储在~/.ollama/models/目录下。

第三步：启动并测试模型

模型下载完成后，直接在终端与DeepSeek对话：

ollama run deepseek-r1:7b

进入交互模式后，输入你的问题即可获得回复。输入/bye退出对话。

你也可以通过API方式调用，Ollama提供了兼容OpenAI格式的REST接口：

curl http://localhost:11434/api/generate \
  -d '{
    "model": "deepseek-r1:7b",
    "prompt": "用Python写一个快速排序算法",
    "stream": false
  }'

安装可视化界面（Open WebUI）

纯命令行交互对普通用户不够友好。推荐搭配Open WebUI，获得类似ChatGPT的网页操作界面。

使用Docker安装Open WebUI

首先确保已安装Docker，然后执行：

# 如果Ollama和Open WebUI在同一台机器
docker run -d \
  -p 3000:8080 \
  --add-host=host.docker.internal:host-gateway \
  -v open-webui:/app/backend/data \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:main

启动后访问http://localhost:3000，注册账号后即可在浏览器中与本地DeepSeek模型对话，支持多轮对话、历史记录、文件上传等功能。

实际应用场景

完成Linux本地部署DeepSeek后，你可以将其应用于多种实际场景：

代码辅助：集成到VS Code等编辑器，实现本地代码补全和审查，代码不上传云端。
文档处理：结合RAG（检索增强生成）框架，构建基于私有文档的问答系统。
自动化脚本：通过API接口将DeepSeek嵌入自动化工作流，处理文本分类、摘要生成等任务。
本地知识库：搭配LangChain或LlamaIndex，构建企业内部专属AI助手。

常见问题 FAQ

Q：没有GPU可以运行DeepSeek吗？

可以。Ollama支持纯CPU推理，但速度会明显慢于GPU模式。7B模型在8核CPU上每秒约生成3-8个Token，日常使用可以接受，但不适合高并发场景。建议选择1.5B或量化程度更高的版本。

Q：下载模型时速度很慢怎么办？

可以设置环境变量配置代理，或者从国内镜像站下载GGUF格式的模型文件后手动导入。也可以尝试在网络较好的时段下载，Ollama支持断点续传。

Q：如何更新已下载的模型？

执行ollama pull deepseek-r1:7b会自动检查并下载最新版本，本地已有版本不会重复下载。

Q：多个用户能同时使用本地部署的DeepSeek吗？

Ollama默认支持并发请求，但受限于硬件资源，并发数越高响应越慢。如需多人使用，建议部署在配置较高的服务器上，并将Ollama的监听地址改为0.0.0.0以允许局域网访问。

Q：如何彻底卸载Ollama和模型？

停止服务后删除相关目录即可：

sudo systemctl stop ollama
sudo rm -rf /usr/local/bin/ollama ~/.ollama

总结

在Linux系统本地部署DeepSeek的整体流程并不复杂：安装Ollama、拉取模型、启动服务，三步即可完成基础部署。配合Open WebUI可以获得完整的可视化交互体验。对于有隐私需求或希望深度定制AI能力的开发者来说，本地部署是比云端API更值得投入的方向。随着DeepSeek模型持续迭代，本地部署的性价比还会进一步提升。建议从7B量化版本入手，熟悉整个工作流后再根据实际需求升级硬件或尝试更大参数的模型。

想了解更多AI工具和技巧？欢迎访问红烁AI 培训，红烁 AI 中转站，获取最新AI资讯和实用教程。