所有课程

本地大型语言模型入门

章节 1: 大型语言模型入门

什么是大型语言模型（LLM）？

大语言模型如何运作的简单视图

理解标记与文本生成

为何在本地运行大型语言模型？

本地LLM与云端LLM

第 1 章测验

章节 2: 准备本地环境

硬件考量：中央处理器

硬件考量：内存

硬件考量：图形处理器和显存

检查您的系统规格

操作系统兼容性

安装 Python (可选但建议)

命令行/终端简介

第 2 章测验

章节 3: 查找和选择本地大型语言模型

寻找LLM模型：Hugging Face Hub

理解模型大小与参数

模型格式：GGUF及其他

量化：缩小模型

了解模型卡片中的信息

模型许可与使用限制

选择你的第一个模型

第 3 章测验

章节 4: 运行你的第一个本地LLM

本地LLM运行器介绍

用 Ollama 下载模型

使用 Ollama 运行模型 (命令行)

设置 LM Studio

在 LM Studio 中查找和下载模型

在LM Studio中加载模型并进行聊天

llama.cpp 简介 (核心思想)

动手实践：运行模型

第 4 章测验

章节 5: 简单交互与提示词使用

什么是提示？

你的第一个提示：简单问题

理解上下文窗口

提示词排版基础建议

温度与创造力

常见交互方式

实践：简单的提示技巧

第 5 章测验

模型格式：GGUF及其他

这部分内容有帮助吗？

参考文献

GGUF File Format, Georgi Gerganov and llama.cpp contributors, 2024 - llama.cpp项目中为高效本地LLM推理开发的GGUF文件格式的官方规范和说明。
safetensors Documentation, Hugging Face and safetensors contributors, 2024 - safetensors库的官方文档，提供了一种安全高效保存和加载模型权重的方法，是传统序列化方法的替代方案。
Saving and Loading Models, Matthew Inkawhich, 2024 (PyTorch Foundation) - PyTorch官方关于保存和加载模型的教程，展示了如何使用原生框架格式存储和检索PyTorch训练的模型。
Save and load Keras models, TensorFlow Team and contributors, 2024 - TensorFlow官方关于使用Keras API保存和加载模型的指南，涵盖了TensorFlow生态系统中的SavedModel等原生格式。

© 2025 ApX Machine Learning用心打造