所有课程

本地大型语言模型入门

章节 1: 大型语言模型入门

什么是大型语言模型（LLM）？

大语言模型如何运作的简单视图

理解标记与文本生成

为何在本地运行大型语言模型？

本地LLM与云端LLM

第 1 章测验

章节 2: 准备本地环境

硬件考量：中央处理器

硬件考量：内存

硬件考量：图形处理器和显存

检查您的系统规格

操作系统兼容性

安装 Python (可选但建议)

命令行/终端简介

第 2 章测验

章节 3: 查找和选择本地大型语言模型

寻找LLM模型：Hugging Face Hub

理解模型大小与参数

模型格式：GGUF及其他

量化：缩小模型

了解模型卡片中的信息

模型许可与使用限制

选择你的第一个模型

第 3 章测验

章节 4: 运行你的第一个本地LLM

本地LLM运行器介绍

用 Ollama 下载模型

使用 Ollama 运行模型 (命令行)

设置 LM Studio

在 LM Studio 中查找和下载模型

在LM Studio中加载模型并进行聊天

llama.cpp 简介 (核心思想)

动手实践：运行模型

第 4 章测验

章节 5: 简单交互与提示词使用

什么是提示？

你的第一个提示：简单问题

理解上下文窗口

提示词排版基础建议

温度与创造力

常见交互方式

实践：简单的提示技巧

第 5 章测验

硬件考量：图形处理器和显存

这部分内容有帮助吗？

参考文献

CUDA C++ Programming Guide, NVIDIA Corporation, 2023 (NVIDIA Corporation) - 提供了CUDA架构和并行计算的详细信息。
Deep Learning, Ian Goodfellow, Yoshua Bengio, and Aaron Courville, 2016 (MIT Press) - 一本描述深度学习基础知识的教科书，包含计算方面的内容。
llama.cpp, Georgi Gerganov and the llama.cpp contributors, 2023 - LLM推理的C/C++实现项目库，支持本地执行和GGUF模型。
Metal Performance Shaders Framework, Apple Developer Documentation, 2024 - 苹果用于通过Metal加速Apple Silicon上机器学习任务的框架文档。

© 2025 ApX Machine Learning用心打造