模型许可与使用限制

在下载和使用AI模型之前，了解其许可是重要一步。尽管模型通常可以从Hugging Face等平台下载，但可供下载并不自动意味着可以将其用于任何目的。许可规定了使用软件和AI模型的准则。

可以将许可看作是模型创建者提供的许可证明或一套规则。它明确说明了您可以使用其创建物做什么，以及不能做什么。这些规则包括以下方面：

忽视许可可能导致法律问题，特别是如果您计划将模型用于简单的个人试验以外的任何用途。

了解许可非常重要，因为模型的用途差异很大。有些模型发布得很开放，鼓励广泛采用，而另一些则带有重大限制。例如：

虽然有许多许可类型，但在寻找本地大型语言模型时，您经常会遇到几个主要类别：

宽松许可： 这些许可（如Apache 2.0、MIT、BSD）通常给予您很大的自由。您通常可以将模型用于个人或商业目的，修改它，并以不同条款分发它（或基于它的作品），只要您提供署名（注明出处）给原始创建者并包含原始许可文本。它们常因其灵活性而受到青睐。
限制性/Copyleft许可： GNU通用公共许可（GPL）或Affero GPL（AGPL）等许可通常要求，如果您分发修改后的版本，或者在某些情况下，使用修改后的软件提供服务，您必须根据相同的许可提供您的修改。这确保了衍生作品也保持开放。一些受欢迎的模型也使用具有特定限制的自定义许可。例如，Llama 2社区许可允许在特定规模下进行商业使用（基于您的产品/服务的月活跃用户数量），但超过该阈值则需要从提供商处获得单独的许可。它还包含禁止某些应用的“可接受使用政策”。务必仔细阅读这些内容。
仅限研究许可： 有些模型严格用于非商业研究目的。通常不允许使用它们来构建提供给客户的产品或服务。
自定义许可： 越来越多地，模型以由创建它们的组织定制的许可发布。这些需要仔细阅读，因为它们可能包含关于使用、分发或根据模型或提供商目标定制的特定限制的独特条款。

基于常见类型评估模型许可的简化决策流程。

正如前一节“阅读模型卡”中提到的，许可是您应该在那里找到的标准信息。Hugging Face等模型存储库的模型页面上通常有一个专门的字段或部分，指明许可。通常，您还会发现模型文件本身包含一个名为LICENSE或COPYING的文件。如果您对允许的用途有具体问题，最好始终查阅完整的许可文本。

学习用途： 如果您刚开始并想进行试验而无需过多担心复杂规则，可以寻找具有Apache 2.0或MIT等宽松许可的模型。
在投入前检查： 在花费大量时间下载大型模型或围绕它构建项目之前，仔细核对其许可，以确保它符合您的预期用途。
商业用途： 如果您设想将模型用于任何商业目的（即使是可能赚钱的小型副项目），请特别注意许可条款。一些看似“开放”的模型对公司规模或收入有限制。
有疑问时： 阅读许可文本。如果内容不清楚，有时模型卡会提供更简单的摘要，或者您可以在社区论坛中找到讨论。然而，官方许可文本始终是权威来源。请记住，本指南仅供参考；如需实际法律建议，请咨询法律专业人士。

花点时间检查许可是小而必要的一步。它有助于确保您负责任地使用这些强大工具，并避免后续的潜在复杂情况。现在您知道了如何查找模型并评估其大小、格式、量化 (quantization)和许可，您已经准备好选择您的第一个模型了。

参考文献

Open Source Licenses, Open Source Initiative, 2024 - 提供各种开源软件许可的定义和示例，包括宽松许可和GPL类许可，这些是理解许多AI模型许可的基础。
How to write a good Model Card, Hugging Face, 2024 (Hugging Face) - 说明了模型卡的结构和目的，包括它们如何在热门模型中心呈现AI模型的许可信息。
What is an AI License and Why Do You Need One?, Linux Foundation AI & Data, 2023 (Linux Foundation AI & Data) - 讨论了AI模型许可的具体特点和重要性，涵盖了使用、修改、分发、归属和道德使用政策。