在您查看了Hugging Face等模型中心,并考虑了模型大小、格式和量化之后,在下载和使用模型之前,还有重要一步:了解其许可。仅仅因为模型可以下载,并不意味着您可以将其用于任何目的。许可为使用软件和AI模型提供了使用准则。到底什么是许可?可以将许可看作是模型创建者提供的许可证明或一套规则。它明确说明了您可以使用其创建物做什么,以及不能做什么。这些规则包括以下方面:使用: 您可以将模型用于个人试验吗?您可以用它来构建商业产品吗?是否存在禁止其使用的特定方面或用途?修改: 您可以根据自己的数据微调模型或调整其架构吗?分发: 如果您修改了模型,可以分享您修改后的版本吗?如果可以,您需要根据相同的许可分享您的修改吗?署名: 当您使用或分享模型时,需要注明原始创建者的出处吗?忽视许可可能导致法律问题,特别是如果您计划将模型用于简单的个人试验以外的任何用途。为什么许可对大型语言模型很重要了解许可非常重要,因为模型的用途差异很大。有些模型发布得很开放,鼓励广泛采用,而另一些则带有重大限制。例如:模型可能免费用于学术研究,但严格禁止用于商业用途。另一个模型可能允许商业使用,但要求您进行的任何改进也必须以相同条款公开分享(这通常称为“copyleft”)。有些许可包含“可接受使用政策”,限制将模型用于创建者认为有害或不道德的特定目的。您会遇到的常见许可类型虽然有许多许可类型,但在寻找本地大型语言模型时,您经常会遇到几个主要类别:宽松许可: 这些许可(如Apache 2.0、MIT、BSD)通常给予您很大的自由。您通常可以将模型用于个人或商业目的,修改它,并以不同条款分发它(或基于它的作品),只要您提供署名(注明出处)给原始创建者并包含原始许可文本。它们常因其灵活性而受到青睐。限制性/Copyleft许可: GNU通用公共许可(GPL)或Affero GPL(AGPL)等许可通常要求,如果您分发修改后的版本,或者在某些情况下,使用修改后的软件提供服务,您必须根据相同的许可提供您的修改。这确保了衍生作品也保持开放。一些受欢迎的模型也使用具有特定限制的自定义许可。例如,Llama 2社区许可允许在特定规模下进行商业使用(基于您的产品/服务的月活跃用户数量),但超过该阈值则需要从提供商处获得单独的许可。它还包含禁止某些应用的“可接受使用政策”。务必仔细阅读这些内容。仅限研究许可: 有些模型严格用于非商业研究目的。通常不允许使用它们来构建提供给客户的产品或服务。自定义许可: 越来越多地,模型以由创建它们的组织定制的许可发布。这些需要仔细阅读,因为它们可能包含关于使用、分发或根据模型或提供商目标定制的特定限制的独特条款。digraph G { rankdir=LR; node [shape=box, style=rounded, fontname="sans-serif", fontsize=10, margin=0.15]; edge [fontname="sans-serif", fontsize=9]; start [label="查找模型"]; check [label="检查其许可\n(模型卡 / LICENSE 文件)"]; permissive [label="宽松型?\n(例如,Apache 2.0, MIT)", shape= Mdiamond, color="#12b886", fontcolor="#12b886"]; restrictive [label="限制型?\n(例如,Llama 2, AGPL)", shape=Mdiamond, color="#f76707", fontcolor="#f76707"]; research [label="仅限研究?", shape=Mdiamond, color="#4263eb", fontcolor="#4263eb"]; custom [label="自定义许可?", shape=Mdiamond, color="#ae3ec9", fontcolor="#ae3ec9"]; perm_ok [label="通常适用于大多数用途\n(个人、商业、修改)\n需要署名", color="#12b886", fontcolor="#12b886"]; rest_rules [label="检查具体规则:\n- 商业用途?\n- 分享修改?\n- 可接受使用政策?", color="#f76707", fontcolor="#f76707"]; res_only [label="仅限非商业研究", color="#4263eb", fontcolor="#4263eb"]; cust_read [label="仔细阅读!\n限制不同", color="#ae3ec9", fontcolor="#ae3ec9"]; start -> check; check -> permissive [label="类型?"]; check -> restrictive; check -> research; check -> custom; permissive -> perm_ok [label="是"]; restrictive -> rest_rules [label="是"]; research -> res_only [label="是"]; custom -> cust_read [label="是"]; permissive -> restrictive [style=invis]; restrictive -> research [style=invis]; research -> custom [style=invis]; }基于常见类型评估模型许可的简化决策流程。在哪里查找许可信息正如前一节“阅读模型卡”中提到的,许可是您应该在那里找到的标准信息。Hugging Face等模型存储库的模型页面上通常有一个专门的字段或部分,指明许可。通常,您还会发现模型文件本身包含一个名为LICENSE或COPYING的文件。如果您对允许的用途有具体问题,最好始终查阅完整的许可文本。初学者实用建议学习用途: 如果您刚开始并想进行试验而无需过多担心复杂规则,可以寻找具有Apache 2.0或MIT等宽松许可的模型。在投入前检查: 在花费大量时间下载大型模型或围绕它构建项目之前,仔细核对其许可,以确保它符合您的预期用途。商业用途: 如果您设想将模型用于任何商业目的(即使是可能赚钱的小型副项目),请特别注意许可条款。一些看似“开放”的模型对公司规模或收入有限制。有疑问时: 阅读许可文本。如果内容不清楚,有时模型卡会提供更简单的摘要,或者您可以在社区论坛中找到讨论。然而,官方许可文本始终是权威来源。请记住,本指南仅供参考;如需实际法律建议,请咨询法律专业人士。花点时间检查许可是小而必要的一步。它有助于确保您负责任地使用这些强大工具,并避免后续的潜在复杂情况。现在您知道了如何查找模型并评估其大小、格式、量化和许可,您已经准备好选择您的第一个模型了。