在使用汇总统计和可视化方式研究数据之后,您通常会想提出更具体的问题。或许您已注意到数据中两组之间的差异,或者您对某事物的工作方式有一个理论并想验证它。这时,假设检验的观念便派上用场了。它为基于数据做出判断提供了一个正式的框架。可以将假设看作一个关于您想研究事物的精确、可检验的陈述。它比一般性问题更具体。例如,与其问“网站设计A是否比设计B更好?”,不如提出一个假设:“网站设计A会带来比网站设计B更高的平均点击率。”零假设和备择假设在统计假设检验中,我们通常使用两种对立的陈述来构建问题:零假设 ($H_0$): 这通常是一个关于“无影响”、“无差异”或现状的陈述。它代表着我们暂时接受的默认假设。在我们的网站示例中,零假设将是:$H_0$: 网站设计A和设计B之间的平均点击率没有差异。(或者,设计A的平均点击率小于或等于设计B的平均点击率,这取决于我们如何措辞备择假设。)备择假设 ($H_a$ 或 $H_1$): 这是与零假设相矛盾的陈述。它代表着我们怀疑或期望可能为真的情况——通常是存在影响或差异。这是我们试图寻找证据支持的主张。对于网站示例,备择假设可以是: * $H_a$: 网站设计A的平均点击率高于设计B。核心观点不是直接证明备择假设。相反,我们审视数据中的证据(使用我们学过的统计量,如均值和标准差),以查看如果零假设实际成立,我们观察到当前数据的可能性有多大。收集反对零假设的证据设想一个简化的情境:我们认为一枚硬币是公平的($H_0$: 正面朝上的概率 = 0.5)。我们抛掷10次,得到9次正面朝上($H_a$: 正面朝上的概率 > 0.5)。这个结果是否提供了强有力的证据,表明硬币不公平?假设检验使用统计计算来量化这些证据。如果我们观察到的数据(例如,10次抛掷中有9次正面朝上,或网站设计之间平均点击率的巨大差异)在假设零假设为真的情况下仅凭随机偶然性极不可能发生,我们可能会决定拒绝零假设,转而接受备择假设。可以把它想象成法庭审判:零假设 ($H_0$): 被告无罪。备择假设 ($H_a$): 被告有罪。控方需要提出有力证据(数据分析结果)来说服陪审团驳回无罪假定。我们不会绝对证明有罪;我们只是判断在检验中是否有足够的证据,以统计显著性来拒绝无罪。如果证据不够有力,我们就“未能拒绝”零假设(就像无罪释放)——这并不意味着被告是无罪的,只是说没有足够的证据证明其有罪。为什么理解这些很重要?您不会在本入门课程中进行复杂的假设检验,但理解其潜在观念在数据科学中具有根本性:结构化判断: 它提供了一种正式的方式,使用数据来回答具体问题并做出选择,不再仅仅依赖直觉或简单观察。解释结果: 当您遇到分析结果(如A/B测试报告或科学研究)时,理解零假设/备择假设框架能帮助您解释这些发现的实际含义。模型构建的依据: 许多机器学习技术在评估模型表现或特征重要性时,都隐式地包含假设检验的观念。目前,目标是掌握这个思想:我们从一个默认假设(零假设)开始,陈述我们试图寻找证据支持的内容(备择假设),然后使用数据查看证据是否足够有力,足以让我们怀疑最初的假设。您学过的汇总统计和分布是在实践中衡量这些证据的构成要素。接下来的动手实践将巩固这些基本统计量的计算。