import torch
import torch.nn as nn
from collections import OrderedDict

# 定义输入、隐藏层和输出维度
input_size = 784
hidden_size = 128
output_size = 10

# 方法1：直接将模块作为参数传递
model_v1 = nn.Sequential(
    nn.Linear(input_size, hidden_size), # 第1层：线性变换
    nn.ReLU(),                         # 激活函数1：非线性
    nn.Linear(hidden_size, output_size) # 第2层：线性变换
)

# 打印模型结构
print("Model V1 (Unnamed Layers):")
print(model_v1)

# 示例用法：创建一个虚拟输入张量
# 假设批量大小为64
dummy_input = torch.randn(64, input_size)
output = model_v1(dummy_input)
print("\nOutput shape:", output.shape) # 预期：torch.Size([64, 10])

这创建了一个模型，其中输入数据首先经过nn.Linear(784, 128)，然后应用nn.ReLU()激活，最后结果通过nn.Linear(128, 10)。请注意，定义是多么紧凑。Sequential容器自动处理将一个模块的输出作为下一个模块的输入传递。

在`nn.Sequential`中命名层

尽管前一种方法可行，但层只被分配了默认的数字索引（0、1、2等）。这可能会使得后续调试或访问特定层变得更难。为了清晰度和可访问性，更好的做法是使用Python collections模块中的OrderedDict来为您的层提供名称。

# 方法2：使用OrderedDict进行命名层
model_v2 = nn.Sequential(OrderedDict([
    ('fc1', nn.Linear(input_size, hidden_size)), # 全连接层1
    ('relu1', nn.ReLU()),                      # ReLU激活
    ('fc2', nn.Linear(hidden_size, output_size)) # 全连接层2
]))

# 打印模型结构
print("\nModel V2 (Named Layers):")
print(model_v2)

# 现在可以通过名称访问特定层
print("\nAccessing fc1 weights shape:", model_v2.fc1.weight.shape)
# 如果需要，也可以使用整数索引访问
print("Accessing layer at index 0:", model_v2[0])
# 或者如果使用OrderedDict，直接通过字符串名称访问
print("Accessing layer by name 'relu1':", model_v2.relu1)

使用OrderedDict保留了插入顺序（这对nn.Sequential非常重要），同时允许您引用诸如model_v2.fc1或model_v2.relu1之类的层。这显著提高了代码的可读性和可维护性，特别是对于稍长的序列，使得检查模型的特定部分变得更容易。

数据流经使用命名层通过nn.Sequential定义的model_v2。输入按线性顺序通过fc1、relu1和fc2。

何时使用`nn.Sequential`

nn.Sequential特别适合于：

简单的全连接网络： 模型中的层线性堆叠，没有分支或跳过，例如基本的多层感知机（MLP）或某些CNN的初始特征提取阶段。
定义可复用模块： 创建自包含的层模块（例如，一个包含Conv2d、BatchNorm2d和ReLU的卷积模块），然后可以将其作为单个模块整合到更大的自定义nn.Module结构中。
快速原型开发： 快速组装标准架构以测试想法或建立基线。

局限性

nn.Sequential的主要局限在于其严格的线性性质。它假定一个单一输入和一个单一输出，数据顺序流经所有包含的模块。您不能直接使用它来定义具有更复杂拓扑的模型，例如：

跳跃连接： 像ResNet这样的架构，其中较早层的输出被添加到较晚层的输出中，这需要在自定义的forward方法中显式实现。
多输入或多输出： 处理几个不同输入流或生成多个输出张量的模型不能仅凭nn.Sequential来表示。
共享层： 架构中完全相同的层实例在网络拓扑的不同点被应用。
条件逻辑： 任何数据流依赖于运行时条件或需要对从一层的输出到下一层输入的数据进行操作的场景。

对于任何表现出这些特点的架构，您必须通过子类化torch.nn.Module并自行实现forward方法来定义一个自定义模型，这将给予您对数据流的完全控制，如前所述在“定义自定义网络架构”一节中讨论的。

总之，nn.Sequential提供了一种清晰高效的方法来定义线性堆叠神经网络 (neural network)层的常见模式。它是一个有价值且方便的工具，适用于更简单的架构和组件模块，补充了自定义nn.Module类这种更灵活的方法。现在您可以使用nn.Module或nn.Sequential定义模型结构了，下一步是定义模型将优化的目标函数，这将引出损失函数 (loss function)。

这部分内容有帮助吗？

参考文献

torch.nn.Sequential, PyTorch Authors, 2024 (PyTorch Foundation) - torch.nn.Sequential 容器的官方文档，详细介绍了其功能和构建线性神经网络的方法。
torch.nn.Module, PyTorch Authors, 2024 (PyTorch Foundation) - torch.nn.Module 基类的官方文档，解释了如何在 PyTorch 中构建自定义神经网络层和模型，是 nn.Sequential 的基础。
Learn the Basics: Build the Neural Network, PyTorch Authors, 2021 (PyTorch) - PyTorch 官方入门教程，演示了如何使用 nn.Module 和 nn.Sequential 构建神经网络，展示了它们的实际应用。

简单模型的顺序容器

使用`nn.Sequential`定义模型

您可以通过将您想要包含的模块作为参数 (parameter)传递给其构造函数来创建Sequential模型。顺序很重要，因为它决定了数据流。

import torch
import torch.nn as nn
from collections import OrderedDict

# 定义输入、隐藏层和输出维度
input_size = 784
hidden_size = 128
output_size = 10

# 方法1：直接将模块作为参数传递
model_v1 = nn.Sequential(
    nn.Linear(input_size, hidden_size), # 第1层：线性变换
    nn.ReLU(),                         # 激活函数1：非线性
    nn.Linear(hidden_size, output_size) # 第2层：线性变换
)

# 打印模型结构
print("Model V1 (Unnamed Layers):")
print(model_v1)

# 示例用法：创建一个虚拟输入张量
# 假设批量大小为64
dummy_input = torch.randn(64, input_size)
output = model_v1(dummy_input)
print("\nOutput shape:", output.shape) # 预期：torch.Size([64, 10])

在`nn.Sequential`中命名层

# 方法2：使用OrderedDict进行命名层
model_v2 = nn.Sequential(OrderedDict([
    ('fc1', nn.Linear(input_size, hidden_size)), # 全连接层1
    ('relu1', nn.ReLU()),                      # ReLU激活
    ('fc2', nn.Linear(hidden_size, output_size)) # 全连接层2
]))

# 打印模型结构
print("\nModel V2 (Named Layers):")
print(model_v2)

# 现在可以通过名称访问特定层
print("\nAccessing fc1 weights shape:", model_v2.fc1.weight.shape)
# 如果需要，也可以使用整数索引访问
print("Accessing layer at index 0:", model_v2[0])
# 或者如果使用OrderedDict，直接通过字符串名称访问
print("Accessing layer by name 'relu1':", model_v2.relu1)

数据流经使用命名层通过nn.Sequential定义的model_v2。输入按线性顺序通过fc1、relu1和fc2。

何时使用`nn.Sequential`

nn.Sequential特别适合于：

简单的全连接网络： 模型中的层线性堆叠，没有分支或跳过，例如基本的多层感知机（MLP）或某些CNN的初始特征提取阶段。
定义可复用模块： 创建自包含的层模块（例如，一个包含Conv2d、BatchNorm2d和ReLU的卷积模块），然后可以将其作为单个模块整合到更大的自定义nn.Module结构中。
快速原型开发： 快速组装标准架构以测试想法或建立基线。

局限性

跳跃连接： 像ResNet这样的架构，其中较早层的输出被添加到较晚层的输出中，这需要在自定义的forward方法中显式实现。
多输入或多输出： 处理几个不同输入流或生成多个输出张量的模型不能仅凭nn.Sequential来表示。
共享层： 架构中完全相同的层实例在网络拓扑的不同点被应用。
条件逻辑： 任何数据流依赖于运行时条件或需要对从一层的输出到下一层输入的数据进行操作的场景。

这部分内容有帮助吗？

参考文献

torch.nn.Sequential, PyTorch Authors, 2024 (PyTorch Foundation) - torch.nn.Sequential 容器的官方文档，详细介绍了其功能和构建线性神经网络的方法。
torch.nn.Module, PyTorch Authors, 2024 (PyTorch Foundation) - torch.nn.Module 基类的官方文档，解释了如何在 PyTorch 中构建自定义神经网络层和模型，是 nn.Sequential 的基础。
Learn the Basics: Build the Neural Network, PyTorch Authors, 2021 (PyTorch) - PyTorch 官方入门教程，演示了如何使用 nn.Module 和 nn.Sequential 构建神经网络，展示了它们的实际应用。

简单模型的顺序容器

使用nn.Sequential定义模型

在nn.Sequential中命名层

何时使用nn.Sequential

局限性

简单模型的顺序容器

使用nn.Sequential定义模型

在nn.Sequential中命名层

何时使用nn.Sequential

局限性

使用`nn.Sequential`定义模型

在`nn.Sequential`中命名层

何时使用`nn.Sequential`

使用`nn.Sequential`定义模型

在`nn.Sequential`中命名层

何时使用`nn.Sequential`