虽然人工神经网络(ANNs)本质上是软件中实现的数学模型,但其最初的构想在很大程度上受到大脑主要处理单元——生物神经元的结构和功能的启发。了解这种生物对应物有助于理解早期人工神经网络的设计选择,并提供了一个有用的思维模型,即使现代深度学习已发生很大变化。大脑的处理单元人脑包含数十亿神经元,形成一个庞大且相互连接的网络。每个神经元都充当一个微小的信息处理器。尽管生化上很复杂,但我们可以为我们的目的简化其功能。一个典型的神经元由三个主要部分参与信号传输:树突: 这些树状分支充当输入通道。它们通过称为突触的连接从其他神经元接收电化学信号。胞体(细胞体): 神经元的中心部分。它收集并汇总树突接收到的输入信号。如果组合信号强度在短时间内超过某个激活阈值,胞体就会产生一个电脉冲。轴突: 一个长的、电缆状的突起,将电脉冲(“输出信号”)从胞体传输出去。轴突终止于分支,这些分支与其他神经元的树突形成突触,从而将信号传递下去。突触是神经元之间的连接点。它们不只是被动的连接;突触的强度或“权重”决定了突触前(发送)神经元发出的信号对突触后(接收)神经元有多大影响。这种突触强度会随时间改变,这被认为是学习和记忆在大脑中的基本机制。本质上,一个生物神经元接收多个加权输入(由突触强度调节的信号),在胞体中整合它们,如果总输入超过阈值,它会“发放”(放电),沿着轴突发送信号,从而可能激活其他神经元。digraph NeuronAnalogy { rankdir=LR; node [shape=box, style=rounded, fontname="sans-serif", color="#495057", fontcolor="#495057"]; edge [fontname="sans-serif", color="#adb5bd", fontcolor="#868e96"]; subgraph cluster_bio { label = "生物神经元"; bgcolor="#e9ecef"; color="#ced4da"; synapse1 [label="突触", shape=ellipse, style=filled, fillcolor="#a5d8ff", width=0.5, height=0.5, fixedsize=true]; synapse2 [label="突触", shape=ellipse, style=filled, fillcolor="#a5d8ff", width=0.5, height=0.5, fixedsize=true]; dendrites [label="树突\n(接收信号)", shape=invhouse, style=filled, fillcolor="#74c0fc"]; soma [label="胞体\n(处理信号)", shape=circle, style=filled, fillcolor="#4dabf7"]; axon [label="轴突\n(传递信号)", shape=cds, style=filled, fillcolor="#339af0", width=1.5]; synapse_out [label="突触", shape=ellipse, style=filled, fillcolor="#a5d8ff", width=0.5, height=0.5, fixedsize=true]; synapse1 -> dendrites; synapse2 -> dendrites; dendrites -> soma; soma -> axon [label=" 若达到阈值"]; axon -> synapse_out; } subgraph cluster_art { label = "人工神经元"; bgcolor="#e9ecef"; color="#ced4da"; input1 [label="输入 1", shape=circle, style=filled, fillcolor="#b2f2bb", width=0.5, height=0.5, fixedsize=true]; input2 [label="输入 2", shape=circle, style=filled, fillcolor="#b2f2bb", width=0.5, height=0.5, fixedsize=true]; sum_act [label="求和 (Σ)\n+ 激活 (f)", shape=circle, style=filled, fillcolor="#69db7c", width=1.2]; output [label="输出", shape=circle, style=filled, fillcolor="#51cf66", width=0.5, height=0.5, fixedsize=true]; bias [label="偏置", shape=diamond, style=filled, fillcolor="#96f2d7", width=0.5, height=0.5, fixedsize=true]; input1 -> sum_act [label=" w₁"]; input2 -> sum_act [label=" w₂"]; bias -> sum_act [label=" b"]; sum_act -> output [label=" y = f(Σ(wᵢxᵢ)+b)"]; } }生物神经元的组成部分与人工神经元要素的简化比较。从生物学到计算人工神经元(我们将在下一节中对其进行数学定义)是一种受到这一生物过程启发的高度简化的抽象:输入: 对应于树突接收的信号。权重: 类似于突触强度,决定了每个输入的影响。求和: 模拟胞体中信号的整合。激活函数: 代表胞体的阈值发放机制。如果加权输入总和超过某个值,人工神经元就会产生一个输出信号。输出: 对应于沿轴突传递的信号。请记住,这是一种启发,而非直接复制。人工神经网络不模拟复杂的电化学动态、神经递质、精确的脉冲时间或大脑复杂的3D结构。它们捕捉了一个核心计算原理:组合加权输入并应用非线性激活。这种简化使得人工神经网络在计算上可行,并且能有效解决复杂问题,即使其底层机制与生物实际情况有很大不同。理解这一来源提供了背景,有助于我们接下来对人工神经元的数学形式进行阐述。