趋近智
大师班
12.1 恰当初始化的重要性
12.2 Xavier(Glorot)初始化
12.3 Kaiming (何) 初始化
12.4 Transformer组件中的初始化
12.5 末尾层的小初始化
© 2025 ApX Machine Learning