趋近智
注意力结构
Multi-Head Attention
隐藏维度大小
-
层数
-
注意力头
-
键值头
-
激活函数
-
归一化
-
位置嵌入
Absolute Position Embedding
不同量化方法和上下文大小的显存要求
Further improved ChatGLM with better performance and function calling.
ChatGLM series models from Z.ai, based on GLM architecture.
排名适用于本地LLM。
没有可用的 ChatGLM3-6B 评估基准。