ChatGLM3-6B: Specifications and GPU VRAM Requirements

ChatGLM3-6B

Open Source

Open Weights

Parameters

Context Length

8.192K

Modality

Text

Architecture

Dense

License

Release Date

27 Oct 2023

Knowledge Cutoff

Technical Specifications

Attention Structure

Multi-Head Attention

Hidden Dimension Size

Number of Layers

Attention Heads

Key-Value Heads

Activation Function

Normalization

Position Embedding

Absolute Position Embedding

System Requirements

VRAM requirements for different quantization methods and context sizes

ChatGLM3-6B

Further improved ChatGLM with better performance and function calling.

About ChatGLM

ChatGLM series models from Z.ai, based on GLM architecture.

Other ChatGLM Models

ChatGLM-6B
ChatGLM2-6B
ChatGLM3-6B-32K

Evaluation Benchmarks

Ranking is for Local LLMs.

No evaluation benchmarks for ChatGLM3-6B available.

Rankings

Overall Rank

Coding Rank

GPU Requirements

Full Calculator

Quantization

Choose the quantization method for model weights

Context Size: 1,024 tokens

ChatGLM3-6B

Technical Specifications

System Requirements

ChatGLM3-6B

About ChatGLM

Other ChatGLM Models

Evaluation Benchmarks

Rankings

GPU Requirements

VRAM Required:

Recommended GPUs