llama.cpp, Georgi Gerganov and the llama.cpp Contributors, 2023 - GGUF格式的源项目,详细介绍了用于高效LLM推理的量化技术。
Mistral 7B, Albert Q. Jiang, Alexandre Sablayrolles, Arthur Mensch, Chris Bamford, Devendra Singh Chaplot, Diego de las Casas, Florian Bressand, Gianna Lengyel, Guillaume Lample, Lucile Saulnier, Lélio Renard Lavaud, Marie-Anne Lachaux, Pierre Stock, Teven Le Scao, Thibaut Lavril, Thomas Wang, Timothée Lacroix, William El Sayed, 2023arXivDOI: 10.48550/arXiv.2310.06825 - 介绍了Mistral 7B模型,该模型以其小尺寸下的强大性能而闻名,适合本地使用。