了解 dbrx-instruct
0. 简介 DBRX 是一个基于 Transformer 的仅解码器大型语言模型 (LLM),它使用下一个令牌 […]
有关LLM 的文章
这篇文章是关于你在讨论中LLM不断听到的各种量化技术。此处的目的是提供分步说明以及代码,您可以使用这些代码自行
LLM 量化(LLM Quantization)| GPTQ | QAT | AWQ | GGUF | GGML | PTQ Read More »
13. 嵌入权重 在自然语言处理(NLP)和机器学习中,嵌入权重(embedding weights)是用于将
了解 LLaMA-2 模型结构(8) Read More »
12. 模型文件的配置信息 根据前面保存的模型文件 output/model.bin 的内容,可以知道,模型配
了解 LLaMA-2 模型结构(7) Read More »