SliceGPT:通过删除行和列来压缩大型语言模型
Microsoft 在这篇论文中提出了非常好的建议 – “SliceGPT:通过删除行和列来压缩大 […]
SliceGPT:通过删除行和列来压缩大型语言模型 Read More »
Microsoft 在这篇论文中提出了非常好的建议 – “SliceGPT:通过删除行和列来压缩大 […]
SliceGPT:通过删除行和列来压缩大型语言模型 Read More »
适用于 Linux 的 Windows 子系统 (WSL) 2 是由 Microsoft 构建的完整 Linu
WSL2 使用 Windows 上的 Docker Desktop Read More »
本教程使用了surya-ocr库,实现本地RAG, 使用了嵌入模型 bert-base-multilingua
RAG 入门教程(PDF-Ollama) Read More »
本教程使用了surya-ocr库,实现本地RAG, 使用了嵌入模型 bert-base-multilingua
RAG 入门教程(PDF-WSL2) Read More »
flash-attn 在自己的github 上是没有预编译和的库文件,一般情况下,在windows 下安装非常
在windows 环境下安装 flash-attn Read More »
一种常见的RAG(Retrieval-Augmented Generation)的实现方式,其中利用一个较小的
一种常见的RAG(Retrieval-Augmented Generation)的实现方式 Read More »
这是我们著名的“5 行代码”入门示例,其中包含本地LLM和嵌入模型。我们将使用 nomic-embe
LlamaIndex 入门教程 (Ollama) Read More »