LLMS – 第 6 页 – 杰力皓博

ChatQA-1.5

发表评论 / AI, AI 新闻, LLM, LLMS / ChatQA, llama3 / 2024年5月5日

介绍 ChatQA-1.5，这是一个在 RAG 和对话式 QA 上超越 GPT-4-0613 和 Comman […]

ChatQA-1.5 Read More »

ChatQA, llama3

在docker容器中配置 https

发表评论 / AI, LLMS / docker, nginx / 2024年5月5日

在容器中配置 HTTPS 主要涉及到在应用层面设置 SSL/TLS 证书和适当配置 Web 服务器（如 Ngi

在docker容器中配置 https Read More »

docker, nginx

RAG 产品 Quivr 开源

发表评论 / AI, AI 新闻, GPT, LLM, LLMS, OpenAI / ollama, OpenAI, PDF, Quivr, RAG / 2024年5月2日

42K+ 用户、服务过 6K+ 公司的第二大脑 #RAG 产品 Quivr 开源，目前 32K Star，冲上

RAG 产品 Quivr 开源 Read More »

ollama, OpenAI, PDF, Quivr, RAG

LLM 记忆管理框架 MemGPT

发表评论 / AI, AI 新闻, GPT, LLM, LLMS, OpenAI / LLM, MemGPT, OpenAI API / 2024年5月2日

伯克利大学开源最专业的 LLM 记忆管理框架 MemGPT ，目前 8.7 K Star MemGPT 允许您

LLM 记忆管理框架 MemGPT Read More »

LLM, MemGPT, OpenAI API

在单个 4GB GPU 上运行 Meta-Llama-3-8B-Instruct – 使用 airllm 和分层推理

发表评论 / AI, LLM, LLMS / chatGPT, LLAMA 3 70B, OpenAI API, 推理 / 2024年4月28日

0. 原理分层推理本质上是“分而治之”的方法这没有使用量化、蒸馏、修剪或其他模型压缩技术大型语言模型之所

在单个 4GB GPU 上运行 Meta-Llama-3-8B-Instruct – 使用 airllm 和分层推理 Read More »

chatGPT, LLAMA 3 70B, OpenAI API, 推理

在手机(android)上运行AI大模型llama3、phi3、qwen

发表评论 / AI, Android, Linux, LLM, LLMS / android, 手机，ollama / 2024年4月25日

这里测试的是 andorid 系列手机在 Release v0.118.0 · termux/termux-

在手机(android)上运行AI大模型llama3、phi3、qwen Read More »

android, 手机，ollama

在树莓派上运行AI大模型 llama3、phi3

发表评论 / AI, Linux, LLM, LLMS / go, llama3, ollama, phi3, raspberrypi, 树莓派 / 2024年4月24日

使用的是树莓派（raspberrypi）5，8G 内存 0. 直接下载，然后运行参照 ollama/docs

在树莓派上运行AI大模型 llama3、phi3 Read More »

go, llama3, ollama, phi3, raspberrypi, 树莓派

llm.c 的中文注解-20240423

发表评论 / AI, LLM, LLMS / chatGPT, llm.c, OpenAI API / 2024年4月23日

这里接上一节对C程序的中文注解，下面是对 train_gpt2.cu 的注解，所有注解来自ChatGPT4。

llm.c 的中文注解-20240423 Read More »

chatGPT, llm.c, OpenAI API

llm.c 的中文注解-20240421

发表评论 / LLM, LLMS / chatGPT, llm.c, OpenAI API / 2024年4月21日

llm.c 简单、纯 C/CUDA 的 LLM 训练。不需要 245MB 的 PyTorch 或 107MB

llm.c 的中文注解-20240421 Read More »

chatGPT, llm.c, OpenAI API

OpenAI 使用嵌入和最近邻搜索的建议

发表评论 / GPT, LLMS, OpenAI / chatGPT, OpenAI API / 2024年4月13日

建议在网络上广为流传。此笔记本演示如何使用嵌入来查找要推荐的类似项目。特别是，我们使用 AG 的新

OpenAI 使用嵌入和最近邻搜索的建议 Read More »

chatGPT, OpenAI API