了解 CohereForAI/c4ai-command-r-plus

C4AI Command R+ 是 104B 亿参数模型的开放权重研究版本,具有高度先进的功能,其中包括检索增强生成 (RAG) 和用于自动执行复杂任务的工具。此模型生成中的工具使用支持多步骤工具使用,这允许模型在多个步骤中组合多个工具以完成困难的任务。C4AI Command R+ 是一个多语言模型,以 10 种语言评估性能:英语、法语、西班牙语、意大利语、德语、巴西葡萄牙语、日语、韩语、阿拉伯语和简体中文。Command R+ 针对各种用例进行了优化,包括推理、摘要和问答。

模型大小:1040亿个参数

上下文长度:128K

有非量化版本:CohereForAI/c4ai-command-r-plus

和量化版本:c4ai-command-r-plus-4bit

需要更新到最新的 transformers

pip install ‘git+https://github.com/huggingface/transformers.git’ bitsandbytes accelerate

1. c4ai-command-r-plus-4bit

下面的代码是在wsl2 下,6GB的显卡测试的

需要更新到最新的 transformers,查看config.json 内容

可以得知:”transformers_version”: “4.40.0.dev0”

运行结果:

2. c4ai-command-r-plus

查看 config.json 文件,”transformers_version”: “4.40.0.dev0”

下面的代码和上面的test01.py 其实是相同的,但是执行过程不一样

量化版本:4bit 会使用 GPU 内存和CPU内存

非量化版本不会使用GPU 内存,而只是使用CPU内存

运行结果:

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部