使用 loRA 微调一个 PDF 使用手册(1)
本系列可能含有很多章节,慢慢完善,纯代码,基本上都会使用github.com 的代码 暂时把项目的名称定义为 […]
使用 loRA 微调一个 PDF 使用手册(1) Read More »
本系列可能含有很多章节,慢慢完善,纯代码,基本上都会使用github.com 的代码 暂时把项目的名称定义为 […]
使用 loRA 微调一个 PDF 使用手册(1) Read More »
SimpleTuner 是一个专门用于训练优化的一组实验脚本的存储库。该项目旨在简化代码,重点是使代码易于阅读
专门用于训练优化的 SimpleTuner Read More »
我们很高兴正式发布 trl 与 peft 的集成,使任何人都可以更轻松
在一张 24 GB 的消费级显卡上用 RLHF 微调 20B LLMs Read More »
介绍 我们很高兴分享“万事通”(Jack of All Trades,简称 JAT) 项目,该项目旨在朝着通用
万事通,专精部分领域的多功能 Transformer 智能体 Read More »
最先进的监督微调初学者指南 最近发布的 Llama 3.1 为模型提供了令人难以置信的性能水平,缩小了闭源和开
使用 Unsloth 超高效微调 Llama 3.1 Read More »
如果你认为删除你的互联网历史记录就足够了,你就错了。 你的互联网活动仍然被储存。 下面是一个彻底删除你的互联网
删除你的 google 用户的互联网记录? Read More »
texlive-full 和 texlive 是两个不同的 TeX Live 包,在内容和用途上有所区别: 1
texlive-full 和 texlive 的区别 Read More »