这是 Llama 3.2 3B Instruct 的未经审查版本,使用删减创建(请参阅本文以了解更多信息)。
特别感谢 @FailSpy 的原始代码和技术。如果您对 abliterated 模型感兴趣,请关注他。
评估
以下数据已重新评估并计算为每次测试的平均值。
Benchmark | Llama-3.2-3B-Instruct | Llama-3.2-3B-Instruct-abliterated |
---|---|---|
IF_Eval | 76.55 | 76.76 |
MMLU | 27.88 | 28.00 |
TruthfulQA | 50.55 | 50.73 |
BBH | 41.81 | 41.86 |
GPQA | 28.39 | 28.41 |
用于评估的脚本可以在此存储库的 /eval.sh 下找到,或单击此处
原文连接:https://huggingface.co/huihui-ai/Llama-3.2-3B-Instruct-abliterated