模型在GPU内存的映射关系

这里我们以 nvidia/Llama-3.1-Nemotron-70B-Instruct-HF 为例来说明问题

代码如下:

输出结果如下:

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部