构建大型语言模型(从头开始)

通过从头开始构建一个大型语言模型,了解如何创建、训练和调整大型语言模型 (LLMs)!

在构建大型语言模型(从头开始)中,你将了解如何LLMs从内到外工作。在这本富有洞察力的书中,畅销书作家塞巴斯蒂安·拉施卡 (Sebastian Raschka) 将指导您逐步创建自己的 LLM,用清晰的文字、图表和示例解释每个阶段。您将从最初的设计和创建到通用语料库的预训练,一直到特定任务的微调。

构建大型语言模型(从头开始)教你如何:

  • 规划和编码 LLM 的所有部分
  • 准备适合 LLM 训练的数据集
  • 微调 LLM 以进行文本分类和您自己的数据
  • 应用指令调整技术,以确保您的 LLM 遵循指令
  • 将预训练权重加载到 LLM 中

为 ChatGPT、Bard 和 Copilot 等尖端 AI 工具提供支持的大型语言模型 (LLM) 似乎是一个奇迹,但它们并不是魔术。本书通过帮助您从头开始构建自己的 LLM 来揭开 LLM 的神秘面纱。您将获得对 LLM 如何工作的独特而有价值的见解,学习如何评估它们的质量,并掌握具体的技术来微调和改进它们。

在本书中,你用来训练和开发你自己的小而实用的模型的过程遵循与交付 GPT-4 等大规模基础模型相同的步骤。您的小规模 LLM 可以在普通笔记本电脑上开发,您可以将其用作自己的个人助理。

关于本书

Build a Large Language Model (from Scratch) 是一本独一无二的指南,用于构建自己的工作 LLM。在这篇文章中,机器学习专家兼作家塞巴斯蒂安·拉施卡(Sebastian Raschka)揭示了LLM是如何在引擎盖下工作的,揭开了生成式人工智能黑匣子的盖子。本书充满了构建 LLM 的实用见解,包括构建数据加载管道、组装其内部构建块和微调技术。在此过程中,您将逐渐将基础模型转变为文本分类器工具,以及遵循对话说明的聊天机器人。

关于读者

对于了解 Python 的读者。开发机器学习模型的经验很有用,但不是必需的。

关于作者

塞巴斯蒂安·拉施卡(Sebastian Raschka)十多年来一直从事机器学习和人工智能方面的工作。Sebastian 于 2022 年加入 Lightning AI,现在专注于 AI 和 LLM 研究、开发开源软件和创建教育材料。在此之前,Sebastian曾在威斯康星大学麦迪逊分校担任统计系助理教授,专注于深度学习和机器学习研究。他对教育有着强烈的热情,最出名的是他关于使用开源软件进行机器学习的畅销书。

原文电子书购买链接:Build a Large Language Model (From Scratch) (manning.com)

源代码链接:rasbt/LLMs-from-scratch: Implementing a ChatGPT-like LLM in PyTorch from scratch, step by step (github.com)

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部