构建大型语言模型（从头开始）

通过从头开始构建一个大型语言模型，了解如何创建、训练和调整大型语言模型（LLMs）！

在构建大型语言模型（从头开始）中，你将了解如何LLMs从内到外工作。在这本富有洞察力的书中，畅销书作家塞巴斯蒂安·拉施卡（Sebastian Raschka）将指导您逐步创建自己的 LLM，用清晰的文字、图表和示例解释每个阶段。您将从最初的设计和创建到通用语料库的预训练，一直到特定任务的微调。

构建大型语言模型（从头开始）教你如何：

规划和编码 LLM 的所有部分
准备适合 LLM 训练的数据集
微调 LLM 以进行文本分类和您自己的数据
应用指令调整技术，以确保您的 LLM 遵循指令
将预训练权重加载到 LLM 中

为 ChatGPT、Bard 和 Copilot 等尖端 AI 工具提供支持的大型语言模型（LLM）似乎是一个奇迹，但它们并不是魔术。本书通过帮助您从头开始构建自己的 LLM 来揭开 LLM 的神秘面纱。您将获得对 LLM 如何工作的独特而有价值的见解，学习如何评估它们的质量，并掌握具体的技术来微调和改进它们。

在本书中，你用来训练和开发你自己的小而实用的模型的过程遵循与交付 GPT-4 等大规模基础模型相同的步骤。您的小规模 LLM 可以在普通笔记本电脑上开发，您可以将其用作自己的个人助理。

关于本书

Build a Large Language Model （from Scratch） 是一本独一无二的指南，用于构建自己的工作 LLM。在这篇文章中，机器学习专家兼作家塞巴斯蒂安·拉施卡（Sebastian Raschka）揭示了LLM是如何在引擎盖下工作的，揭开了生成式人工智能黑匣子的盖子。本书充满了构建 LLM 的实用见解，包括构建数据加载管道、组装其内部构建块和微调技术。在此过程中，您将逐渐将基础模型转变为文本分类器工具，以及遵循对话说明的聊天机器人。

关于读者

对于了解 Python 的读者。开发机器学习模型的经验很有用，但不是必需的。

关于作者

塞巴斯蒂安·拉施卡（Sebastian Raschka）十多年来一直从事机器学习和人工智能方面的工作。Sebastian 于 2022 年加入 Lightning AI，现在专注于 AI 和 LLM 研究、开发开源软件和创建教育材料。在此之前，Sebastian曾在威斯康星大学麦迪逊分校担任统计系助理教授，专注于深度学习和机器学习研究。他对教育有着强烈的热情，最出名的是他关于使用开源软件进行机器学习的畅销书。

原文电子书购买链接：Build a Large Language Model (From Scratch) (manning.com)

源代码链接：rasbt/LLMs-from-scratch: Implementing a ChatGPT-like LLM in PyTorch from scratch, step by step (github.com)

关于本书

关于读者

关于作者

相关文章

发表评论 取消回复

发表评论取消回复