《大型语言模型实战指南》封面

内容简介

这是一本系统梳理并深入解析大模型的基础理论、算法实现、数据构造流程、模型微调方法、偏好对齐方法的著作,也是一本能手把手教你构建角色扮演、信息抽取、知识问答、AI Agent等各种强大的应用程序的著作。

本书得到了零一万物、面壁智能、通义千问、百姓AI、澜舟科技等国内主流大模型团队的负责人的高度评价和鼎力推荐。具体地,通过本书你能了解或掌握以下知识:

(1)大型语言模型的基础理论,包括常见的模型架构、领域大型语言模型以及如何评估大模型的性能。

(2)大模型微调的关键步骤:从数据的收集、清洗到筛选,直至微调训练的技术细节。

(3)大模型人类偏好对齐方法,从基于人工反馈的强化学习框架到当前主流的对齐方法。

(4)通过GPTs快速搭建个性化的专属ChatGPT应用。

(5)通过开源模型在多种场景下搭建大模型应用,包括:表格查询、角色扮演、信息抽取、知识问答、AI Agent等。

(6)掌握大模型Agent方法以及Agent常用框架。

(7)基于LangChain框架构建一个AutoGPT应用。

本书集大模型理论、实践和场景落地于一体,提供大量经详细注释的代码,方便读者理解和实操。总之,不管里是想深入研究大模型本身,还是进行大模型相关应用搭建,本书都应该能给你颇具价值的技术启发与思考,让你在大模型的路上快速前行,少走弯路。

作者简介

刘聪

资深NLP技术专家和AI技术专家,南京云问科技首席算法架构师,MLNLP(机器学习算法与自然语言处理)社区学术委员。主攻文本向量表征、问答系统、AIGC等技术方向,是大模型领域的先驱者和布道者。开源了首个中文Unilm预训练模型、中文GPT2、夸夸闲聊机器人(ChatBot)、大模型微调等项目。作为主要负责人,在多项自然语言处理比赛中获得前三名,在中文核心期刊和SCI发表多篇论文,有多项发明专利。知乎ID“刘聪NLP”,拥有公众号“NLP工作站”,撰写书籍《ChatGPT原理与实战》。

沈盛宇

资深算法工程师,南京云问网络技术有限公司算法组负责人。擅长结合用户业务场景,针对性设计知识图谱、问答、检索、多模态、AIGC等的相关算法和落地方案。在结合客户现有产品体系,推动数据中台和算法平台结合,从而提升服务质量方面,有丰富实战经验。曾获得多项国家专利,参与制定和撰写《IDP术语标准》《人工智能-智能助理能力等级评估标准》《人工智能标准化与开源研究报告》《ChatGPT原理与实战》等多项国家级人工智能标准和书籍。

李特丽

资深大模型应用专家,LangChain中文社区联合创始人,开发Langchain等多个大模型开发框架的中文网,帮助中国开发者快速学习AI开发框架,撰写书籍《LangChain入门指南》。

杜振东

资深NLP技术专家和AI技术专家,南京云问科技NLP研究院院长,国家人工智能标准委专家、AIIA 人工智能技术专家、CCF智能机器人专业组首批委员。拥有10年机器学习与文本挖掘经验,8年中文自然语言处理实战经验,参与制定6项国家人工智能总体组标准,编写书籍《会话式AI》《人工智能实践录》《ChatGPT原理与实战》等。

目录

最后修改:2024 年 11 月 17 日