《ChatGPT原理与应用开发》封面

内容简介

随着ChatGPT的出现,大语言模型的能力得到了业内外的认可,新的商业模式不断涌现,旧的设计和实现都将重构。本书主要介绍基于ChatGPT开发算法相关的应用或服务,侧重于介绍与自然语言处理相关的常见任务和应用,以及如何使用类似ChatGPT的大语言模型服务来实现以前只有算法工程师才能完成的工作。

全书共8章内容,第1章介绍与ChatGPT相关的基础知识,第2~5章分别介绍相似匹配、句词分类、文本生成和复杂推理方面的任务,第6~8章分别介绍ChatGPT的工程实践、局限与不足,以及商业应用,以帮助读者更好地构建自己的应用。

本书以实践为主,尤其注重任务的讲解和设计,但同时也对自然语言处理相关算法的基本原理和基础知识进行科普性介绍,适合所有对大语言模型感兴趣的开发者阅读。

作者简介

郝少春

某AI大语言模型公司的算法工程师,开源组织Datawhale成员;拥有7年算法和工程架构经验及丰富的项目和产品经历,涉及文本、音频、视频、图像等多种模态。

黄玉琳

上海财经大学硕士,京东算法工程师,开源组织Datawhale成员;从事智能供应链领域的算法研究及应用工作;主要研究方向为机器学习、自然语言处理、运筹优化。

易华挥

四川大学华西医院生物大数据中心的科研助理,开源组织Datawhale成员;主要研究方向为多模态表征学习及其在医学影像分析中的应用;发表顶会论文3篇。

目录

第1章 基础知识——大语言模型背后1
1.1 自然语言背景1
1.1.1 语言是智能的标志1
1.1.2 从图灵测试到ChatGPT2
1.2 语言模型基础6
1.2.1 最小语义单位Token与Embedding6
1.2.2 语言模型是怎么回事8
1.3 ChatGPT基础14
1.3.1 最强表示架构Transformer设计与演变14
1.3.2 生成语言模型GPT进化与逆袭18
1.3.3 利器强化学习RLHF流程与思想25
1.4 本章小结30
第2章 相似匹配——万物皆可Embedding31
2.1 相似匹配基础31
2.1.1 更好的Embedding表示31
2.1.2 如何度量Embedding相似度36
2.2 ChatGPT接口使用37
2.2.1 Embedding接口37
2.2.2 ChatGPT+提示词40
2.3 相关任务与应用41
2.3.1 简单问答:以问题找问题42
2.3.2 聚类任务:物以类聚也以群分50
2.3.3 推荐应用:一切都是Embedding55
2.4 本章小结64
第3章 句词分类——句子Token都是类别65
3.1 句词分类基础65
3.1.1 如何对一句话进行分类68
3.1.2 从句子分类到Token分类71
3.2 ChatGPT接口使用72
3.2.1 基础版GPT续写72
3.2.2 进阶版ChatGPT指令77
3.3 相关任务与应用82
3.3.1 文档问答:给定文档问问题82
3.3.2 模型微调:满足个性化需要94
3.3.3 智能对话:大语言模型=自主控制的机器人106
3.4 本章小结117
第4章 文本生成——超越理解更智能119
4.1 文本生成任务基础119
4.2 文本摘要121
4.2.1 什么是文本摘要121
4.2.2 常见的文本摘要技术121
4.2.3 基于OpenAI接口的文本摘要实验123
4.3 文本纠错131
4.3.1 什么是文本纠错131
4.3.2 常见的文本纠错技术132
4.3.3 基于OpenAI接口的文本纠错实验135
4.4 机器翻译136
4.4.1 什么是机器翻译136
4.4.2 常见的机器翻译技术137
4.4.3 基于OpenAI接口的机器翻译实验138
4.5 本章小结144
第5章 复杂推理——更加像人一样思考145
5.1 什么是复杂推理145
5.2 复杂推理能力的激活和改善147
5.2.1 初步评估ChatGPT的推理能力147
5.2.2 复杂推理能力的激活150
5.2.3 大语言模型复杂推理能力的改善156
5.3 大语言模型复杂推理能力的探讨168
5.4 本章小结170
第6章 工程实践——真实场景大不同172
6.1 评测:决定是否上线的标准172
6.1.1 为什么评测172
6.1.2 NLU常用评测指标173
6.1.3 NLG常用评测指标175
6.2 安全:必须认真对待的话题178
6.2.1 前/后处理178
6.2.2 提示词179
6.2.3 可控文本生成179
6.3 网络:接口调用并不总是成功180
6.3.1 失败181
6.3.2 延迟182
6.3.3 扩展183
6.4 本章小结185
第7章 局限与不足——工具不是万能的186
7.1 事实性错误186
7.1.1 错误示例186
7.1.2 原因分析188
7.1.3 解决方法189
7.2 实时更新190
7.2.1 问题示例190
7.2.2 原因分析191
7.2.3 解决方法192
7.3 性能瓶颈193
7.3.1 背景描述193
7.3.2 原因分析193
7.3.3 解决方法194
7.4 本章小结194
第8章 商业应用——LLM是星辰大海196
8.1 相关背景196
8.2 影响分析197
8.3 商业赋能198
8.4 本章小结204
······

最后修改:2024 年 08 月 13 日