欢迎光临散文网 会员登陆 & 注册

这就是推荐系统:核心技术原理与企业应用

2023-09-15 23:22 作者:流浪在银河边缘的阿强  | 我要投稿

链接:https://pan.baidu.com/s/1fa5iBl28oyQrxcJPa3f_rw?pwd=3nsc 

提取码:3nsc

  内容简介系统作来热门的AI技术落地场景,已广泛应用于各行业的互联网应用,从衣食住行到娱乐消费,以及无处不在的广告,背后都系统的决策。本书贴合工系统系统的整体技术框架为切入点,深入系统中的内容理解、用户画像、召回、排序、重排等核心模块,介绍每个模块的核心技术和业界应用,并展开介冷启偏置与消偏等常见问题和解决方案。此外,还对系统领域的热门前沿技行了介绍括强化学果推断、端上智能等。
  目录第1章 系

1.系统大时代 1

1.1.系统的定义 2

1.1.系统的价值 3

1.1.系统的天时地利 4

1.1.系统架构概览 5

1.系统的核心模块 7

1.2.1 内容理解:理解和内容 7

1.2.2 用户画像:理解和刻画用户 7

1.2.3 召回:为用户初筛内容 8

1.2.4 排序:为用户内容 9

1.2.5 重排:从业务角行内容调整 10

1.2.系统质量评估体系 11

结 11

第2章 多模态时代的内容理解 13

2.1 内容标签体系建设 14

2.1.1 标签体系的作用 14

2.1.2 标签体系设计和建设 14

2.1.3 标签提取和生成 16

2.2 文本内容理解 18

2.2.1 文本分类 18

2.2.2 文本标签提取 21

2.2.3 文本聚类 22

2.2.4 文本Embing 22

2.2.5 知识图谱 26

2.3 多模态内容理解 28

2.3.1 图像分类 28

2.3.2 分类 30

2.3.3 多模态内容Embing 31

2.4 内容理系统中的应用 32

结 33

第3章 比你更了解自己的用户画像 34

3.1 初识用户画像 34

3.1.1 什么是用户画像 35

3.1.2 用户画像的作用 35

3.1.3 用户画像系统架构 36

3.2 用户画像标签体系 37

3.2.1 用户基础属性标签 37

3.2.2 用户社交属性标签 39

3.2.3 用户行为属性标签 39

3.2.4 用户兴趣标签 40

3.2.5 用户分层标签 41

3.2.6 其他常用维度标签 41

3.3 用户画像标签开发 42

3.3.1 标签的基础数据 42

3.3.2 标签计算整体流程 42

3.3.3 规则类标签 44

3.3.4 统计类标签 44

3.3.5 模型类标签 45

3.4 用户画像实践案例 46

结 51

第4章罗万象的召回环节 52

4.1 召回的基本逻辑和方 52

4.1.1 召回的重要性 52

4.1.2 召回与排序的区别 53

4.1.3 主要的召回策略与算法 54

4.2 传统召回策略 55

4.2.1 基于内容的召回 55

4.2.2 经典协同过滤召回 56

4.2.3 探索类召回 58

4.3 向量化模型召回 59

4.3.1 向量化模型召回原理 59

4.3.2 从KNN到ANN 60

4.3.3 经典向量化召回模型 62

4.4 基于用户行为序列的召回 65

4.4.1 SASRec――经典行为序列召回模型 65

4.4.2 BERT4Rec与BST――NLP技术与用户行为序列结合 66

4.4.3 MIND及其衍生――多兴趣召回模型 68

4.4.4 超长序列召回――建模用户全期兴趣 70

4.5 图Embing在召回中的应用 72

4.5.1 图Embing技术 73

4.5.2 DeepWalk――经典图Embing方法 74

4.5.3 Node2Vec――DeepWalk一步 75

4.5.4 PinSAGE――GC系统领域的工业化应用 76

4.5.5 MetaPath2Vec――异构图Embing方法 77

4.6 前瞻性召回策略与模型 79

4.6.1 TDM――模型与索引结合的艺术 79

4.6.2 对比学样本的魔法 81

4.7 召回质量评估方法 82

4.7.1 召回评估方法概述 83

4.7.2 召回率、率、F1值――基准评估指标 83

4.7.3 HR、ARHR――To评价指标 84

4.7.4 CG、DCG、nDCG――信息增益维度的评估指标 84

4.7.5 长尾覆盖评估 85

结 86

第5章 投你所好的排序环节 87

5.1 排序环节的意义和优化方向 87

5.1.1 排序环节的意义 87

5.1.2 排序环节的优化方向 88

5.2 从Embing看排序模型的 89

5.2.1 什么是Embing 90

5.2.2 Embing的产生过程 91

5.2.3 特征组合在深度排序模型中的应用 94

5.2.4 用户历史行为建模在深度排序模型中的应用 101

5.2.5 超大规模Embing在实际中的应用 107

5.系统粗排阶段及其发展历程 113

5.3.1 粗排定位与技术路线选择 114

5.3.2 粗排模型架构的演变 116

5.3.3 使用知识蒸馏粗排与精排的一致性 1

5.3.4 缓解样本选择偏差 128

5.3.5 粗排效果的评价 130

5.4 多目标排序建模 131

5.4.1 多目标排序建模的意义和挑战 131

5.4.2 多目标排序建模方法概览 132

5.4.3 多目标融合寻参 142

5.系统排序阶段的评估 142

5.5.1 排序评估的两个阶段 143

5.5.2 常用的效果评估指标 144

5.5.3 常用的系统评估指标 145

5.5.4 离线和线上效果的一致性问题 146

结 147

第6章 权衡再三重排序 148

6.1 重排序的必要性和作用 148

6.2 重排模型 150

6.2.1 重排模型建模的出发点 150

6.2.2 序列重排模型 151

6.2.3 基于强化学排模型 157

6.3 重排多样性策略 160

6.3.1 重排多样性的出发点 160

6.3.2 多样性评估指标 161

6.3.3 规则多样性打散 162

6.3.4 多样性模型策略 1

重排中的业务规则 167

结 169

第7章 如若初见冷启动 170

7.冷启动的定义与挑战 170

7.2 冷启动一般解决思路 171

7.3 新冷启动 173

7.3.1 新用户召回策略 173

7.3.2 新用户排序模型 175

7.3.3 新用户重排策略 177

7.4 新物品分发冷启动 178

7.4.1 新物品冷启动召回策略 179

7.4.2 新物品冷启动排序策略 180

7.4.3 新物品冷启动流量分配机制 181

结 184

第8系统中的魔术手 185

8.1 程 185

8.1.1 特征的理解和分类 186

8.1.2 特征挖掘维度 186

8.1.3 工程视角下的程开发 187

8.1.4 程的流程和方法 190

8.2 样本加工艺术 193

8.2.1 如何提取有效样本 193

8.2.2 负样本优化 195

8.2.3 样本迁移 197

8.2.4 其他样本优化技巧 198

8.系统实效性 198

8.3.数据实效性 199

8.3.模型实效性 1

8.3.3 在线学机制 2

8.中的偏差与消偏策略 2

8.4.偏差的缘由 3

8.4.系统常见偏差 3

8.4.3 常用的消偏技术和策略 5

结 9

第9章 系化的利器――AB实验平台 210

9.1 什么是AB实验 210

9.2 AB实验平台框架 212

9.3 AB实验分流机制&实验类型 214

9.4 AB实验效果评估 217

9.4.系统常见的AB指标 218

9.4.2 AB实验的假设检验 219

9.4.3 AB实验的流量大小 221

9.5 AB实验并不是的 221

结 225

第10系统中的前沿技术 226

10.1 强化学26

10.2 因果推断 230

10.3 端上智能 235

10.4 动态算力分配 238

10.5 增益模型 241

结 246


  "多个大规模工系统的核心研发经结 系统的基础框架、核心技术和前沿发展 亮点一:接近来自于工业化实践,内容按照系统的模块划分:内容理解、用户画像、召回、排序、重排等,其他书没有这样写的。 亮点二:内容全面系统但精炼,全书是作者根据实结,没有大面积理论讲解,只讲基础框架、核心技术和前沿发展。 亮点三:囊括当下热门前沿技术括强化学果推断、端上智能,以及ChatGPT时系统未来发展描述,对当下的技术人员很有指导意义。 亮点四:四位作者均是来自一线大厂的工程师,长期在工业界算法的相关应用研究,本书的内容融入了作算法的思考、体会及实战经验。 亮点五:此书不仅具有全局视野,体系完善,而且生动实,细节拉满。不管你是小白系统的从业者,阅读此书都会让你受益匪浅。"


这就是推荐系统:核心技术原理与企业应用的评论 (共 条)

分享到微博请遵守国家法律