小言_互联网的博客

如果你正在寻找一本关于深度学习和迁移学习的完整指南,请选这本

465人阅读  评论(0)

你可能对最近出现的似乎无穷无尽的机器学习很熟悉,但你知道如何训练机器学习模型吗?通常来说,一个给定的机器学习模型是在针对特定任务的特定数据上进行训练的。这种训练过程非常耗费资源和时间,而且由于生成的模型是针对特定任务的,因此无法发挥出模型的最大潜力。

性能非常好的神经网络往是研究人员或实践者多次微调的结果。这些训练好的模型是否能用于更广泛的任务分类呢?迁移学习涉及将现有的机器学习模型用于没有训练过的场景中。

就像人类不会抛弃之前已学到的在每次开始一个新任务时都重新开始一样,迁移学习允许一个机器学习模型将已经获取到的知识用于新任务的训练过程,以此来扩展计算和专业知识相结合的范围,并且将其用作原始模型的燃料。简单来说,迁移学习可以节省训练时间,以及扩展现有机器学习模型的可用性。对于那些需要大量数据(且这些数据暂不可用)从头训练的模型来说,迁移学习是一项宝贵的技术。

熟悉复杂的概念和实践中运用这些概念是两件非常不同的事情,近些年来,迁移学习在很多领域表现出良好的前景,是当代机器学习研究的一个非常活跃的领域。如果你正在寻找一本关于深度学习和迁移学习的完整指南(从零开始学习),那么这本书可以作为你的第一站。

Python迁移学习

使用TensorFlow和Keras实现高级深度学习和神经网络模型

迪潘简·撒卡尔(Dipanjan Sarkar) 著,张浩然 译

 

编辑推荐

1. 快速掌握知识点

本书能带你厘清机器学习和深度学习的关键基本概念,对重要的深度学习架构进行描述,卷积神经网络、深度神经网络、递归神经网络、长短时记忆神经网络以及胶囊网络都有所涉及。

2. 用实操夯实迁移学习理论

通过阅读本书,读者能够深刻理解迁移学习的相关概念,并结合相关的编程案例掌握模型冻结、模型调优、预训练模型(包括VGG模型、Inception模型和ResNet模型)等。

3. 掌握实用技能

本书集中讨论了大量现实世界中不同领域的案例和问题,例如计算机视觉、音频分析以及自然语言处理。

作为一名技术人员(如程序员)在,保持知识更新并学习如何使用相关工具和技术是很重要的。本书旨在帮助Python从业人员在他们各自的领域中使用书中的技术。本书的结构大致分为以下3个部分:

  • 深度学习基础;
  • 迁移学习精要;
  • 迁移学习案例研究。

迁移学习是一项机器学习(Machine Learning,ML)技术,是指从一系列机器学习问题的训练中获得知识,并将该知识用于训练其他相似类型的问题。

本书分为3个部分:第1部分是深度学习基础,介绍了机器学习的基础知识、深度学习的基础知识和深度学习的架构;第2部分是迁移学习精要,介绍了迁移学习的基础知识和迁移学习的威力;第3部分是迁移学习案例研究,介绍了图像识别和分类、文本文档分类、音频事件识别和分类、DeepDream算法、风格迁移、自动图像扫描生成器、图像着色等内容。
本书适合数据科学家、机器学习工程师和数据分析师阅读,也适合对机器学习和迁移学习感兴趣的读者阅读。在阅读本书之前,希望读者对机器学习和Python编程有基本的掌握。

目录

第 1部分 深度学习基础

第 1章 机器学习基础 2

1.1 什么是机器学习 3

1.1.1 机器学习的正式定义 4

1.1.2 浅层学习和深度学习 4

1.2 机器学习算法 5

1.2.1 监督学习 6

1.2.2 无监督学习 9

1.3 CRISP-DM 11

1.3.1 业务理解 12

1.3.2 数据理解 12

1.3.3 数据准备 13

1.3.4 建模 13

1.3.5 评估 13

1.3.6 部署 14

1.4 标准机器学习工作流 14

1.4.1 数据检索 15

1.4.2 数据准备 15

1.4.3 建模 16

1.4.4 模型评估和调优 17

1.4.5 部署和监控 21

1.5 探索性数据分析 22

1.6 特征提取和特征工程 29

1.7 特征选择 33

1.8 总结 34

第 2章 深度学习精要 35

2.1 什么是深度学习 35

2.2 深度学习框架 37

2.3 创建一个支持GPU的云端深度学习环境 40

2.3.1 选择一个云供应商 41

2.3.2 设置虚拟服务器 41

2.3.3 配置虚拟服务器 45

2.3.4 安装和升级深度学习依赖项 47

2.3.5 访问深度学习云环境 52

2.3.6 在深度学习环境中验证启用GPU 53

2.4 创建一个支持GPU的、健壮的内部深度学习环境 55

2.5 神经网络基础 55

2.5.1 一个简单的线性神经元 55

2.5.2 基于梯度的最优化问题 56

2.5.3 雅可比矩阵和海森矩阵 60

2.5.4 导数的链式法则 61

2.5.5 随机梯度下降法 61

2.5.6 非线性神经单元 64

2.5.7 学习一个简单的非线性单元——逻辑单元 66

2.5.8 损失函数 67

2.5.9 数据表示 68

2.5.10 多层神经网络 71

2.5.11 反向传播——训练深度神经网络 73

2.5.12 神经网络学习中的挑战 75

2.5.13 模型参数初始化 78

2.5.14 提升SGD 80

2.5.15 神经网络的过拟合和欠拟合 81

2.5.16 神经网络的超参数 84

2.6 总结 85

第3章 理解深度学习架构 86

3.1 神经网络架构 86

3.2 各种神经网络架构 88

3.2.1 多层感知机和深度神经网络 88

3.2.2 自编码神经网络 88

3.2.3 变分自编码器 89

3.2.4 生成式对抗网络 91

3.2.5 卷积神经网络 93

3.2.6 胶囊网络 103

3.2.7 递归神经网络 107

3.2.8 记忆神经网络 114

3.2.9 神经图灵机 117

3.2.10 基于注意力的神经网络模型 121

3.3 总结 122

第 2部分 迁移学习精要

第4章 迁移学习基础 124

4.1 迁移学习简介 124

4.2 迁移学习策略 127

4.3 迁移学习和深度学习 129

4.3.1 迁移学习方法论 130

4.3.2 预训练模型 131

4.3.3 应用 131

4.4 深度迁移学习类型 132

4.4.1 领域适应 132

4.4.2 领域混淆 132

4.4.3 多任务学习 133

4.4.4 一次性学习 133

4.4.5 零样本学习 134

4.5 迁移学习的挑战 134

4.5.1 负向迁移 134

4.5.2 迁移边界 135

4.6 总结 135

第5章 释放迁移学习的威力 136

5.1 迁移学习的必要性 137

5.1.1 阐述现实世界问题 137

5.1.2 构建数据集 138

5.1.3 描述方法 140

5.2 从零开始构建CNN模型 140

5.2.1 基本CNN模型 143

5.2.2 正则化的CNN模型 146

5.2.3 图像增强的CNN模型 148

5.3 使用预训练的CNN模型利用迁移学习 153

5.3.1 理解VGG-16模型 154

5.3.2 作为特征提取器的预训练CNN模型 156

5.3.3 作为特征提取器并使用图像增强的预训练CNN模型 162

5.3.4 使用微调和图像增强的预训练CNN模型 164

5.4 评估我们的深度学习模型 168

5.4.1 模型在一个样本测试图像上进行预测 168

5.4.2 将CNN模型的感知可视化 170

5.4.3 在测试数据上评估模型性能 174

5.5 总结 177

第3部分 迁移学习案例研究

第6章 图像识别和分类 180

6.1 基于深度学习的图像分类 180

6.2 基准数据集 181

6.3 最先进的深度图像分类模型 182

6.4 图像分类和迁移学习 183

6.4.1 CIFAR-10数据集 183

6.4.2 犬种鉴定数据集 189

6.5 总结 199

第7章 文本文档分类 200

7.1 文本分类 201

7.1.1 传统文本分类 201

7.1.2 BoW模型的缺点 202

7.1.3 基准数据集 203

7.2 单词表示形式 204

7.2.1 Word2vec模型 204

7.2.2 使用gensim框架的Word2vec模型 205

7.2.3 GloVe模型 208

7.3 CNN文档模型 210

7.3.1 构建一个评论情感分类器 216

7.3.2 哪些单词嵌入变化最大 220

7.3.3 迁移学习在IMDB数据集中的应用 220

7.3.4 使用Wordvec嵌入在完整的IMDB数据集上进行训练 223

7.3.5 使用CNN模型创建文档摘要 224

7.3.6 使用CNN模型进行多类别分类 228

7.3.7 文档嵌入可视化 231

7.4 总结 233

第8章 音频事件识别和分类 234

8.1 理解音频事件分类 235

8.2 音频事件的探索性分析 236

8.3 音频事件的特征工程和表示方法 245

8.4 使用迁移学习进行音频事件分类 249

8.4.1 根据基本特征构建数据集 250

8.4.2 利用迁移学习进行特征提取 251

8.4.3 构建分类模型 253

8.4.4 评估分类器的性能 257

8.5 构建一个深度学习音频事件识别器 260

8.6 总结 263

第9章 DeepDream 264

9.1 介绍 264

9.1.1 计算机视觉中的算法幻想性视错觉 265

9.1.2 可视化特征图 267

9.2 DeepDream算法 273

9.3 总结 277

第 10章 风格迁移 278

10.1 理解神经风格迁移 279

10.2 图像预处理方法 280

10.3 构建损失函数 282

10.3.1 内容损失 282

10.3.2 风格损失 283

10.3.3 总变差损失 283

10.3.4 总体损失函数 284

10.4 创建一个自定义优化器 285

10.5 风格迁移实战 286

10.6 总结 290

第 11章 自动图像扫描生成器 291

11.1 理解图像描述 292

11.2 明确目标 293

11.3 理解数据 294

11.4 构建自动图像描述系统的方法 295

11.4.1 概念方法 295

11.4.2 实际动手的方法 299

11.5 使用迁移学习的图像特征提取 301

11.6 为描述构建一个词汇表 306

11.7 构建一个图像描述数据集生成器 308

11.8 构建图像语言编码器-解码器深度学习模型 314

11.9 训练图像描述深度学习模型 316

11.10 评估图像描述深度学习模型 320

11.10.1 加载数据和模型 320

11.10.2 理解贪婪搜索和集束搜索 321

11.10.3 实现一个基于集束搜索的描述生成器 321

11.10.4 理解并实现BLEU分数 323

11.10.5 在测试数据上评估模型性能 324

11.11 自动图像描述实战 327

11.11.1 户外场景样本图像描述 329

11.11.2 流行运动样本图像描述 332

11.11.3 未来的改进空间 334

11.12 总结 334

第 12章 图像着色 335

12.1 问题陈述 336

12.2 彩色图像 336

12.2.1 颜色理论 337

12.2.2 颜色模型和颜色

空间 337

12.2.3 重审问题陈述 339

12.3 构建一个着色深度神经网络 341

12.3.1 预处理 341

12.3.2 损失函数 342

12.3.3 编码器 343

12.3.4 迁移学习——特征提取 344

12.3.5 融合层 344

12.3.6 解码器 345

12.3.7 后处理 347

12.3.8 训练和结果 348

12.4 挑战 350

12.5 进一步改进 350

12.6 总结 350


转载:https://blog.csdn.net/epubit17/article/details/109961854
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场